Cygwin なんでも掲示板

一覧最新記事過去一覧 | 検索FAQアンテナHOME
(新規投稿・発言はできません)

No.871  wget で再帰回収
発言者: shige
発言日: 2002 12/26 11:31
 
wget で robots.txt や meta tag のロボット制御を無視させたいのですが、man wget を見た限り、設定ができないようです。

Cygwin バイナリ, tar ball からの make ともに試しましたが、オプションそのものがないように見受けられます。(strings `which wget` | grep robot)

やりたいことはいわゆる丸ごとダウンロードなのですが、目的は、Web サイトのコンテンツの圧縮ソフトを作ったので、よそ様のサイトでどれくらいの効果があるか、測定したいのです。

curl は再帰回収自体ができませんし、何か代替手段がありましたら、ご教授いただけませんでしょうか。wget 自身の改造を試みたのですが、どうもうまくいきませんでした。

というか、wget -r -L -l 10 url のように -l を指定すると私のところでは正常に再帰回収しないようなのです。バグ? MD5 は、70f0043044029bbbff271a5f5aad169d です。

アドバイスよろしくお願いいたします。


▼関連発言

871:wget で再帰回収 [shige] 12/26
 └872:Re:wget で再帰回収 [な] 12/26
  └905:Re[2]:wget で再帰回収 [shige] 01/08
   └906:Re[3]:wget で再帰回収 [な] 01/08 <

Pass 保存

早田のホームページへ
CGIROOM