Cygwin なんでも掲示板

一覧｜最新記事｜過去一覧　｜　検索｜ＦＡＱ｜アンテナ｜ＨＯＭＥ
(新規投稿・発言はできません)

No.871　 wget で再帰回収

発言者： shige 発言日： 2002 12/26 11:31

　 wget で robots.txt や meta tag のロボット制御を無視させたいのですが、man wget を見た限り、設定ができないようです。 Cygwin バイナリ, tar ball からの make ともに試しましたが、オプションそのものがないように見受けられます。(strings `which wget` | grep robot) やりたいことはいわゆる丸ごとダウンロードなのですが、目的は、Web サイトのコンテンツの圧縮ソフトを作ったので、よそ様のサイトでどれくらいの効果があるか、測定したいのです。 curl は再帰回収自体ができませんし、何か代替手段がありましたら、ご教授いただけませんでしょうか。wget 自身の改造を試みたのですが、どうもうまくいきませんでした。というか、wget -r -L -l 10 url のように -l を指定すると私のところでは正常に再帰回収しないようなのです。バグ? MD5 は、70f0043044029bbbff271a5f5aad169d です。アドバイスよろしくお願いいたします。

▼関連発言
│
└◆871:wget で再帰回収 [shige] 12/26 
　└◆872:Re:wget で再帰回収 [な] 12/26 
　　└◆905:Re[2]:wget で再帰回収 [shige] 01/08 
　　　└◆906:Re[3]:wget で再帰回収 [な] 01/08 <

早田のホームページへ CGIROOM