No.905 Re[2]:wget で再帰回収 |
発言者: shige 発言日: 2003 01/08 16:59 |
なさん、ご回答いただきまして、ありがとうございます。 -L には、follow relative links only とありますが、英語をそのままの意味で理解するなら、相対リンクのみをたどる、となりますが、この理解に誤りがあるのでしょうか? 浅学のため、動作しない理由がわかりかねます。なさんがご存知の、follow relative links only 以上の、再帰回収ができない理由、もしくは、もうちょっとヒントを教えていただけますでしょうか。 先にも書いたとおり、とあるサイトのデータ (の一部) を再帰的に取得したいので、そこから、外部に張られているリンク (相対リンクではない絶対リンク) をたどって欲しくないという意味で、-L を追加したものです。 ちなみに、Wget を使おう的ページ (http://www.geocities.jp/horiuchimasaru/wget.html) では、応用として、 wget -r -L -l 10 http://seagull.cs.uec.ac.jp/~horiuc-m/index.html http://seagull....を再帰回収(-r)で相対リンクだけ(-L)をたどり 深さ10まで(-l 10)でダウンロードする。 HTTP(ホームページ)の場合はこの使い方が一般的。 として、私とまったく同じ引数並びで紹介されています。 strings /usr/bin/wget.exe | grep robot の結果は、なさんと同じでした。おそらく、自分で、robot まわりの関数をすべて削って改造した wget に対して string をとったのかもしれません。 少なくとも、md5 hash が異なっていますから。 |
▼関連発言 |