Cygwin なんでも掲示板

一覧最新記事過去一覧 | 検索FAQアンテナHOME
(新規投稿・発言はできません)

No.905  Re[2]:wget で再帰回収
発言者: shige
発言日: 2003 01/08 16:59
 
なさん、ご回答いただきまして、ありがとうございます。

-L には、follow relative links only とありますが、英語をそのままの意味で理解するなら、相対リンクのみをたどる、となりますが、この理解に誤りがあるのでしょうか? 浅学のため、動作しない理由がわかりかねます。なさんがご存知の、follow relative links only 以上の、再帰回収ができない理由、もしくは、もうちょっとヒントを教えていただけますでしょうか。

先にも書いたとおり、とあるサイトのデータ (の一部) を再帰的に取得したいので、そこから、外部に張られているリンク (相対リンクではない絶対リンク) をたどって欲しくないという意味で、-L を追加したものです。

ちなみに、Wget を使おう的ページ (http://www.geocities.jp/horiuchimasaru/wget.html) では、応用として、

wget -r -L -l 10 http://seagull.cs.uec.ac.jp/~horiuc-m/index.html

http://seagull....を再帰回収(-r)で相対リンクだけ(-L)をたどり 深さ10まで(-l 10)でダウンロードする。 HTTP(ホームページ)の場合はこの使い方が一般的。

として、私とまったく同じ引数並びで紹介されています。

strings /usr/bin/wget.exe | grep robot の結果は、なさんと同じでした。おそらく、自分で、robot まわりの関数をすべて削って改造した wget に対して string をとったのかもしれません。
少なくとも、md5 hash が異なっていますから。


▼関連発言

871:wget で再帰回収 [shige] 12/26
 └872:Re:wget で再帰回収 [な] 12/26
  └905:Re[2]:wget で再帰回収 [shige] 01/08
   └906:Re[3]:wget で再帰回収 [な] 01/08 <

Pass 保存

早田のホームページへ
CGIROOM