2010-07-21-1
Web サイトを再帰的に取得してみた[UNIX] 最近のサイトは昔より複雑になっているので、意外に大変ですねえ。。ここは静的なページで構成されているので、サクッと取得出来ました。% wget -r -l 1 -k -p http://... は再帰的に取得、-l num は取得する階層の深さです。-k はリンクをローカルコピー間の相対リンクに変換し、-p は画像やそのほかの補助ファイルもダウンロードしてページを完全構築します。次に http://... を試しましたが、ちょっと無理ですねえ。やり方あるんでしょうか。GetHTMLW でも出来ませんでした。そういえば、ダイヤルアップ時代には波乗野郎をよく使ってました。懐かしいなあ。参考情報: ITmedia Biz.ID:Wgetでオンライン保管資料をローカルコピー追記20100722:Firefox アドオン ScrapBook を教えてもらいました。GetHTMLW よりは良い感じです。
<<