我試著用開源的蜘蛛去抓取頁面 儲存快照 分類儲存頁面
本地蜘蛛從hao123開始爬 目前吸收到了900多MB的快照頁面了

原帖由 skwinx 于 2010-11-30 23:29 发表
我試著用開源的蜘蛛去抓取頁面 儲存快照 分類儲存頁面
類似 web.archive.org 這樣的網站
我抓到的中文字都是亂碼 誰有這樣子的源碼? 我也來整個互聯網存檔。 ...
公益事業 讓人搭乘「時光機」回去看看以前的網頁為目的。
現有的這個蜘蛛是整個網頁一鍋端 什麽JS CSS 全部下載下來了| 欢迎光临 全球主机交流论坛 (https://loc.193.gs/) | Powered by Discuz! X3.4 |