-
修改run.ini,,添加下面兩條,第一條默認(rèn)是采集更新列表的,,第二條是指定小說(shuō)編號(hào),現(xiàn)在的設(shè)置是從1到66542,,可以根據(jù)自己的想法設(shè)置
-rule hk020.com.xml -ca
-rule hk020.com.xml -c 1-66542
-
修改start.sh(windows是start.bat)
默認(rèn)的java -jar spider.jar -ca & 改成 java -jar spider.jar -m &
重啟采集器就可以啦,,這樣就可以最快的從一個(gè)網(wǎng)站把數(shù)據(jù)都抓過(guò)來(lái)啦!
等把對(duì)方站的數(shù)據(jù)采集的差不多了,,就可以把-rule hk020.com.xml -c 1-66542 去掉啦,,用更新列表就可以啦!