這里先感謝下易優(yōu)用戶富貴分享的采集方法
易優(yōu)火車頭接口文件下載:
鏈接: https://pan.baidu.com/s/1FSHKA5_7ZzDRb0TIpjTM-Q 提取碼: s6r4
下面來自用戶富貴的分享筆記
總結(jié):
1、第一步
例如采集文章內(nèi)容,先要采集對方的文章列表,把所有鏈接遍歷出來,這樣才能順著鏈接拿內(nèi)容,淡然第一步可以拿到對方列表的內(nèi)容,比如標題,縮略圖,tag標簽等等,如果只能在第一步拿的就要寫規(guī)則,比如縮略圖,就需要。
2、第一步重點:
規(guī)則最后的空格需要刪除,其次其他多余的空格可以用(*)代替,實際鏈接如果是相對地址,則需要在實際鏈接欄填完整http://www.baidu.com[參數(shù)1],如果是絕對地址則直接填[參數(shù)1]
3、第二步:
標簽根據(jù)
網(wǎng)站模板結(jié)構(gòu)填需要的內(nèi)容,這個意思就是你自己定義,因為每個網(wǎng)站不同,需要的東西不同。剛開軟件添加規(guī)則時先刪除,也可以等第一步報錯的時候再來刪。
導入規(guī)則里面的是因為規(guī)則里面寫好了需要哪些標簽,只要根據(jù)這些標簽填相應的內(nèi)容,
這些就是發(fā)布規(guī)則里寫好的。當然eyou有些標簽會自動提取,比如SEO描述。。。。就可以刪了。
4、第二部重點:先看清縷清自己網(wǎng)站需要的東西,然后需要什么加什么
5、第三步:
順序是先勾選啟用》web發(fā)布配置管理》按順序走》添加發(fā)布配置
Tips:發(fā)布方式可以采用亂序發(fā)布,這樣避免跟原來采集網(wǎng)站的順序一樣
6、第三步重點:順序要對