日本搞逼视频_黄色一级片免费在线观看_色99久久_性明星video另类hd_欧美77_综合在线视频

國內最全IT社區平臺 聯系我們 | 收藏本站
阿里云優惠2
您當前位置:首頁 > php開源 > DedeCMS > DedeCMS 文章采集入門圖文教程(推薦)

DedeCMS 文章采集入門圖文教程(推薦)

來源:程序員人生   發布時間:2014-06-12 02:31:43 閱讀次數:3973次

以織夢官方站為例,我們采集站長學院下的PHP教程欄目,打開列表地址http://www.dedecms.com/web-art/PHP_jiaocheng。 登錄后臺,進入“采集節點管理”,新建一個節點,選擇內容模型為“普通文章”。

1.設置節點基本信息

先填寫一個方便記憶的節點名稱,選擇目標頁面編碼為GB2312,防盜鏈模式不做設置,因目標站沒做限制,這一項就不做修改,系統默認超時時間10秒。

2.設置列表網址獲取規則 

 這一步我們要做些設置,獲取文章列表地址,回到目標站列表頁,觀察分頁間的變化,可以發現只有“14_”后的數字有規律的遞增變化。

首頁:http://www.dedecms.com/web-art/PHP_jiaocheng/list_14_1.html
中間:http://www.dedecms.com/web-art/PHP_jiaocheng/list_14_(*).html
末頁:http://www.dedecms.com/web-art/PHP_jiaocheng/list_14_172.html 

復制一個分頁地址,回到“新增采集節點”頁面,選擇“來源屬性”為“批量生成列表網址”,把粘貼地址到“匹配網址”中,修改規律變化處為(*),“批量生成地址設置”處(*)輸入1到172,這里的意思是生成出列表第一頁到最后172頁的所有地址。

測試一下,在彈出框中我們可以看到循環出172條地址記錄,很順利的就設置好了。有時候會碰到較難獲取的列表,那我們可以把把沒規律的地址復制到”手工指定列表網址“文本框中來采集。

3.設置文章網址匹配規則 

上面指定好了文章地址來源頁,這一步就需要在這些頁面中找出符合要求的文章地址頁了。打開一個列表頁面觀察,左欄的方框中包含了我們需要的全部地址,這種情況區分明顯的頁面,可以利“區域開始的HTML”和“區域結束的HTMLL”設置進行過濾。

不過也可以使用其他方法。把鼠標移到各處鏈接地址,觀察瀏覽器左下角顯示的完整地址,我們需要的地址都包含“PHP_jiaocheng/20”,那我們把它填寫到“必須包含”中。

兩種方法都能夠過濾出地址,碰上復雜頁面,可以配合起來使用,加上正則,幾乎沒有篩選不出的地址,附(圖5.1)對照。最后確定,進入下一步“網頁內容獲取規則”。

 
(圖5.1)

生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關閉
程序員人生
主站蜘蛛池模板: 一级毛片在线 | 在线观看国产精品视频 | 91精品国产综合久久国产大片 | 日韩视频在线一区 | 男女上床网站 | 亚洲欧美一区二区三区国产精品 | 91久久精品一区二区别 | 精品乱人伦一区二区三区 | 久久久久久久久久国产精品 | 中文字幕在线一区观看 | 在线观看av网 | 国产精品大片 | 国产一区二区在线播放 | 中文字幕一区二区三区四区不卡 | 亚洲精品乱码久久久久久 | 99福利| 国内精品久久久久久久影视简单 | 久久久www成人免费精品张筱雨 | 四色永久访问 | 黄色大片免费看 | rbd奴隷色のステージ2 | 中文字幕黄色 | 国产伦精品一区二区三区在线 | 免费黄色三级 | 国产激情在线视频 | 亚洲人免费视频 | 久久久久一区二区 | 国产一级黄色电影 | 99九九久久| 成人动漫一区二区三区 | av亚洲在线 | 亚洲国产欧美日韩 | 日韩免费不卡视频 | 秋霞电影院午夜仑片 | 一级做a爱片性色毛片www | 欧美一级久久久 | 天天爽一爽 | 国产免费大片 | 中文字幕在线亚洲 | 午夜日韩免费视频 | 午夜激情在线观看 |