【智能模式】【流程圖模式】如何采集詳情頁的鏈接
摘要:本文主要講解如何采集到詳情頁的鏈接。 免費下載軟件
在數據采集的時候,經常會需要采集詳情頁鏈接。本文通過三種方式來講解如何利用我們后羿采集器的智能模式采集到詳情頁的鏈接,流程圖模式同理。
方法一:通過自動識別獲取
后羿采集器的智能模式會自動識別列表,一般網站在識別到列表的同時,就會將詳情頁的鏈接一并識別出來。
【溫馨提示】如果自動識別不準確,也可以用手動點選的方式進行列表識別。
點此深入了解如何識別列表
方法二:通過深入采集獲取
在軟件的列表識別過程中,有時候會遇到無法識別到詳情頁鏈接的情況。這時候我們就能用深入采集功能進入詳情頁,采集詳情頁的鏈接。
1.在識別到列表后,我們用添加字段功能,識別到帶詳情頁鏈接的數據。軟件會自動生成字段。
【溫馨提示】帶鏈接的數據一般是文章的標題,或者商品名等,如果無法確認可以在瀏覽器上操作確認一下。
2.右鍵生成的字段,設置“取值屬性”,選擇“提取鏈接地址”。
3.點擊“深入采集”,進入詳情頁。
點此深入了解如何深入采集
4.在進入詳情頁之后,我們可以任意添加一個字段,然后右鍵生成的字段,設置“改為特殊字段”,選擇“當前頁URL”。這樣我們就能拿到詳情頁的鏈接了。
方法三:拼接出詳情頁的鏈接
如果以上方法都無法順利的采集到詳情頁的鏈接,而利用xpath或者正則可以提取到詳情頁ID的情況,可以利用數據處理拼接出詳情頁的鏈接。
【溫馨提示】如果不會XPath或者正則表達式,請直接聯系我們的定制客服進行定制。定制客服微信號:houyidingzhi
右鍵字段,設置”數據處理”,如圖所示新建”添加前綴”。
這樣我們就能拿到詳情頁鏈接了。