【流程圖模式】基本操作流程
摘要:本教程主要介紹了流程圖模式的基本操作流程。 免費下載軟件
如果您已經看完了后羿采集器流程圖模式的第一個采集案例,想必您對其已經有了初步的了解,這里我們再來詳細介紹一下流程圖模式的基本操作流程。
1、輸入正確的網址
流程圖模式對輸入網址的要求沒有智能模式那么嚴格,但是您仍然需要按照軟件的要求輸入正確的網址格式。
后羿采集器支持單網址和多網址采集,支持手動輸入網址、從本地文件導入網址及批量生成網址。
更多詳情內容,請參考以下教程:
2、預登錄
在數據采集過程中,我們有時候會遇到需要登錄才能查看內容的網頁,這時我們需要用到預登錄功能,登錄成功之后就能進行正常的數據采集。
更多詳情內容,請參考以下教程:
3、輸入驗證碼
在編輯任務過程中,如果遇到驗證碼,可以點擊右上角的輸入驗證碼功能,手動輸入驗證碼操作。
更多詳情內容,請參考以下教程:
4、網絡安全設置
在編輯任務過程中,如果遇到網頁異常的時候可以試著使用此功能,但是要注意打開此選項可能導致頁面上的某些內容無法采集(如iframe中的內容)。
5、切換瀏覽器模式
在編輯任務過程中,可以使用不同的瀏覽器模式來優化采集效果,具體使用場景需要根據實際情況來判斷。
更多詳情內容,請參考以下教程:
6、網頁點選搭建采集規則
流程圖模式支持可視化網頁點選操作,我們可以像瀏覽網頁一樣點擊相關元素,然后根據按照軟件提示進行操作,即可生成規則。
更多詳情內容,請參考以下教程:
操作流程如下圖所示:
7、設置提取字段
在流程圖模式中,我們通過使用“提取數據”組件來設置提取字段。我們可以通過提示點擊自動生成該組件或者從組件窗口中直接拖拽該組件。
更多詳情內容,請參考以下教程:
8、深入采集
如果需要采集詳情頁的信息,可以點擊頁面元素,根據軟件提示進行深入采集。
更多詳情內容,請參考以下教程:
9、采集任務的設置
在啟動采集任務之前,我們需要對采集任務進行配置,包括定時啟動、智能策略、自動導出、文件下載、加速引擎、數據去重及開發者設置。
更多詳情內容,請參考以下教程:
10、運行數據界面
啟動任務之后會跳轉到運行界面,在這個界面上我們可以看到當前任務的運行情況。
更多詳情內容,請參考以下教程:
11、查看采集結果及導出數據
在采集任務結束之后,我們可以查看采集結果并導出數據。
更多詳情內容,請參考以下教程: