📚 HBR Taiwan 文章爬蟲系統
🔄 重新整理
🚀 執行爬蟲
📊 儀表板
⚙️ 爬蟲設定
📊 統計資訊
文章總數
-
付費文章
-
免費文章
-
分類數量
-
分類分布
作者統計(Top 10)
🔍 文章查詢
關鍵字
分類
全部
標籤
開始日期
結束日期
付費狀態
全部
免費
付費
🔍 搜尋
🔄 重置
📄 文章列表
載入中...
⚙️ 爬蟲設定
起始 URL 設定
➕ 新增 URL
爬取設定
下載延遲(秒)
建議值:1-3 秒(保守模式)
最大深度
爬取的最大深度層級
並發請求數
同時進行的請求數量
內容過濾設定
跳過付費文章內容
僅標記為付費,不爬取內容
追蹤分頁連結
自動追蹤「下一頁」連結
遵守 robots.txt
遵守網站的 robots.txt 規則
CSS 選擇器設定(進階)
文章列表選擇器
用於識別文章列表的 CSS 選擇器(已優化為 HBR Taiwan 實際結構)
標題選擇器
用於提取文章標題的 CSS 選擇器(已優化為 HBR Taiwan 實際結構)
作者選擇器
用於提取作者的 CSS 選擇器(已優化為 HBR Taiwan 實際結構)
內容選擇器
用於提取文章內容的 CSS 選擇器(已優化為 HBR Taiwan 實際結構)
💾 儲存設定
📂 載入設定
🔄 重置為預設值
🧪 測試設定
×