Commit Graph

4 Commits

Author SHA1 Message Date
donald
7719919dc7 Add advanced crawler module design to SDD v1.3
新增第 4.1.5 節:進階爬蟲模組設計

主要內容:
- Scrapy 框架整合規格(擴充新聞來源用)
- 通用爬蟲架構設計原則
- 多層級選擇器備用機制
- Pipeline 資料處理管線(CSV + Database)
- 資料庫表結構(articles, tags, article_tags)
- 錯誤處理與效能最佳化
- 執行測試與除錯技巧
- 新增新聞來源的標準步驟

技術規格:
- Scrapy >= 2.11.0
- PyMySQL >= 1.1.0
- python-dateutil >= 2.8.2
- 支援多來源整合(source 欄位)
- Context Manager 確保交易完整性
- 標籤快取機制提升效能

這個設計可作為擴充其他新聞來源的通用範本。

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-04 11:07:37 +08:00
donald
293aeca5f8 Update SDD to version 1.3
版本更新摘要:
- 文件版本升級至 1.3 (2024-12-04)
- 技術架構現代化更新
- 套件版本更新以支援 Python 3.13
- 新增詳細的版本更新記錄

主要變更:
- 前端:改為輕量化實作(HTML + Vanilla JS)
- 後端:支援 Python 3.13,SQLAlchemy 2.0+
- 爬蟲:httpx + BeautifulSoup4 取代 Scrapy
- 排程:APScheduler 取代 Celery
- 安全:更新認證與加密套件版本
- PDF:WeasyPrint 67.0+ 支援繁中字型
- 新增:Gitea 版本控制系統資訊

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-04 00:52:15 +08:00
donald
6e5c06b984 Cleanup and dependency fixes
- Removed redundant documentation files
- Fixed Python dependencies for .venv environment
- Upgraded packages for Python 3.13 compatibility
- Updated Claude Code settings

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-04 00:46:02 +08:00
donald
db0f0bbfe7 Initial commit: Daily News App
企業內部新聞彙整與分析系統
- 自動新聞抓取 (Digitimes, 經濟日報, 工商時報)
- AI 智慧摘要 (OpenAI/Claude/Ollama)
- 群組管理與訂閱通知
- 已清理 Python 快取檔案

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-12-03 23:53:24 +08:00