OCR/tasks.md at eff9b0bcd53fcae9a4792a7ea29a1e8b5a6ba1bc

egg eff9b0bcd5 feat: refactor dual-track architecture (Phase 1-5)

## Backend Changes
- **Service Layer Refactoring**:
  - Add ProcessingOrchestrator for unified document processing
  - Add PDFTableRenderer for table rendering extraction
  - Add PDFFontManager for font management with CJK support
  - Add MemoryPolicyEngine (73% code reduction from MemoryGuard)

- **Bug Fixes**:
  - Fix Direct Track table row span calculation
  - Fix OCR Track image path handling
  - Add cell_boxes coordinate validation
  - Filter out small decorative images
  - Add covering image detection

## Frontend Changes
- **State Management**:
  - Add TaskStore for centralized task state management
  - Add localStorage persistence for recent tasks
  - Add processing state tracking

- **Type Consolidation**:
  - Merge shared types from api.ts to apiV2.ts
  - Update imports in authStore, uploadStore, ResultsTable, SettingsPage

- **Page Integration**:
  - Integrate TaskStore in ProcessingPage and TaskDetailPage
  - Update useTaskValidation hook with cache sync

## Testing
- Direct Track: edit.pdf (3 pages, 1.281s), edit3.pdf (2 pages, 0.203s)
- Cell boxes validation: 43 valid, 0 invalid
- Table merging: 12 merged cells verified

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>

5.7 KiB

Raw Blame History

Tasks: Refactor Dual-Track Architecture

Phase 1: 修復已知 Bug (已完成)

1.1 Direct Track 表格修復 (已完成 ✓)

1.2 OCR Track 圖片路徑修復 (已完成 ✓)

1.3 Cell boxes 座標驗證 (已完成 ✓)

1.4 過濾極小裝飾圖片 (已完成 ✓)

1.5 移除覆蓋圖像 (已完成 ✓)

Phase 2: 服務層重構 (已完成)

2.1 提取 ProcessingOrchestrator (已完成 ✓)

2.2 提取 TableRenderer (已完成 ✓)

2.3 提取 FontManager (已完成 ✓)

Phase 3: 記憶體管理簡化 (已完成)

3.1 統一記憶體策略引擎 (已完成 ✓)

3.2 更新服務使用新記憶體引擎 (已完成 ✓)

Phase 4: 前端狀態管理改進

4.1 新增 TaskStore (已完成 ✓)

4.2 合併類型定義 (已完成 ✓)

Phase 5: 測試與驗證 (Direct Track 已完成)

5.1 回歸測試 (Direct Track ✓)

5.2 效能測試 (Direct Track ✓)

5.7 KiB Raw Blame History Unescape Escape

Tasks: Refactor Dual-Track Architecture

Phase 1: 修復已知 Bug (已完成)

1.1 Direct Track 表格修復 (已完成 ✓)

1.2 OCR Track 圖片路徑修復 (已完成 ✓)

1.3 Cell boxes 座標驗證 (已完成 ✓)

1.4 過濾極小裝飾圖片 (已完成 ✓)

1.5 移除覆蓋圖像 (已完成 ✓)

Phase 2: 服務層重構 (已完成)

2.1 提取 ProcessingOrchestrator (已完成 ✓)

2.2 提取 TableRenderer (已完成 ✓)

2.3 提取 FontManager (已完成 ✓)

Phase 3: 記憶體管理簡化 (已完成)

3.1 統一記憶體策略引擎 (已完成 ✓)

3.2 更新服務使用新記憶體引擎 (已完成 ✓)

Phase 4: 前端狀態管理改進

4.1 新增 TaskStore (已完成 ✓)

4.2 合併類型定義 (已完成 ✓)

Phase 5: 測試與驗證 (Direct Track 已完成)

5.1 回歸測試 (Direct Track ✓)

5.2 效能測試 (Direct Track ✓)

5.7 KiB

Raw Blame History