Office Document OCR Test

測試文件說明

這是一個用於測試 Tool_OCR 系統 Office 文件支援功能的測試文件。

本系統現已支援以下 Office 格式:

處理流程

Office 文件的處理流程如下:

  1. 使用 LibreOffice 將 Office 文件轉換為 PDF
  2. 將 PDF 轉換為圖片(每頁一張)
  3. 使用 PaddleOCR 處理每張圖片
  4. 合併所有頁面的 OCR 結果

測試數據表格

格式 副檔名 支援狀態
Word 新版 .docx ✓ 支援
Word 舊版 .doc ✓ 支援
PowerPoint 新版 .pptx ✓ 支援
PowerPoint 舊版 .ppt ✓ 支援

中英混合測試

This is a test for mixed Chinese and English OCR recognition.

測試中英文混合識別能力:1234567890

特殊字符測試

符號測試:!@#$%^&*()_+-=[]{}|;:',.<>?/

數學符號:± × ÷ √ ∞ ≈ ≠ ≤ ≥