強大輕量級的 OCR 與文檔解析工具包

資料工具

將 PDF 和圖像文件轉為結構化數據，支援 100 多種語言，橋接圖像與 LLM。

此 GitHub 開源專案是一個全球領先的 OCR 與文檔 AI 引擎，旨在將 PDF 文件和圖像轉換為結構化數據。專案提供強大且輕量的工具包，支援超過 100 種語言的識別與解析，並能生成 JSON 或 Markdown 格式的輸出，方便直接整合至大型語言模型的應用流程中。其特色包括支持多種硬體平台（如 CPU、GPU、XPU、NPU）與主流作業系統，並被廣泛應用於文檔解析、關鍵資訊提取及 RAG 數據準備等場景，適用於需要處理大量非結構化文件的開發者與研究人員。

RepoPaddlePaddle/PaddleOCR

Stars⭐ 82,184

Forks10,761

語言Python

分類資料工具

標籤

GitHub Topics