強大輕量級的 OCR 與文檔解析工具包
資料工具將 PDF 和圖像文件轉為結構化數據,支援 100 多種語言,橋接圖像與 LLM。
此 GitHub 開源專案是一個全球領先的 OCR 與文檔 AI 引擎,旨在將 PDF 文件和圖像轉換為結構化數據。專案提供強大且輕量的工具包,支援超過 100 種語言的識別與解析,並能生成 JSON 或 Markdown 格式的輸出,方便直接整合至大型語言模型的應用流程中。其特色包括支持多種硬體平台(如 CPU、GPU、XPU、NPU)與主流作業系統,並被廣泛應用於文檔解析、關鍵資訊提取及 RAG 數據準備等場景,適用於需要處理大量非結構化文件的開發者與研究人員。