PageIndex:無向量、基於推理的文件索引系統

RAG / 搜尋增強

一個摒棄傳統向量資料庫,透過層次樹狀索引和大型語言模型推理,實現精準上下文感知文件檢索的 RAG 系統。

此 GitHub 開源專案 PageIndex 是一個創新的檢索增強生成(RAG)系統,專為長篇專業文件設計。它摒棄傳統的向量資料庫和文本分塊方法,透過構建層次化的樹狀索引,並結合大型語言模型(LLM)的推理能力,實現上下文感知的文件檢索。系統模仿人類專家的導航邏輯,提供可追蹤和可解釋的檢索路徑,有效解決相似性與相關性的偏差問題。專案支援多種介面,包括聊天平台、MCP 和 API,便於開發者自托管或集成,適用於知識管理、學術研究等場景。

Stars33,025
Forks2,871
語言Python
分類RAG / 搜尋增強
標籤
ragretrieval-augmented-generationreasoningllmvectorlessagentic-aiinformation-retrieval
GitHub Topics
agentic-aiagentsaiai-agentscontext-engineeringinformation-retrievalllmragreasoningretrievalretrieval-augmented-generationvector-database