LLM API 請求壓縮代理

開發工具

本地代理工具,壓縮發送給 LLM 提供商的 API 請求,減少 token 使用以節省成本,且不影響答案質量。

此 GitHub 開源專案 llmtrim 提供一個本地代理,專門用於壓縮 LLM API 請求,以降低使用者成本。根據 README 說明,它能在請求發送前自動修剪提示、對話歷史、工具輸出和程式碼中的浪費 token,例如冗長的日誌或重複的工具定義,從而減少輸入和輸出 token 使用量;專案測量顯示平均可減少 31% 輸入和 74% 輸出 token,且不改變答案品質。專案支援任何 LLM 提供商,並可作為代理、CLI、MCP 伺服器或嵌入式函式庫(Rust、Python、Ruby、Kotlin、Swift)使用,適用於希望優化 prompt 工程和降低 API 成本的開發者。

Stars32
Forks1
語言Rust
分類開發工具
標籤
prompt-compressiontoken-optimizationproxyllmmcp
GitHub Topics
agentic-codingaianthropicclaude-codecost-reductiondeveloper-toolsllmllmopsmcpmitm-proxyopenaipromptprompt-compressionprompt-engineeringproxyrusttoken-optimization