工具06/19 19:06

新創公司 Subquadratic 聲稱突破 LLM 瓶頸，推出 SubQ 模型

媒體報導指出，邁阿密 AI 新創公司 Subquadratic 在上月脫離隱身模式，宣稱解決了阻礙大語言模型發展近十年的數學瓶頸。公司開發了名為 SubQ 的新型 LLM，聲稱其速度更快、成本更低，且能耗大幅減少，同時能處理多達十二倍的文本量，適用於分析整個程式碼庫或數百頁文件等數據密集任務。Subquadratic 表示，SubQ 在編碼等關鍵任務上能匹配 Google DeepMind、OpenAI 和 Anthropic 的頂尖模型。然而，最初僅提供自行發布的測試分數，導致外界質疑，甚至有評論將其比作「AI 版 Theranos」。近期，公司公佈了第三方公司 Appen 的獨立評估結果，這些結果支持了其主張。Appen 的生成式 AI 研究總監 Jeanine Sinanan-Singh 表示，這驗證了其架構，可能是遊戲規則改變者，因為模型常面臨速度和效率問題。Subquadratic 的技術核心是採用稀疏注意力取代傳統密集注意力，大幅減少計算需求。公司共同創辦人兼技術長 Alex Whedon 解釋，並非所有詞彙間關係都重要，稀疏注意力只選擇部分數字相乘，從而降低成本。儘管技術前景看好，公司仍需讓更多人實際測試 SubQ 以驗證其突破，並希望推動 LLM 建構的新時代效率。

來源：媒體報導

媒體報導A startup claims it broke through a bottleneck that’s holding back LLMs