以結果為導向的學習系統:企業級強化學習與OpenEnv和Foundry
官方公告表示,微軟在Build 2026活動上發布了一系列人工智慧工具與框架,旨在幫助企業建構以結果為導向的學習系統。這些發布包括託管代理、工具箱、Foundry IQ、記憶系統、託管計算、微調技術、前沿調整,以及一套全新的評估與優化堆疊。公告指出,這些組件共同構成一個學習系統的核心,使得人工智慧代理能夠隨著時間推移,在特定工作任務中持續改善表現,而非僅僅是一次性回答問題的聊天機器人。微軟介紹了如何使用OpenEnv和Foundry來組裝這些部分,形成一個用戶擁有的學習循環。系統支援兩種學習方式:非參數學習,通過代理優化器和SkillOpt在不改變模型權重的情況下提升性能;以及參數學習,利用ECHO技術進行模型後訓練,從而微調模型權重。官方強調,企業應先從低成本的非參數學習開始,再根據需求轉向參數學習,以建構真正屬於自己的智慧資產。此外,微軟加入了OpenEnv社區,以促進環境和評估的開放性與互操作性。整體而言,這套系統允許企業擁有一個可持續進化的學習循環,並將關鍵技術組件模組化,方便替換模型、訓練器或工具,而無需重建整個系統。
來源:官方公告