JAX 強化學習基準庫

智能體框架

基於 JAX 的強化學習庫,模仿 Stable-Baselines 功能,利用 JIT 加速,速度提升 2-3 倍。

此 GitHub 開源專案 Jax-Baseline 是一個使用 JAX 和 Flax/Haiku 函式庫的強化學習實現,旨在鏡像 Stable-Baselines 的功能。根據 README 說明,專案透過 JAX 的即時編譯(JIT)優化,提供比 PyTorch 和 TensorFlow 實現快 2-3 倍的效能。它支援多種強化學習環境,包括 Gymnasium 和 EnvPool,並實現了廣泛的算法,如基於 Q-Net 的 DQN、C51、QRDQN、IQN、FQF、SPR 和 BBF,基於 Actor-Critic 的 A2C、PPO、Truly PPO 和 SPO,以及 DPG 算法。專案提供便捷的安裝方式,使用 uv 管理虛擬環境,並詳細列出算法支援狀態,適用於強化學習研究、算法實驗和高效能 AI 代理開發。

Stars66
Forks5
語言Python
分類智能體框架
標籤
reinforcement-learningjaxflaxhaikustable-baselinespython