LIBXSMM:針對 Intel 架構優化的矩陣運算與深度學習原語庫
資料工具一個專為 Intel CPU 指令集優化的高效能數學庫,支援密集/稀疏矩陣運算及小型卷積等深度學習原語。
此 GitHub 開源專案 LIBXSMM 是一個高度優化的 C 語言數學函式庫,專門針對 Intel 架構(包括 SSE、AVX、AVX2、AVX-512 及 AMX)設計,用於執行密集與稀疏的矩陣運算,以及如小型卷積等深度學習基本操作。其核心特色在於採用即時編譯(JIT)技術來生成高效能的計算核心,從而提供與編譯器無關的優異效能。該庫支援多種資料類型(如 FP64、FP32、bfloat16、int16、int8),並遵循「一次編譯,到處部署」的理念,無需特殊編譯器標誌即可利用硬體效能。它適用於需要極致矩陣計算效能的場景,是構建高效能深度學習與科學計算應用程式的底層基礎設施。