質譜數據處理與光譜相似性計算 Python 庫

資料工具

開源 Python 套件,用於導入、處理和比較質譜數據,支持多種光譜格式與自定義相似性度量。

此 GitHub 開源專案 matchms 是一個 Python 套件,專為處理串聯質譜數據而設計。它提供工具用於導入、處理、清理和比較質譜數據,支持常見的光譜數據格式如 mzML、mzXML、msp 和 MGF。套件包括元數據清理、驗證和基本峰值過濾功能,確保數據準確性與完整性。一個關鍵特點是能夠應用各種成對相似性度量進行大規模光譜比較,包括常見的 Cosine 分數、基於分子指紋的比較以及其他元數據相關評估。matchms 具有高度可擴展性,允許用戶集成自定義相似性度量,例如 Spec2Vec 和 MS2DeepScore。此外,它使用更高效的相似性度量進行初始預選,並支持將結果存儲為稀疏數據格式,從而能夠比較數十萬個光譜。README 說明此專案適用於代謝組學研究、光譜數據分析和生物信息學應用。

Stars259
Forks81
語言Python
分類資料工具
標籤
mass-spectrometrymetabolomicspythonsimilarity-measuresspectral-analysisfuzzy-matching
GitHub Topics
analysisfuzzy-matchingfuzzy-searchmass-spectrometrymetabolomicspython3similarity-measures