Java/Scala 與 Python 數據交換庫

資料工具

這是一個開源庫,旨在利用 Apache Arrow 實現 Java/Scala 和 Python 之間高效數據交換,提升通訊效率。

此 GitHub 開源專案「pyjava」是一個 Python 庫,致力於實現 Java/Scala 與 Python 之間的數據交換能力。它引入 Apache Arrow 作為數據交換格式,避免傳統序列化和反序列化過程,從而大幅提升通訊效率。當您在 Java/Scala 端調用 Python 代碼時,PyJava 會自動啟動 Python worker,將數據發送給 worker 處理後返回結果,且 worker 默認可重用。專案初始代碼源自 Apache Spark,支持在 Spark 環境中使用 Python 代碼片段處理數據,適用於需要跨語言數據交換的大數據或 AI 開發場景。

Stars49
Forks14
語言Python
分類資料工具
標籤
pythonjavascalaapache-arrowdata-exchange