如何在 Azure Synapse 的 Apache Spark 池中安装 Python 包

发布: 1个月前 (2026年1月7日 GMT+8 05:58)

3 分钟阅读

Source: Dev.to

在 Azure Synapse 中为 Apache Spark 池安装 Python 包的封面图片

高效地在 Azure Synapse Analytics 中安装 Python 包

在 Azure Synapse 笔记本中，你可以在代码单元里使用 %pip 命令（例如 %pip install pandas）来安装包。但这种方式是临时的：该包仅在当前笔记本会话中可用，每次会话启动时都必须重新安装。频繁的重新安装会导致笔记本执行出现显著延迟，效率低下。

更持久且高效的做法是直接在 Apache Spark 池上安装包。这样可以确保库预先安装，并在每个附加到该池的会话中自动可用。

此方法需要上传一个 requirements.txt 文件，文件中列出所需的包及其版本。

Spark 池包安装 UI 界面

Spark 池会更新并自动安装指定的包，过程可能需要几分钟。完成后，所有附加到该池的笔记本默认即可使用这些库。

requirements.txt 是一个简单的文本文件，列出要安装的包。你可以在本地 Python 环境中轻松生成该文件。

pip freeze > requirements.txt

该命令会把当前环境中所有包及其精确版本写入名为 requirements.txt 的文件。将此文件上传到 Synapse，即可确保在 Synapse 环境中安装完全相同的包版本，从而保持一致性并避免依赖冲突。