在 EMR 笔记本上安装 python 包时出现致命错误:Python.h:没有这样的文件或目录

And*_*rey 5 python pip amazon-emr pyspark

我需要ahocorasick在 EMR 笔记本上安装软件包。

但是当我打电话时:

sc.install_pypi_package("pyahocorasick")
Run Code Online (Sandbox Code Playgroud)

我收到错误:

common.h:15:10: fatal error: Python.h: No such file or directory

   #include <Python.h>

            ^~~~~~~~~~

  compilation terminated.

  error: command 'gcc' failed with exit status 1
Run Code Online (Sandbox Code Playgroud)

pandas安装没有任何问题。

作为引导操作安装时,我遇到类似的错误。

如果我打电话:

%pip install pyahocorasick
Run Code Online (Sandbox Code Playgroud)

它安装得很好,但我无法导入它。

我尝试了这种方法:致命错误:Python.h:没有这样的文件或目录,python-Levenshtein install

但我找不到任何sudo从笔记本运行的方法。

编辑:

我尝试gcc在 bootstrap 阶段安装以下.sh文件:

sudo yum -y install gcc
sudo yum -y install python3-devel
sudo pip3 install pyahocorasick --user
Run Code Online (Sandbox Code Playgroud)

这没有帮助 - 我在通话时仍然收到错误import ahocorasick