我目前正在做一个项目,在 python 中构建一个网络爬虫,然后将它dockerize 以便应用程序可以在任何机器上运行。我已经构建了 python 应用程序,使用 selenium 加载我正在抓取的网页。我不确定如何在 docker 中上传项目以及网络驱动程序(如 geckodriver),以便它可以运行。我是否需要使用应用程序创建一个容器,并将其链接到另一个 selenium 容器?谢谢你的帮助!
我的代码从我编译的文本文件中获取邮政编码列表,并使用这些代码在地图上的特定位置进行抓取。一旦它抓取了数据,它就会将数据附加到一个 csv 文件中。我需要它能够运行应用程序,然后将 csv 文件输出到主机。
编辑:我以前从未使用过 docker,但对它的工作原理做了一些研究。请 ELI5