如何从 Heroku 上的 git 子模块自动提取最新提交?

Ani*_*nsh 6 python git heroku web-deployment

我在 Heroku ( http://www.rajcovid19.info )上托管了一个 COVID-19 报告 Web 应用程序,我从约翰霍普金斯大学 Git 存储库获取了数据。我已将存储库添加为主项目存储库的子模块,我用它来将更改推送到 Heroku。这使我能够将更新拉取到我的计算机上的 COVID-19 存储库,然后将这些更改推送到 Heroku。但是,我无法将 COVID-19 子模块的最新提交直接拉至 Heroku 应用程序。我尝试使用 GitPython,但每当我尝试提取更改时,它都会产生“无效的 Git 存储库”错误。

我目前针对此问题的工作解决方案是在我的笔记本电脑上制作一个脚本,定期检查 COVID-19 存储库是否有更改,然后将它们推送到 Heroku 应用程序。

这可行,但要求我每天至少打开一次笔记本电脑。

是否有可能以某种方式让 Heroku 自动将最新提交拉到子模块?

编辑:

根据 Heroku 的说法,该服务有一个“临时存储”: Heroku 临时存储

我认为这也可能使事情变得复杂?

至于我的 GitPython 代码不起作用,它是:

GitPython 1

GitPython 2

那是:

# Root directory for the COVID-19 Local repository root=os.getcwd()

if os. path.isdir(root+"/COVID-19"):
  root+="/COVID-19"
  repo=Repo(root) git=repo.git git. pull
else:
  root+="/COVID-19"
  os.system("git clone https://github.com/CSSEGISandData/COVID-19.git")
Run Code Online (Sandbox Code Playgroud)

这适用于我的计算机,但在 Heroku 应用程序上出现“无效的 Git Repo”错误。我做了一些调试并确保 Heroku 应用程序上的存储库路径正确,但它似乎没有帮助。

Tin*_*yen 6

https://help.heroku.com/RR520244/why-don-t-git-submodules-work-with-heroku-pipelines-review-apps-or-github-sync

git 子模块与 Heroku 不兼容,请参阅提供的链接。


你应该以不同的方式解决这个问题。

可能的方法:

1. 编写一个脚本,定期拉取数据并将它们添加到您的项目中。

git subtree pull --prefix=data --squash --message="update covid data" https://github.com/CSSEGISandData/COVID-19.git master
git push origin HEAD
Run Code Online (Sandbox Code Playgroud)

git 子树与 Heroku 兼容。对于这种方法,您需要有一个 VPS 并将脚本添加到 cron。Cron 是一个强大的工具,它允许您定义以特定时间间隔定期运行的脚本

2. 在应用程序启动时下载 zip 或 tar.gz,解压并提供数据。您将需要创建一个执行此操作的 startup.sh 脚本,最终命令将启动您的程序。就像是:

curl -L https://api.github.com/repos/CSSEGISandData/COVID-19/tarball > data.tar.gz
cd data && rm -r ./*
tar -xzvf ../data.tar.gz
cd ..
python main.py
Run Code Online (Sandbox Code Playgroud)

我推荐第二种方法。如果您希望数据版本化,建议使用第一种方法。