Tensorflow 解释说,模型可以保存为三种文件格式:.ckpt 或 .hdf5 或 .pb。有很多文档,因此最好对何时使用哪种文件格式进行更简单的比较。
这是我目前的理解:
卡普特
从https://www.tensorflow.org/guide/checkpoint:
检查点捕获模型使用的所有参数(tf.Variable 对象)的确切值。检查点不包含模型定义的计算的任何描述,因此通常仅在将使用保存的参数值的源代码可用时才有用。
因此,当您知道源代码相同时,您似乎应该在训练期间使用 cpkt 进行检查点检查。为什么推荐超过 .pb 和 .hdf5?它节省空间吗?它是否包含其他文件格式不包含的数据?
铅
同样来自https://www.tensorflow.org/guide/checkpoint:
另一方面,SavedModel 格式除了参数值(检查点)之外还包括模型定义的计算的序列化描述。这种格式的模型独立于创建模型的源代码。因此,它们适合通过 TensorFlow Serving、TensorFlow Lite、TensorFlow.js 或其他编程语言(C、C++、Java、Go、Rust、C# 等 TensorFlow API)的程序进行部署。
SavedModel 格式是 .pb 加上一些元数据。那么在部署模型时应该保存在 .pb 中吗?
HDF5
仅在保存模型权重(数字矩阵)时使用?
我已经将我的私人回购打包成一个轮子。有不同版本的轮子。是否可以从命令行使用 pip 和通过 requirements.txt 文件安装特定轮版本的 repo?据我所知,pip 文档中没有提到此功能。
我可以使用 Github 令牌从私有存储库安装 pip 包,没有问题。
pip install git+https://$GITHUB_TOKEN@github.com/[username]/[reponame].git
我还可以安装带有特定提交的私有 pip 包:
pip install git+https://$GITHUB_TOKEN@github.com/[username]/[reponame].git@[commit_sha]
python ×2
amazon-vpc ×1
aws-lambda ×1
ckpt ×1
git ×1
github ×1
hdf5 ×1
python-wheel ×1
tensorflow ×1