小编Fer*_*ndo的帖子

tf.fake_quant_with_min_max_args 和 tf.fake_quant_with_min_max_vars 有什么区别

我很想了解张量流函数之间的差异

tf.fake_quant_with_min_max_args
tf.fake_quant_with_min_max_vars
Run Code Online (Sandbox Code Playgroud)

正如他们的 API 中一样,它们的描述几乎相同。我通常通过手动量化所需的节点tf.fake_quant_with_min_max_vars,尽管我不确定它是否正确。

例如,权重应该使用 吗tf.fake_quant_with_min_max_args

同样,查看 的代码quantize.Quantize,我确实明白它基本上会迭代图形,找到兼容的张量并根据 global_step 添加用于身份/量化的节点。但是,我是否应该理解并非所有操作都是量化的(例如 conv1d,尽管 conv2d 和 mat/mul 是量化的)。图书馆以后会支持所有的操作吗?

python quantization tensorflow

4
推荐指数
1
解决办法
1820
查看次数

标签 统计

python ×1

quantization ×1

tensorflow ×1