小编Pav*_*han的帖子

Jetson NX 使用 TensorRT 优化张量流模型

我正在尝试加速分段模型（unet-mobilenet-512x512）。我将我的tensorflow模型转换为具有FP16精度模式的tensorRT。而且速度比我预想的要低。在优化之前，我使用 .pb 冻结图进行推理时的速度为 7FPS。在tensorRT oprimization之后我有14FPS。

这是 Jetson NX 网站上的基准测试结果，
您可以看到，unet 256x256 分割速度为 146 FPS。我想，在最坏的情况下，我的unet512x512的速度应该慢4倍。

这是我使用 TensorRt 优化张量流保存模型的代码：

import numpy as np
from tensorflow.python.compiler.tensorrt import trt_convert as trt
import tensorflow as tf

params = trt.DEFAULT_TRT_CONVERSION_PARAMS
params = params._replace(
    max_workspace_size_bytes=(1<<32))
params = params._replace(precision_mode="FP16")
converter = tf.experimental.tensorrt.Converter(input_saved_model_dir='./model1', conversion_params=params)
converter.convert()

def my_input_fn():
  inp1 = np.random.normal(size=(1, 512, 512, 3)).astype(np.float32)
  yield [inp1]

converter.build(input_fn=my_input_fn)  # Generate corresponding TRT engines
output_saved_model_dir = "trt_graph2"
converter.save(output_saved_model_dir)  # Generated engines will be saved.


print("------------------------freezing the graph---------------------")


from tensorflow.python.framework.convert_to_constants import convert_variables_to_constants_v2

saved_model_loaded …

Run Code Online (Sandbox Code Playgroud)

tensorflow tensorrt nvidia-jetson

Pav*_*han

lucky-day

6
推荐指数

1
解决办法

2650
查看次数

标签统计

nvidia-jetson ×1

tensorflow ×1

tensorrt ×1

Jetson NX 使用 TensorRT 优化张量流模型

标签 统计

小编Pav_han的帖子

标签统计