TensorRT 3.0 obsługuje import/konwersję wykresów TensorFlow poprzez jego UFF (uniwersalny format ramowy). Brakuje niektórych implementacji warstw i będą wymagać niestandardowych implementacji za pośrednictwem interfejsu IPlugin.
Poprzednie wersje nie obsługiwały natywnego importu modeli/punktów kontrolnych TensorFlow.
Możesz także wyeksportować opis warstw/sieci do swojego własnego formatu pośredniego (np. Pliku tekstowego), a następnie użyć interfejsu API TensorRT C++ do skonstruowania wykresu dla wnioskowania. Musiałbyś oddzielnie wyeksportować wagi/błędy splotu. Pamiętaj, aby zwracać uwagę na format wagi - TensorFlow używa NHWC, podczas gdy TensorRT używa NCHW. W przypadku wag, TF używa RSCK ([filter_height, filter_width, input_depth, output_depth]), a TensorRT używa KCRS.
Zobacz ten papier na dłuższy dyskusji formatach tensorowych: https://arxiv.org/abs/1410.0759
Również ten link ma przydatnych istotne informacje: https://www.tensorflow.org/versions/master/extend/tool_developers/