Всем привет )

Этот код нужен что-бы оптимизировать модель в TensorRT и инференсить в лайве.

Важный момент: engine файлы не совместимы между системами, нужно оптимизировать под каждую систему отдельно.

Recommended pipeline

Заранее перегнать модель из фреймворка в ONNX. Для этого есть несколько функций в этом модуле. python -c "import onnx_converter; help(onnx_converter)"
Скачать эту либу и onnx файл модели на необходимое железо.
Поставить все необходимые зависимости
Указать все пути для энвов из пункта Installation
Запустить оптимизатор onnx2trt: python onnx2trt.py --help
- Для INT8 необходимо заранее создать calibration файл через onnx2trt_handmade. python -c "from onnx2trt_handmade import onnx2trt_handmade; help(onnx2trt_handmade)"
Запомнить куда сохранился итоговый engine файл.
Для инференса использовать класс InferenceTRT. python -c "from inference import InferenceTRT; help(InferenceTRT)"

Installation

Envs

CUDA_HOME: Путь до папки с кудой.
LD_LIBRARY_PATH:
- Путь до lib64 в папке с кудой.
- Путь до targets/x86_64-linux/lib/ в папке с кудой.
- Путь до lib в папке с TensorRT.

`trtexec`

Для запуска onnx2trt необходимо указывать путь до trtexec. Как правило, он хранится по пути /targets/x86_64-linux-gnu/bin/trtexec в папке с TensorRT.

`TensorRT`

Tested on version 8.2.2

`CUDA`

`PyCUDA`

Convert to ONNX

`fastai2onnx`

Конвертируем модельку из FastAI в ONNX.

Args:

fastai_path (str): Path to fastai model file.
input_shape (tuple or list): Input shape (with batch dimension).
onnx_path (str): Path to save converted model.
input_names (tuple or list): Model's input names.
output_names (tuple or list): Model's output names.

`torch2onnx`

Конвертируем модельку из PyTorch в ONNX.

Args:

model (torch.nn.Module): PyTorch model.
input_shape (tuple or list): Input shape (with batch dimension).
onnx_path (str): Path to save converted model.
input_names (tuple or list): Model's input names.
output_names (tuple or list): Model's output names.

`keras2onnx`

Конвертируем модельку из Keras в ONNX.

Args:

model (): Keras model.
input_shape (tuple or list): Input shape (with batch dimension).
onnx_path (str): Path to save converted model.

Optimize

`onnx2trt`

Самый оптимальный метод для оптимизации модельки под TensorRT. В конце конвертации выводит бенчмарки. Не поддерживает калибровку для INT8.

NB! Для каждой машины нужно конвертировать отдельно, просто перетащить файлик engine не сработает.

Args:

onnx_path (str): Path to onnx model (opset9).
engine_path (str): Path to save engine.
dtype (str or np.dtype): Model data type.
use_sparsity (bool): Use sparsity boolean.
trtexec_path (str): Path to trtexec binary.
workspace_size (int): Size of workspace in MB.

`onnx2trt_handmade`

Оптимизация модельки с использованием TensorRT Python API. Лучше всего использовать один раз для создания calibration файлика, его можно переносить между системами. И под каждую оптимизировать через trtexec.

Args:

onnx_path (str): Path to ONNX model.
engine_path (str): Path to save TensorRT engine.
dtype (str): Model data type. (fp32, fp16 or int8).
calib (trt.IInt8EntropyCalibrator2): Calibration class. Only for INT8.

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
.github/workflows		.github/workflows
src/optimize_tensorrt		src/optimize_tensorrt
.gitignore		.gitignore
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt
setup.cfg		setup.cfg
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Всем привет )

Recommended pipeline

Installation

Envs

`trtexec`

`TensorRT`

`CUDA`

`PyCUDA`

Convert to ONNX

`fastai2onnx`

Args:

`torch2onnx`

Args:

`keras2onnx`

Args:

Optimize

`onnx2trt`

Args:

`onnx2trt_handmade`

Args:

`Calibration`

License

riZZZhik/optimize_tensorrt

Folders and files

Latest commit

History

Repository files navigation

Всем привет )

Recommended pipeline

Installation

Envs

trtexec

TensorRT

CUDA

PyCUDA

Convert to ONNX

fastai2onnx

Args:

torch2onnx

Args:

keras2onnx

Args:

Optimize

onnx2trt

Args:

onnx2trt_handmade

Args:

Calibration

`trtexec`

`TensorRT`

`CUDA`

`PyCUDA`

`fastai2onnx`

`torch2onnx`

`keras2onnx`

`onnx2trt`

`onnx2trt_handmade`

`Calibration`