2022-05-02から1日間の記事一覧

2022-05-02

TensorRT の EntropyCalibrator の観察

https://abemii.github.io/posts/quantization_calibration/ から移行。ディープニューラルネットワーク (DNN) の量子化は、主に、モデルの Weight と Activation を単精度浮動小数点 (FP32) から 8ビット整数 (INT8) へ変換することを指す。この変換は…

我的科技筆記

てっくぶろぐてきなやつ．でぃーぷらーにんぐとてきすとえでぃたがすき．

2022-05-02から1日間の記事一覧

TensorRT の EntropyCalibrator の観察