我的科技筆記

てっくぶろぐてきなやつ.でぃーぷらーにんぐとてきすとえでぃたがすき.

2022-05-02から1日間の記事一覧

TensorRT の EntropyCalibrator の観察

https://abemii.github.io/posts/quantization_calibration/ から移行。 ディープニューラルネットワーク (DNN) の量子化は、 主に、モデルの Weight と Activation を単精度浮動小数点 (FP32) から 8ビット整数 (INT8) へ 変換することを指す。 この変換は…