怎样加快 onnx 模型在 cpu 上的推理速度啊

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

我已经问过 AI 了，已经把 onnx 模型进行了剪枝，进行了 int8 动态量化，开启了 cpu 多线程推理，速度由原来的 3s 优化到现在的 1.3s ，感觉到极限了，可是老板的要求是 500ms ，大佬快救救孩子

2 条回复

gargar

15 小时 41 分钟前

让老板出钱换更好的 CPU 、GPU

ns2250225

15 小时 21 分钟前 via Android

@gargar 哈哈哈，这样老板要换掉我了