我已经问过 AI 了,已经把 onnx 模型进行了剪枝,进行了 int8 动态量化,开启了 cpu 多线程推理,速度由原来的 3s 优化到现在的 1.3s ,感觉到极限了,可是老板的要求是 500ms ,大佬快救救孩子