V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ns2250225
V2EX  ›  机器学习

怎样加快 onnx 模型在 cpu 上的推理速度啊

  •  
  •   ns2250225 · 1 天前 · 371 次点击

    我已经问过 AI 了,已经把 onnx 模型进行了剪枝,进行了 int8 动态量化,开启了 cpu 多线程推理,速度由原来的 3s 优化到现在的 1.3s ,感觉到极限了,可是老板的要求是 500ms ,大佬快救救孩子

    2 条回复
    gargar
        1
    gargar  
       15 小时 41 分钟前
    让老板出钱换更好的 CPU 、GPU
    ns2250225
        2
    ns2250225  
    OP
       15 小时 21 分钟前 via Android
    @gargar 哈哈哈,这样老板要换掉我了
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   782 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 21:00 · PVG 05:00 · LAX 13:00 · JFK 16:00
    ♥ Do have faith in what you're doing.