一大批跟计算机视觉 cv 相关的小 app 开发,有意者请跟我联系。

317 天前
 ppppppp123
实现:
OCR 系列模型-BCTR
OCR 系列模型-SAR
OCR 系列模型-SAR
OCR 系列模型-SEED
OCR 系列模型-MORAN
超分辨率系列模型-ESPCN
超分辨率系列模型-RCAN
超分辨率系列模型-MSFFRN
超分辨率系列模型-SRGAN
检测模型-FCOS
检测模型-CornerNet
Transformer 检测模型-DINO
Transformer 检测模型-UPT
检测模型-DMPR-PS
检测模型-AGNN
生成模型-DDIM
分割模型-PointNet
分割模型-PointNet++
自监督学习系列模型-MOCOV2
自监督学习系列模型-Simclr
知识蒸馏系列模型-MMRazor

针对第一个模型给一个要求,其它模型要求类似:
OCR 系列模型-BCTR
基于该模型,实现一个应用
https://github.com/FudanVI/benchmarking-chinese-text-recognition
硬件环境:一台 x86 电脑,内存>=16GB ; BM1684X 硬件
软件环境:docker
参考资料: https://tpumlir.orghttps://github.com/facebookresearch/segment-anything
要求:给出或开源相关代码,高度优化的 bmodel 、以及使用或演示方法
指标:模型性能测试,一般要能发挥到算力的 40%以上,越高越好。比如模型的 FLOPs 是 8T ,芯片算力 32T ;基本上模型时间 8T/32T * 40%秒 = 0.1 秒。分类 /检测模型一般 F16/BF16 精度,与 F32 精度掉点 0.1%以内; INT8 精度,掉点 1.5%以内。如无法达到目标要求,可以及时反馈,共同讨论解决方案。
867 次点击
所在节点    求职
2 条回复
ppppppp123
317 天前
绿色 :5oiR55qEd3jvvJpjaGVueG9maGl0
ykk
317 天前
速度和精度掉点是 tpu-mlir 和芯片带来的吧,你的需求难道是优化 tpu-mlir 的量化算法?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/951994

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX