求推荐 AI 图片分类的现成服务

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

HexHub

HexHub，一站式SSH、Docker、数据库连接管理工具，支持多种主流数据库、多窗口分屏、智能SQL编辑、极速数据处理、批量命令、云端同步，支持SSH跳板机、命令广播、历史命令、SFTP多端文件互传。

去下载

Promoted by xiwh

PRO

这是一个创建于 436 天前的主题，其中的信息可能已经有所发展或是发生改变。

手头有大量图片，以及一些分类标签的名单列表，需要根据图片找到对应的标签。比如输入图片 1 ，期望得出标签:风景，夜晚。

我试了一下某大厂的，不能用我提供的标签去分，而是它自己的标签，比如我期望的是“人物，女性”，然而它给出的是“眼睛，鼻子，咖啡”

分类

标签

20 条回复 • 2024-09-25 09:22:42 +08:00

abelyao

2024-05-27 16:06:38 +08:00

反过来想，输入图片，问它内容是否为“风景”，是的话你就打上标签“风景”咯，以此类推

forty

2024-05-27 16:09:40 +08:00

如果有几百个基本标签，那 1 个图片得问上几百次？还是说有支持 1 次问全部的？不知道哪家的 api 支持

mumbler

2024-05-27 16:16:04 +08:00

你先给每个标签准备一个标准图片，计算出向量，然后新图片也计算向量，相似度排序看与哪个标签的标准图片最接近，就先粗分到这个标签下，然后用大模型询问复核一下是否与这个标签匹配

safilar

2024-05-27 16:42:18 +08:00

@mumbler 你这个方法是不错，有实践过么

jimrok

2024-05-27 16:46:50 +08:00

这个不是做一个微调就行了吗，你用 restnet 50 的模型，改一下分类，载入原来的权重，重新训练一下就行了。问一下 gpt4 ，马上给你一套代码。

lizhisty

2024-05-27 16:50:08 +08:00

@jimrok 老哥 restnet 50 是什么

rming

2024-05-27 17:04:50 +08:00

用 yolo 微调下

mightybruce

2024-05-27 17:19:20 +08:00

这个图片分类属于计算机视觉的经典任务。
常见的有好几种方案
第一种，图片元数据信息尤其是 exif 信息，可以直接利用来打上标签，然后就用这个做文本做索引查找，

第二种，这个属于少量自己训练的计算机视觉任务，叫做 image classification

如果你一点都不懂 AI, 不建议自己训练，百度飞浆可以看看，easydl 提供了这些
https://ai.baidu.com/easydl/vision/

第一步需要你把图片做分类，并完成标注，这个手动的话要耗费很多时间的

自动标注最好借助一些平台来做

第二步选取训练集，做有监督的训练学习

第三步用剩下的测试集测试效果

jimrok

2024-05-27 17:22:15 +08:00

@lizhisty 残差网络，多打了一个 t ，resnet ，何凯明在微软研究院搞出来的图像分类模型，曾经的 imgnet 的冠军。

jimrok

2024-05-27 17:26:49 +08:00

图像识别已经是深度学习非常成熟的领域，一般都不建议重新训练一个模型，现有的模型选一个速度和准确率都能接受的模型，做一个微调就行，因为现有的模型对图片的纹理特征都完成了比较好的训练，只需要基于现有的权重，重新训练，就能得到特定领域的模型。