V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
forty
V2EX  ›  程序员

求推荐 AI 图片分类的现成服务

  •  
  •   forty · 51 天前 · 1226 次点击
    这是一个创建于 51 天前的主题,其中的信息可能已经有所发展或是发生改变。

    手头有大量图片,以及一些分类标签的名单列表,需要根据图片找到对应的标签。 比如输入图片 1 ,期望得出标签:风景,夜晚。

    我试了一下某大厂的,不能用我提供的标签去分,而是它自己的标签,比如我期望的是“人物,女性”,然而它给出的是“眼睛,鼻子,咖啡”

    17 条回复    2024-05-28 13:58:53 +08:00
    abelyao
        1
    abelyao  
       51 天前
    反过来想,输入图片,问它内容是否为“风景”,是的话你就打上标签“风景”咯,以此类推
    forty
        2
    forty  
    OP
       51 天前
    如果有几百个基本标签,那 1 个图片得问上几百次?还是说有支持 1 次问全部的?不知道哪家的 api 支持
    mumbler
        3
    mumbler  
       51 天前
    你先给每个标签准备一个标准图片,计算出向量,然后新图片也计算向量,相似度排序看与哪个标签的标准图片最接近,就先粗分到这个标签下,然后用大模型询问复核一下是否与这个标签匹配
    safilar
        4
    safilar  
       51 天前
    @mumbler 你这个方法是不错,有实践过么
    jimrok
        5
    jimrok  
       51 天前
    这个不是做一个微调就行了吗,你用 restnet 50 的模型,改一下分类,载入原来的权重,重新训练一下就行了。问一下 gpt4 ,马上给你一套代码。
    lizhisty
        6
    lizhisty  
       51 天前
    @jimrok 老哥 restnet 50 是什么
    rming
        7
    rming  
       51 天前
    用 yolo 微调下
    mightybruce
        8
    mightybruce  
       51 天前
    这个图片分类属于计算机视觉的经典任务。
    常见的有好几种方案
    第一种,图片元数据信息 尤其是 exif 信息,可以直接利用来打上标签,然后就用这个做文本做索引查找,

    第二种,这个属于少量自己训练的计算机视觉任务,叫做 image classification

    如果你一点都不懂 AI, 不建议自己训练, 百度飞浆 可以看看,easydl 提供了这些
    https://ai.baidu.com/easydl/vision/

    第一步需要你把图片做分类, 并完成标注,这个手动的话要耗费很多时间的

    自动标注最好借助一些平台来做

    第二步 选取训练集, 做有监督的训练学习

    第三步 用剩下的测试集 测试效果
    jimrok
        9
    jimrok  
       51 天前
    @lizhisty 残差网络,多打了一个 t ,resnet ,何凯明在微软研究院搞出来的图像分类模型,曾经的 imgnet 的冠军。
    jimrok
        10
    jimrok  
       51 天前
    图像识别已经是深度学习非常成熟的领域,一般都不建议重新训练一个模型,现有的模型选一个速度和准确率都能接受的模型,做一个微调就行,因为现有的模型对图片的纹理特征都完成了比较好的训练,只需要基于现有的权重,重新训练,就能得到特定领域的模型。
    ZnductR0MjHvjRQ3
        11
    ZnductR0MjHvjRQ3  
       51 天前
    这种服务应该没有,如果你找的是你认为很通用的,但是市面上没有的话,就只能自己微调了,yolo8 很好用
    chenuu
        12
    chenuu  
       51 天前
    azure 有自定义视觉这个能力
    qq316107934
        13
    qq316107934  
       51 天前
    试试 zero shot 分类然后算向量相似度,自己卡一个阈值,参考 CLIP 模型
    mumbler
        14
    mumbler  
       51 天前
    @safilar 都跑了一年多了,不过不是图片分类,而是视频内容搜索
    fjkfwz406
        15
    fjkfwz406  
       51 天前
    clip
    suke119
        16
    suke119  
       51 天前
    每一种图片 20-40 张,越多模型越准确 准备好分类,然后训练下 最后准确率在 99%以上,前端时间刚给别人定制过一个
    huang86041
        17
    huang86041  
       50 天前
    我使用的图库应用 MT-Photos 里面就包含 AI 识别,而且他也开源了。用的 Chinese-CLIP
    省事的话,你直接用他的 docker 部署一个。搜 mt-photos-ai
    或者你直接搜 Chinese-CLIP ,自己定制一个。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5657 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 01:50 · PVG 09:50 · LAX 18:50 · JFK 21:50
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.