V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
tomato9
V2EX  ›  程序员

对于传统格式文档, ai coding 工具都是怎么理解的

  •  
  •   tomato9 · 1 天前 · 935 次点击

    比如 excel 写的接口文档,pdf 格式的流程图,word 的需求文档,有哪些 ai coding 工具是可以读取的,我试了下 claude code 是可以的读取,但我又没配置多模态大模型,这里面读取的原理是啥呢

    10 条回复    2026-02-09 20:01:44 +08:00
    visper
        1
    visper  
       1 天前
    也许他们自己的上传文件接口先用工具把文件内容读取转成了 markdown 和图片之类的呢?
    javalaw2010
        2
    javalaw2010  
       1 天前
    excel/pdf/word 这类文件的读写的技术很成熟了,随便什么语言都能找到对应的 SDK 库,集成进工具里面写成 function 给大模型调用就好了。
    gorvey
        3
    gorvey  
       22 小时 18 分钟前
    通过 MCP 和 SKILL,所有的 ai 都能接入使用
    gorvey
        4
    gorvey  
       22 小时 18 分钟前
    tomato9
        5
    tomato9  
    OP
       22 小时 4 分钟前
    @gorvey 我主要好奇 pdf 这种里面有流程图的要如何通过 mcp 理解,感觉还是需要多模态能力呀
    tomato9
        6
    tomato9  
    OP
       22 小时 3 分钟前
    @javalaw2010 那可能 word 和 excel 这种已经是内嵌到 claude code 里面的基础能力了
    gorvey
        7
    gorvey  
       22 小时 2 分钟前
    @tomato9 #5 要看源格式,如果是代码写的那就不需要视觉,如果本来就是图片那就需要了
    gorvey
        8
    gorvey  
       22 小时 0 分钟前   ❤️ 1
    @tomato9 #5 https://skillsmp.com/zh/skills/anthropics-skills-skills-pdf-skill-md 你可以看下这个 skill 是怎么写的,如何理解 pdf 里面的内容,这里面都写的很清楚
    tomato9
        9
    tomato9  
    OP
       21 小时 41 分钟前
    @gorvey 谢谢大佬
    aisk
        10
    aisk  
       19 小时 19 分钟前
    claude 的模型好像时支持视觉的: https://platform.claude.com/docs/zh-CN/build-with-claude/vision
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   4258 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 07:20 · PVG 15:20 · LAX 23:20 · JFK 02:20
    ♥ Do have faith in what you're doing.