有能直接吐 Excel, World 文件的 AI 工具吗

248 天前
 lurui45

很高频的一个需求,领导不知道从哪发了一张表格的照片给你,要你做一个电子版出来。

市面上有些能图片转 Word ,Excel 的工具,但是效果都不理想。AI 模型 OCR 识别率超高,但是都是给你输出 Markdown 的格式,所以有能直接吐文件的 AI 吗

1492 次点击
所在节点    OpenAI
7 条回复
nulIptr
248 天前
那不就是扫描全能王这种软件么,ios 付费榜常年第一
ccraohng
248 天前
夸克的也不错
maymay5
248 天前
ijk0
247 天前
ChatGPT 应该可以吧 python 转完给你下载地址
Leon1234567
191 天前
正好今天有需求,要转一个大几十页的 PDF 里的全部模糊表格(表格应该是拍照后 merge 成 PDF 的),市场上一个好用的 AI 工具都没有(试了 Grok, ChatGPT, Perplexity, Gemini, Claude, Kimi, 文小言, ds, 元宝, 通义, 豆包)。倒是都能转成网页显示的表格(Grok 会输出 HTML 代码,预览后就是表格),复制黏贴到 Excel 就行了。白描也试了,数据识别没问题,文字识别很差(一条文字经常被分割成好几条)。ChatGPT 可以生成直接下载的 Excel 表格,可惜没用,因为数据都能少一列,其他内容也识别的一塌糊涂。国外工具识别简中真的差。不过最离谱的是百度,输出的表格和提供的完全就不是一个东西,没有一条能对上的,张三李四王五这些东西都出来了,一切随心所欲,有一条能对上算我输。

最后 Kimi+腾讯混元结合用的,表头一旦复杂(涉及到合并等形式)所有 AI 工具都失效,比如 15 列给你输出 13 列,只能截图(没表头的数据)识别,而且每次输出还得肉眼仔细核对(因为经常有出入)。
lurui45
191 天前
@Leon1234567 怎么结合使用
Leon1234567
191 天前
@lurui45 就是针对不同类型的表格,有时候 Kimi 好用,有时候混元好用,纯玄学。总的来说就一条建议吧,复杂表格最好是简单的一行一行的,没有任何合并操作,每个行列只对应一条数据,然后再去识别吧,不然真是有的搞了。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1103243

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX