ChatGPT 图像理解能力能在哪些场景发挥作用?

216 天前
 xuelang

试了下 ChatGPT 的图像理解,比预期好,效果还是很赞的。

ChatGPT 图像理解能力深度体验

现在能想到的一些用途包括:

  1. 以后排查问题可以直接扔截图给它;
  2. 帮忙实现 web 页面;

其他还要啥好的使用场景吗?

1878 次点击
所在节点    OpenAI
22 条回复
whatv3
216 天前
验证码...
jimrok
216 天前
去除水印
xuelang
215 天前
@whatv3 那得破解才行
xuelang
215 天前
@jimrok 这里说的是图像理解。。去水印至少得有文生图才行
xuelang
215 天前
@whatv3 试了下数字验证码,好像不用破解,直接就给识别了
zealotxxxx
215 天前
你直接看微软发的那个论文,基本说的很全了。
[2309.17421.pdf]( https://browse.arxiv.org/pdf/2309.17421.pdf)
maxxfire
215 天前
大家来找茬游戏,可以玩通关了
JayZXu
215 天前
如果速度能提升的话,对视障人士还是挺有用的
jimrok
215 天前
修改设计图可能行,把老王 p 掉,把老王 p 好看点
xuelang
215 天前
@zealotxxxx 感谢,我瞅下
tuutoo
215 天前
有人能使用这个图像识别功能了没?上次看了介绍,但啥时候有这功能啊。
iorilu
215 天前
这么说打码问题可以解决了?
xuelang
215 天前
@tuutoo 我这边已经有了,还在不断体验中
xuelang
215 天前
@iorilu 试了下,并不能很好识别验证码
xuelang
215 天前
@jimrok 这不行。。。这个只是理解图片而已
whatv3
215 天前
@xuelang 用了多少 token ? 算算看是不是比打码平台便宜...
xuelang
215 天前
@whatv3 哈哈哈,这是关键。目前还是打码平台靠谱便宜,ai 效果不行
qiany
215 天前
检测员工摸鱼时长
youthfire
215 天前
其实应用场景可以有很多,但是限制权在别人手里。比如说,interpretor (Advanced Data Analyze),出来的时候可以进行复杂的表格结构分析,然后完成 ocr ,最后排版。当时我经常用在业务上。但是现在只剩“告诉你逻辑/思路”,连 ocr 都不能顺利完成,不是告诉你环境缺失相关组件,就是一顿分析后质量很低,又或者提供惨不忍睹的部分结果。所以这个问题,回到图像理解能力上也是一样,它能懂,但是对于能不能做到你的需求,一直是变量。能力是有,但是服务商略微调整,你这边的结果,或者应用能力就变动很明显。
MelodyZhao
214 天前
看图讲故事,还是挺不错的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/980105

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX