提问:关于 IOS 18 的 AI 更新,为什么会有人觉得不厉害?

2024-06-16 18:42:02 +08:00
 maymay5

我先阐述我的观点

可问题是,苹果自始至终都不是一家人工智能公司,为啥要比参数?

我也没到结晶果粉的程度,苹果的信号问题,功耗问题,发热问题,我一直是先骂为敬。

6755 次点击
所在节点    Apple
61 条回复
maymay5
2024-06-16 23:44:29 +08:00
@hanqian 这确实,只能说他是第一个敢这么做的,实现这样的场景确实很容易复制
mxalbert1996
2024-06-17 00:01:49 +08:00
@maymay5 所以我才说你根本不了解 Gemini ,手机版 Gemini 集成了 Google Assistant 的功能。
mxalbert1996
2024-06-17 00:03:15 +08:00
ZE3kr
2024-06-17 00:07:15 +08:00
至少资本还是认可的,AAPL 的股价最诚实了
newarea
2024-06-17 00:12:06 +08:00
只是大家觉得 apple 能告诉大家 ai 到底应该怎么盈利
maymay5
2024-06-17 00:12:26 +08:00
maymay5
2024-06-17 00:13:26 +08:00
@mxalbert1996 #23
* 在写作、头脑风暴、学习等方面获得帮助
* 总结及快速查找 Gmail 或 Google 云端硬盘中的信息
* 即时生成图片
* 通过文字、语音、照片和相机获取帮助,探索全新互动方式
* 在 Android 设备上,只需说“Hey Google”,即可唤出 Gemini ,就手机屏幕上的内容寻求帮助
* 使用 Google 地图和 Google 机票规划行程
请你说一下,这玩意和小 V 助手的区别
mxalbert1996
2024-06-17 00:17:13 +08:00
@maymay5
你就看了最顶上那几条也好意思来回复啊?
Google Assistant features in your Gemini mobile app 看了么?
maymay5
2024-06-17 00:18:04 +08:00
@mxalbert1996 #23 而且重要的是,也要考虑国情啊,国内 APP 在可预见未来能接入 Gemini 协同吗
mxalbert1996
2024-06-17 00:19:46 +08:00
@maymay5 别转移话题。你想喷国内厂商那就说清楚,别扯上整个安卓。
maymay5
2024-06-17 00:22:18 +08:00
@mxalbert1996 #30 扯上整个安卓?我的原话 “典型的延续了安卓的特点:啥都有,啥都不全面,实现了就上线,使用体验再慢慢更新” ,这个特点你也要反驳一二?我原本哪一出说过安卓 AI
mxalbert1996
2024-06-17 00:28:09 +08:00
@maymay5
我不知道你的逻辑在哪里,不过就算你说的对吧,但哪怕是在这样的安卓上,Gemini 也早已实现了苹果 AI 的功能。
wonderfulcxm
2024-06-17 00:38:39 +08:00
有钱就用 ai ,没钱就…
maymay5
2024-06-17 00:49:31 +08:00
@mxalbert1996 #32 那你觉得 Gemini 这些功能,强还是不强,好用还是不好用呢?

如果强,好用:算是苹果照抄的,那请问,苹果 AI 抄过来就不强了,不好用了?

如果不强,不好用:那你以 Gemini 作为论据的意义是什么呢?来反向证明苹果的这次更新是谷歌玩过的,要胎死腹中的产品?

我觉得你只想反驳一点:谁第一个做的,安卓早就做了,凭什么 Apple 的会被人拿出来发帖吹,谷歌的躺在文档里,至于这个问题,我建议你开个专题贴,两个人没有讨论意义,应该是两群人
HeraingBus
2024-06-17 01:06:33 +08:00
@mxalbert1996 确实
ShadowPower
2024-06-17 02:33:19 +08:00
@maymay5 我的意思是,基础设施都没有做好,所谓的应用场景都只是空中楼阁。就像你指望用 GT610 显卡开最高画质畅玩 3A 大作一样。
如果有一个好的模型,实现你说的那些东西,比开发一个普通 APP 的难度还低。

你对其他厂商的了解不多,所以你会觉得苹果的想法非常独特,仿佛大家都想不到一样。楼上有个人提了 Google ,我就不重复了。

你可能觉得所有国内厂商的语音助手就像 siri 那样大多数时候只会打开网页搜索,而没多少与系统集成的功能。但 4 年前发布的 MIUI 12 就可以做到:
“帮我订张从 A 到 B 的机票”:会打开携程,然后跳转到查询机票的页面,自动填入你提到的出发点、目的地、日期;
“我想知道去 XXX 的路怎么走”:会帮你打开百度地图或者高德地图,查询路线,从你的位置到你说的目的地
还有其他场景,例如打车等。或者最经典的:“我想听雷军的歌”(这个实现得更早,太简单了,siri 都能做类似的事情)

虽然这玩意诞生的时候并没有现在这么强的 LLM ,当时的手机内存容量和运算性能也不足以运行这样的东西。但是,语音助手与系统、第三方应用的对接,其实早就想到并实现了。

在这种基础上,想利用 AI 来整合信息,调用第三方应用,其实只需要在现有的基础上,接着往前走一步就可以了。

我所在的小公司里的产品经理,都设想过你想象的那些场景,难道这么多手机厂商的产品经理,就没有一个想到过吗?


目前国内确实没有手机厂商把这玩意真正做出来,只是初步将 LLM 用在聊天和画图里。不过苹果目前只停留在 PPT 上的 AI 照片编辑,国内厂商倒是已经实现了手机上离线运行的。

没做出来未必是没想到这种创意。用云端大模型应该可以实现,但是成本太高,商业上划不来。而过去能在手机上运行的模型,对于这样的应用场景效果都不好。

实际上我在公司里做过类似的东西,虽然不是手机上用的。功能是用一串自然语言描述的复杂需求,转成对应的系统功能页面+数据+需要执行的操作。后来因效果不好,且效果好的方案成本极高,没有商业价值,老板放弃了。

2024 年以前的 7B 及以下参数量的模型一个都做不到,起码得 70B ( PS:那会我都觉得 Yi-34B 是最好的基础模型,但 SFT 做得不好,导致直接用官方的模型感觉不是很好)。现在用 Qwen2 7B 的性能应该勉强可以做到,但我没有专门测试过,不保证。1.5B 的性能估计只能应付简单场景了。

当时公司还打算去买智谱清言的 ChatGLM 模型来实现上面说的那种需求,那时候计划用 12B 参数量的,所以我和他们团队有过一次沟通。

他们透露了小米也找过他们……


今年确实有一些让人眼前一亮的小参数量模型,而且低成本长上下文的技术也有一些突破,很多 LLM API 价格暴跌。

谷歌自己掌握优质数据,有 AI 领域的人才,自己训练模型而且目前还非常强,同时还做手机,能最早落地也不意外。微软的情况类似,所以从 Windows 11 24H2 开始就能在系统层面提供这方面的能力。

前提都是有性能足够好的,能在手机(或者轻薄本)上跑的模型。自己做不出来也没关系,可以找其他公司合作,但确实今年(甚至就两三个月前)才有,能到用户手里的时间只能更晚了。

只是 6 月正赶上 WWDC ,苹果提了一下这玩意,而且关注的人比关注谷歌、微软的多,所以会觉得似乎只有苹果才能想到这些。

然而微软宣传 Windows Copilot (后面换了很多说法)那会都提出了类似的想法。从现在算起,一天半以后都有搭载相应功能的产品开始发货了(微软要求 40 TOPS NPU ,所以需要等骁龙 X Elite 产品上市,其他设备都不提供支持)。
hiapk
2024-06-17 09:03:05 +08:00
厉害? 用了能让我银行账户多加几个 0 吗
crackidz
2024-06-17 09:04:53 +08:00
这个东西大多是成熟的 AI 应用,在各个 AI 应用甚至部分安卓系统已经提供的功能。
其实最大的问题还是门槛太低了,苹果能做别人自然也能做,甚至不会有什么太大差异。当然我不看好各家手机厂商自己做,需要系统层面 Google 统一一个标准就行了

另外关于 Web 的,也有人做了一个 Web Intents 的东西 https://github.com/MegaPortal/web-intents-for-llms/
Mandelo
2024-06-17 09:25:04 +08:00
厉害国行也用不上 gpt
robbielj
2024-06-17 09:59:48 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1049986

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX