现在 Ai 的联网搜索真的是联网搜索吗?

277 天前
 dream7758522
最近对比了几家 deepseek 大模型套皮网站,同样是联网搜索,各家套用 ds 大模型的网站,联网搜索到的网页数量和内容都不相同,有一些疑问。
1.联网搜索真的是上网搜一下吗?
2.联网搜索是访问百度等搜索引擎吗?还是自建搜索数据库?
3.接上一个问题,ai 的联网搜索为什么那么快?一瞬间能搜索 30 多个网页,并且阅读完毕。有些网站本身很慢,哪怕不加载 css 和 Js,打开都需要半天。AI 再快也突破不了物理限制吧。

4.抛砖引玉:大家可以用自己的常用的 Ai 搜一下:我国现有多少个国家级互联网骨干直联点?
正确答案应该是 27 个。基本上兰州,宁波,西宁,太原,昆明这几个城市会被部分或者全部忽略
1354 次点击
所在节点    问与答
4 条回复
coefu
277 天前
1 ,肯定是搜,这个技术并不难。等我过几天写一篇详细的博客,纵观全网都没有把这个问题详细系统的讲一下的。
2 ,但是用的搜索引擎可能不同,就算是同一个关键字(有些提示工程做的好,只有本地知识库没有的才去搜,但是搜的关键字都是 llm 自己提供的,每个 llm 每次可能会丢出不同的关键字),用并发去多个搜索引擎跑 2 次,2 次的 top10 结果可能都不同。这个你可以理解哈?往往为了节省资源可能都是并发跑一次,然后聚合一下,至于聚合多少 url ,这个要看各自的 config 。
3 ,快是必须的,能套壳 ds 的厂家的资源解决 search/crawl/embedding 这种简单套路还不是手到擒来,要是搞的慢才丢人。
4 ,和这个无关。
billzhuang
277 天前
https://app.tavily.com/

这家提供搜索 api
viperchaos
277 天前
关于第 4 ,Perplexity 给的答案是 29 个,参考了这篇: https://xxzx.fujian.gov.cn/jjxx/szjj/202502/t20250206_6711346.htm?utm_source=perplexity
hafuhafu
277 天前
你以为的联网搜索: AI 去访问每一个具体的 URL 的页面,把内容全部读取然后总结。
实际上的联网搜索:应用层访问搜索引擎的索引接口,里面有 URL 和标题、内容摘要。然后丢给 AI ,AI 一般根据摘要直接总结。联网搜索的效果取决于搜索索引、关键词和搜索条件重优化、过滤搜索结果做的好不好。本来就是提前索引好的,调用快很正常。





像那种总结视频内容,大多数速度快的也只是读取视频的字幕文件然后总结,而不是一秒一秒的看过去转文字总结...

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1117292

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX