比价搜索 技术如何实现

2013-01-03 22:57:55 +08:00
 gjk1992
比如搜索iPhone 搜索结果是 iPhone的各个型号 和相关配件的型号,点击某个型号现实 出售的商城 和商家

技术方面怎么实现呢

通过api接口不太适合,要采集数据到数据库吧

人工归类肯定能解决问题

但是要一个算法能实现 辅助归类
5848 次点击
所在节点    程序员
18 条回复
gjk1992
2013-01-03 23:30:35 +08:00
当你选择一个商品的时候,如何查询出数据库中其他的同样商品的信息 ,通过单纯关键字肯定不行 .我浏览一个iphone5 32G 联通版 要给出已经采集到所有信息中的该商品 当然必须也是联通 也是 电信的就不能出现
subpo
2013-01-03 23:37:04 +08:00
这…
gjk1992
2013-01-03 23:37:17 +08:00
我现在所想的是 重现建立自己网站的分类,然后设置产品信息大全,采集入库手动分类
mlzboy
2013-01-04 02:41:26 +08:00
聚类
takato
2013-01-04 10:32:47 +08:00
比价很大程度上需要人工去校正数据的。。
所以etao一开始的价格分类也较混乱。
takato
2013-01-04 10:33:50 +08:00
还记得之前电商大战etao临时出来过一个页面么,那个页面就是自动抓的结果。。你会发现各种神奇的不同SPU商品因为名字类似被聚合到一起的情况。。
muxi
2013-01-04 11:03:36 +08:00
聚类根本解决不了商品聚合问题


@takato 说的是对的,机器抓取和基本得算法模型会导致不同SPU的被聚合,而且由于各个电商或者商家因为SEO得原因,把标题弄得乱七八糟,而商品本身属性(SKU)各个电商又不统一,很难做聚合比较,现在通用的方法就是先聚合,然后人肉分类

有专门的数据采集分类公司在做这样得事情,大公司直接买个更划算
takato
2013-01-04 11:08:49 +08:00
@muxi 谢谢muxi的补充:)我只是个门外汉啦-v-..
gjk1992
2013-01-04 14:00:07 +08:00
@takato 重现建立自己网站的分类,然后设置产品信息大全,采集入库手动分类 是这个意思么
gjk1992
2013-01-04 14:00:23 +08:00
@mlzboy 聚类 啥意思 啊
takato
2013-01-04 14:24:29 +08:00
@gjk1992 对的:)一部分机器分类的效果还能接受,但是另一部分效果会很差
gjk1992
2013-01-04 15:01:56 +08:00
@muxi 求教,如何解决比价问题,是不是必须采集到本地
mlzboy
2013-01-04 23:18:35 +08:00
@muxi 聚类是目前作商品聚合的主要手段,还可以加上图片型号词性等信息
gjk1992
2013-01-05 00:38:12 +08:00
@mlzboy 能解释下聚类的意思么
moplay
2013-01-05 10:46:32 +08:00
有etao在,比价还是省省吧,别浪费时间
gjk1992
2013-01-05 14:17:32 +08:00
@moplay 那又怎样啊,
gjk1992
2013-01-13 14:32:45 +08:00
每人了
laoyuan
2013-01-18 11:21:31 +08:00
可以统一下词汇么,我称之为 归并。这个词来自图书馆界。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/56508

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX