比价网站/插件的价格浮动统计是怎么做的?

2014-03-07 07:41:48 +08:00
 cevincheung
比价网站/插件的价格浮动统计是怎么做的?就是那个折线图。淘宝任意一款商品都会有。怎么做的呢?自己做统计?自己存?不太可能吧?
4488 次点击
所在节点    程序员
12 条回复
virushuo
2014-03-07 07:56:36 +08:00
自己存,或者用别人的api
aszxqw
2014-03-07 10:53:29 +08:00
就是自己存的。自己存为什么不太可能?
simaoji
2014-03-07 12:00:18 +08:00
自己存有什么问题么
muzuiget
2014-03-07 12:42:59 +08:00
就是资金用爬虫定时抓,自己存数据,怎么不可能。但是对于淘宝这种数据量来说,抓取频率肯定很低。
cgs3238
2014-03-08 06:41:09 +08:00
终于逮到一个能回答的了
这种应用要解决两个问题:1、数据来源 2、数据关联

数据来源问题,一般有三种:1、主动抓取;2、插件上报,用的人越多数据越多越实时;3、商家主动推送,这个需要一定实力,比如你可以给商家带来大量流量,这种方式最省力

所有数据都自己存起来

另外数据关联的问题,就是说要主动A商家的X商品其实和B商家的Y商品就是一款商品,他们可以用来比价。
最简单的方法是判断商品名称有一定相似度,价格差别不是特别大等等。但是这样得出的结果有误差,如果要做到高匹配度,可能需要人肉核对。
cevincheung
2014-04-06 22:35:37 +08:00
@virushuo
@aszxqw
@simaoji
@muzuiget
@cgs3238
自己存,别家不说,就淘宝一家就海量商品了。那些小公司怎么存得起? @.@
muzuiget
2014-04-06 22:43:38 +08:00
@cevincheung 就是不可能存得起,所以就不准,所以我一直觉得比价淘宝完全没参考价值。
simaoji
2014-04-08 17:30:26 +08:00
@cevincheung 淘宝上绝大多数肯定就不存啊,也不是所有数据都会存吧。
cevincheung
2014-04-08 18:56:41 +08:00
@simaoji 那还怎么比价?哪个不存?为什么不存?
simaoji
2014-04-08 19:07:19 +08:00
@cevincheung 可以只存B2C不存C2C啊,重点存某些类目啊,有一些品类网上买的少的也可以不存啊。
cevincheung
2014-04-08 19:17:09 +08:00
@simaoji 只存Tmall么?那淘宝怎么办。就单说手机类目,也不下几百万的数据啊。 至于最后一点,那也是要有数据了才能知道什么东西买的少啊。
simaoji
2014-04-08 20:28:13 +08:00
@cevincheung 有能力存就存,没能力就不存啊。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/103210

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX