通过文本分析给商品分类

2015-03-01 23:02:22 +08:00
 kirch
上次撸了个爬虫爬各种什么值得买网站,后来发现分类是个问题,因为每个网站都有自己的分类标准
然后试着用文本分析的给商品分类,效果还可以,已经用在了那个网站上。

不知道这类服务是否会有需求?

这个是测试DEMO
http://www.suimai.com/api/classify

ALI云有CPU限制,大家轻点插啊
3276 次点击
所在节点    分享创造
7 条回复
cevincheung
2015-03-01 23:35:15 +08:00
开源是王道
kslr
2015-03-02 00:19:18 +08:00
Tag ?
best1a
2015-03-02 00:22:16 +08:00
TF-IDF?
xiaogui
2015-03-02 01:26:52 +08:00
分享下几年前借助淘宝 sdk 的做法,不一定是最准确的,但是挺取巧的。
1、对商品名称进行分词;
2、将分词后的内容使用淘宝 sdk 进行搜素;
3、将搜索后的结果取 top 100 ,然后对这 top 100 的分类进行类似 group by 的操作;
4、将分类占比率最大或者前两名作为该商品的商品分类。
备注:
1、此方法对特殊商品无效,比如药品类。
2、如果遇到淘宝 sdk 访问频率超限,可以通过建立授权池的方法进行解决。
RangerWolf
2015-03-06 16:56:39 +08:00
试了几个 感觉不错啊!
分享一下你的做法?
llhh
2015-03-22 17:31:14 +08:00
楼主这是机器学习吗?
kirch
2015-03-22 19:00:06 +08:00
@kslr
@best1a
@RangerWolf
@llhh
支持向量机

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/173828

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX