每一行php代码都是自己敲出来的购物比价站,jiabibi.com

2013-01-17 10:57:09 +08:00
 laoyuan
http://www.jiabibi.com 购物价必比!
 
包括爬虫,包括极其山寨的mysql全文检索、品牌识别商品归并算法,全部一行一行敲出来!不知对象为何物,没写过类,只会写函数!!刚入门的时候架apache架了三个晚上才成功,没有任何人指点,所以,just do it, 你也可以!
 
呵呵,放一个还没公开的页面:
http://www.jiabibi.com/jianlou/
暂是我不打算做用户系统,说白了我不打算在用户黏度上下多少功夫,只要能提供有价值的服务,用户买东西之前能想起来上这网站来看一眼,就足够了!
9323 次点击
所在节点    分享创造
55 条回复
chemhack
2013-01-21 08:24:18 +08:00
@laoyuan 那价格从哪来的啊
shiny
2013-01-21 10:40:24 +08:00
@laoyuan 可以透露下价格从哪来吗…… 难道是从etao来的……
laoyuan
2013-01-21 10:48:56 +08:00
当然是一手数据,直接从电商网站取啊
lusin
2013-01-21 11:09:29 +08:00
@laoyuan 你好,还想请教个问题

爬虫采集过程中断后,如何标记,以便下次采集呢?(来源方的内容可能是动态的)
laoyuan
2013-01-21 14:27:34 +08:00
实在不行就从头开始呗。。。对于动态列表性质的我一般把列表页html保存到本地,然后5天或10天更新一次,当然这东西不存也无所谓,就在数据库里建个表呗,抓过的把时间update一下。
shiny
2013-01-21 14:46:43 +08:00
非常感谢 @laoyuan 的分享。
另外京东价格的获取,想了下,写了个简单的python版本演示,分享给:
@cooiky
@chemhack

http://gist.github.com/4584041
laoyuan
2013-01-22 19:13:41 +08:00
LS上硬货了,虽然我不是用这种方法,不过条条大路通罗马~
laoyuan
2013-01-24 09:12:49 +08:00
再次出现ftp连接满的情况(限3连接),查了下日志,原来不是黑客,有机器对21端口暴破而已,同时3个线程验证密码,就给占满了,换个端口立刻清静~
firsthym
2013-01-24 17:45:04 +08:00
把你的比价网站放到了我的电商搜索里面(最后一个标签“比价网站”): http://cse.so/q/50fe555617f923f8c3000017/Nexus

希望保持更新~加油!
laoyuan
2013-01-25 00:05:14 +08:00
@firsthym 保持更新请放心,绝对有信心~~
reverland
2013-02-16 18:34:59 +08:00
赞楼主,写什么类,楼主那是用php函数式编程
bigdude
2013-05-17 21:40:51 +08:00
赞楼主的执行力,比价这个idea我也有,自己也敲敲打打研究了不少了,可是成品还没有,都不想为自己的懒惰开脱了。看看楼主,真是惭愧
wheatcuican
2013-12-02 17:18:08 +08:00
楼主,缺书网也是你的么?
laoyuan
2013-12-06 10:40:52 +08:00
@wheatcuican 多明显啊,看我ID就知道了,现在主要就是做缺书网,感觉做百货比价还需要酝酿酝酿,有计划的推进,现在缺书网是想到啥做啥
wheatcuican
2013-12-06 13:07:10 +08:00
@laoyuan 缺书网蛮好的,挺实用。有一个小建议:可以定期推荐一本书。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/57864

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX