用 Django 创建的第一个网站+scrapy 写的爬虫

2015-09-22 10:29:45 +08:00
 wsb200514
花了将近 2 周的时间:(1)用 django 搭了网站(2)用 scrapy 写了几十个爬虫。
目前看来可以正常使用了。
起初,是因为自己有每天浏览 36Kr 等科技博客、还有些技术帖子的习惯,之前一直用推酷,里面很全面,但还是想根据自己的喜好定制一个。所以如果正好也是你需要的话,倍感欣慰。
网站叫三四秒: www.34miao.com
谢谢。
12390 次点击
所在节点    Django
67 条回复
fange01
2015-09-22 10:33:25 +08:00
design 图挂错位?
kepenj
2015-09-22 11:08:54 +08:00
赞一个
jwenwang
2015-09-22 11:12:54 +08:00
挺简洁的,可以分享到 NEXT 上来:)
hjkl0001
2015-09-22 11:13:59 +08:00
感觉不错。。。
wsb200514
2015-09-22 11:16:21 +08:00
@jwenwang 我 products 频道聚合了 next,product hunt 这些产品信息,所以不知道发 next 会不会被 next 鄙视或者删掉啊?哈哈
wsb200514
2015-09-22 11:16:40 +08:00
@hjkl0001 谢谢^_^
wsb200514
2015-09-22 11:16:56 +08:00
@kepenj 谢谢哈
wsb200514
2015-09-22 11:20:37 +08:00
@fange01 谢谢指正。
您是指有几张图加载不出来么? xueui.cn 站点做了图片防盗链的措施,可以虽然爬到图片但是在浏览器里还是没法直接打开,除非在其他选项卡中先打开他们的站点,然后欺骗浏览器才能刷出来。
如果不是这个问题的话,请问一下您是用什么浏览器访问的,我也用试一下看看到底什么问题?我兼容性做的不是很好啊,请见谅,嘿嘿
jwenwang
2015-09-22 11:21:26 +08:00
@wsb200514 没事的呀,我就是审核的哈哈
wsb200514
2015-09-22 11:24:00 +08:00
@jwenwang 大神啊,那我赶紧发去,吼吼
XianZaiZhuCe
2015-09-22 11:37:53 +08:00
我想知道内容是你自己有选择的放上去的,还是直接抓的某些频道?
jwenwang
2015-09-22 11:52:49 +08:00
@wsb200514 搞定哈哈
wsb200514
2015-09-22 11:53:13 +08:00
@XianZaiZhuCe 只是自己选择了一些抓取的网站,然后抓取到的内容会全部展示出来不做筛选。如果抓取了内容,再对内容做筛选有选择的展示,那对个人项目而言有点太累了。
以后计划会加入一些其他功能,但针对信息维护这一块还是不想人工干预。所以其实网站抓取的信息质量只能取决于抓取的网站质量,所以前期只是筛选了一些自己浏览比较频繁的网站,质量有些保证。
ps. iOS 版本已经被拒了好多次了,目前已再一次提交审核中,希望这一次能没什么问题。
wsb200514
2015-09-22 11:54:46 +08:00
@jwenwang 嗯,已经展示出来了。多谢,真幸运啊,第一次在 V2EX 和真神对话,嘿嘿
jwenwang
2015-09-22 11:57:04 +08:00
@wsb200514 别。。。都是普通人
XianZaiZhuCe
2015-09-22 13:17:46 +08:00
@wsb200514 哦~ 我就是觉得很多网站内容质量挺差的,偶尔会有不错的。所以我比较少看。相对来说 看个人博客多点。
shulen
2015-09-22 14:04:27 +08:00
厉害,
Wangxf
2015-09-22 14:07:57 +08:00
厉害
wsb200514
2015-09-22 14:27:22 +08:00
@XianZaiZhuCe 是的,相比而言,个人博客质量高一点,网站发展大了新闻稿鸡汤文浅尝则止的文章就泛滥了。开发的那个版块收了一些 iOS 开发的个人博客,比如唐巧、 kitten yang ,南峰子,其他资讯类的不太清楚国内有哪些质量高的个人博客,所以……目前只能做到这么多。嘿嘿
wsb200514
2015-09-22 14:29:43 +08:00
@shulen @Wangxf 我也是刚入门啊,希望各大牛多携带携带,加快进步,嘿嘿……

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/222686

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX