大四毕设了,已经爬了四百多万条豆瓣书评了,准备做一个 Chrome 插件,不知道取什么名字好

2020-12-01 17:16:11 +08:00
 13936

用 Scrapy 框架爬的,目前可以通过情感分析判断一本书的翻译质量。

方法是筛选一条评论里是否含有“翻译,原著,英文”等词汇,如果有的话,就判断情绪积极程度,然后给书籍的翻译质量打分。目前结果来看是可行的,基本可以有个大致判断。

但是既然爬下来了这么多数据,能做的也不仅仅只是这一点,可以做个词云,相关书籍推荐等功能,将更多隐含的信息可视化。但是总的功能类似,就是从大量数据中挖掘出隐含的对用户有帮助的信息。只是目前不知道取什么名字比较好,这周就要定题目了。V 友们方便帮忙取个名字吗?

还有,本人已经拿到了 Offer,不过不是计算机行业的,编写 Chrome 插件可能还需要再去买服务器,用 Flask 框架写 API 。既然工作重心不在计算机行业上了,也想过只写成一个 Python 程序,在本地输入书籍链接再在本地输出信息。V 友们对于这一想法有什么建议吗?

8036 次点击
所在节点    程序员
56 条回复
Jiers
2020-12-01 17:19:56 +08:00
程序可私聊一下
laminux29
2020-12-01 17:29:38 +08:00
所以毕设是毕业入狱指南?
MakeItGreat
2020-12-01 17:34:41 +08:00
21 天精通从入学到入狱
LoNeFong
2020-12-01 17:38:36 +08:00
居然不进来卷, 感动
Tink
2020-12-01 17:46:37 +08:00
我以前也爬了好多好多,后来也不知道有什么用,打包扔到百度盘好几年了
13936
2020-12-01 17:47:25 +08:00
@Tink 要不分享点给我,哈哈哈哈哈
13936
2020-12-01 17:47:43 +08:00
前辈们给点建议啊喂,想取个好点的名字呢
TimePPT
2020-12-01 17:50:39 +08:00
自己玩玩得了,开放出来弄不好就吃豆瓣律师函。
Lemeng
2020-12-01 17:51:42 +08:00
发布出来?同学要想清楚啊
haoxuexiaoyao
2020-12-01 17:56:58 +08:00
打包发我网盘
hunk
2020-12-01 17:59:03 +08:00
豆瓣,我试过 30 秒一次,很快就被 ban 了。
楼主是用啥办法?我能想到唯一的对策是付费代理。
galikeoy
2020-12-01 18:08:32 +08:00
羡慕,刚毕业就搞了张长期饭票
dorothyREN
2020-12-01 18:09:09 +08:00
我在爬影评
codingadog
2020-12-01 18:10:11 +08:00
羡慕,坐等楼主衣食无忧
bushenx
2020-12-01 22:04:44 +08:00
羡慕,刚毕业就不用考虑租房子的事情了。
euph
2020-12-02 01:16:45 +08:00
就叫,爬虫,从入门到入狱吧
comsweetcs
2020-12-02 01:21:49 +08:00
厉害了,豆瓣法务部门明天估计会找你,然后是👮‍♀️,然后……
hearlessnor
2020-12-02 01:22:52 +08:00
笑死了 hhhhhhh
PhyllisLin
2020-12-02 01:24:28 +08:00
打包发我邮箱📬,谢谢同学。🐶
felixcode
2020-12-02 02:23:34 +08:00
你朝这个方向越努力,进去的越快,鲁迅说过,方向比努力更重要。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/731051

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX