我分析了 42 万字的歌词,为了搞清楚民谣歌手们在唱些什么

2017-02-07 14:53:27 +08:00
 graetdk

写了一个爬虫,然后做了一些数据分析

文章链接: http://www.wdk.pw/1221.html

当然,我也发在我的微信公众号了,欢迎关注:

11460 次点击
所在节点    分享创造
73 条回复
bluecrow
2017-02-07 22:40:16 +08:00
“似曾相识”四个字已经够了。数据分析也就图个乐呵。
eyp82
2017-02-08 05:14:09 +08:00
看了你的文章, 我感觉楼主的代码应该没什么出奇的, 就是用 Python 和相应的库爬数据然后分析一下而已, 估计 V 站很多同学都能做. 但是这创意真是非常的讨巧, 一般程序员想不到这些; 另外楼主文章写得也是读起来很舒服, 总之大写的服字. 综上我建议楼主是不是往网站运营方面发展一下? 估计比你做程序员更有前途啊..
eyp82
2017-02-08 05:19:27 +08:00
另外感觉现在语义分析的方向应该是深度学习, 单独分析词汇会比较牵强. 比如你文章里说永远是积极的词汇, 其实不然. 比如"我为什么永远这么苦逼", "永远也没有明天" 之类, 不同的组合, 则情绪大变. 又比如, 如果一首写失恋的歌, 如果有诸如"我微笑着目送你离开"之类句子, 看起来十分阳光, 实际要表达的意思是很苦涩和灰暗的. 这也是语言的令人着迷之处.
graetdk
2017-02-08 07:02:22 +08:00
@eyp82 我在自己创业,目前的工作主要是做产品,还真没有写代码,不过写代码一直是我的兴趣
IdJoel
2017-02-08 09:24:39 +08:00
可恶啊!!!! 把我的十三名字改回来!!!!!!!!!!!!!!!!!! 是尧尧尧尧尧尧尧尧尧尧尧尧尧!!!!!!!!
g0thic
2017-02-08 09:28:09 +08:00
jr 你好
KyrieJoshua
2017-02-08 09:28:33 +08:00
厉害了…李志的正面情绪最低完全没毛病~
est
2017-02-08 09:29:08 +08:00
歌手们最喜欢的城市——郑州。。。。。

这是说明郑州人多乐队多么。。
murmur
2017-02-08 09:50:58 +08:00
有意义么?最后分析出来春夏秋冬的各 1/4
别人分析个古诗词排个词频搞出个自动作诗软件
你这个分析出来啥都没有啊
murmur
2017-02-08 09:53:49 +08:00
另外我感觉你的分析结论或者数据有错,民谣本身小清新都偏苦情歌,哪里有那么乐观的情绪
乐观情绪你分析小沈阳啥还差不多。。
anibear
2017-02-08 10:26:42 +08:00
不愧为三克 感觉那个图标里他在说 睡你麻痹 起来 high ~
graetdk
2017-02-08 10:27:19 +08:00
@IdJoel 对不起!(鞠躬 我当时输入法看走眼了
Wongzigii
2017-02-08 10:32:18 +08:00
jr 你好
xiaoxiuaoliang
2017-02-08 10:35:28 +08:00
杰作~ 朋友圈已出现
wintercoder
2017-02-08 10:43:27 +08:00
喜马拉雅 FM 公众号转了,不过有说明来源,然后朋友圈就见到这个了..
enenaaa
2017-02-08 11:08:51 +08:00
这个分析挖掘太流于表面了
luoer
2017-02-08 11:14:46 +08:00
楼主 介意把爬虫源码 share 一下么
IdJoel
2017-02-08 11:25:51 +08:00
@graetdk 快改回来 ~~~~
graetdk
2017-02-08 12:19:12 +08:00
@luoer 太丑陋了,还想完善一下
SourceMan
2017-02-08 12:49:22 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/338740

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX