我分析了 42 万字的歌词,为了搞清楚民谣歌手们在唱些什么

2017-02-07 14:53:27 +08:00
 graetdk

写了一个爬虫,然后做了一些数据分析

文章链接: http://www.wdk.pw/1221.html

当然,我也发在我的微信公众号了,欢迎关注:

10842 次点击
所在节点    分享创造
73 条回复
jy02201949
2017-02-07 14:54:11 +08:00
反光镜什么时候成民谣的歌手了,这不正儿八经的摇滚乐队么
graetdk
2017-02-07 14:54:51 +08:00
@jy02201949 文章里有说明,我选了很多各种类型的做参考
jy02201949
2017-02-07 14:56:59 +08:00
@graetdk #2 看到了,我孙海英也入选了
killerv
2017-02-07 15:03:22 +08:00
有意思
killsting
2017-02-07 15:06:49 +08:00
還蠻有趣。
DearTanker
2017-02-07 15:07:00 +08:00
有意思
mdaocao
2017-02-07 15:08:56 +08:00
除了结论分析。。。建议把更直观的数据放出来
graetdk
2017-02-07 15:10:12 +08:00
@mdaocao 主要读者是不懂技术的普通人,所以文章里说的都是结论和分析,数据和代码我在考虑完善一下再开源出来
jiangzhuo
2017-02-07 15:10:13 +08:00
"本次分析使用的是腾讯文智和哈工大社会计算与信息检索研究中心的自然语言处理模块,同时也在测试的时候使用了百度 AI 的自然语言处理,效果不好。"
我哈工大还是很牛逼的
graetdk
2017-02-07 15:10:44 +08:00
@jiangzhuo 几年前就用过了,很厉害
itqls
2017-02-07 15:10:58 +08:00
如果把民谣拟人化,那应该是一个喜欢南方的北京小伙子,觉得世界很操蛋,但骂归骂,到底是对生活有希望的,憧憬着明天,在春天感到快乐,在冬天感到孤独,没有女朋友,但有几个纠缠不清的前女友,经常和她们见面,见面的地方可能是成都,昆明,南京,上海,武汉。。。。。
-----
哈哈这句有意思
mdaocao
2017-02-07 15:11:38 +08:00
@graetdk 可是,这是 v2 阿... 而且直观的结论,不需要什么技术吧。。。

就比如那个 权重的词表,可惜不全...
Sharuru
2017-02-07 15:16:51 +08:00
还挺有趣的。
graetdk
2017-02-07 15:31:03 +08:00
@mdaocao 下次发 V2 注意一下偏技术实现一点~
allen0125
2017-02-07 15:36:03 +08:00
看了一遍之后感觉很棒啊
mdaocao
2017-02-07 16:11:29 +08:00
@graetdk 哈,谢谢,谢谢。

其实我很想看到底从第一个词,到第 100 个词,到底都是些啥
malagebidi
2017-02-07 16:26:21 +08:00
会分析其他类型的歌吗😄
graetdk
2017-02-07 16:26:40 +08:00
@malagebidi 比如说?
yaoxuwang
2017-02-07 16:31:13 +08:00
哈哈哈,好玩。同听民谣的来握个爪
malagebidi
2017-02-07 16:32:18 +08:00
@graetdk 摇滚歌曲(主要我蛮迷五月天,其他一众台湾摇滚还挺多的),华语情歌

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/338740

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX