用 Python 提取《釜山行》人物关系

2016-11-09 14:19:35 +08:00
 lionkin
推荐下 Foerc 同学的 [ Python 基于共现提取《釜山行》人物关系] 项目。

《釜山行》是一部丧尸灾难片,人物少、关系简单,非常适合学习文本处理。这个项目介绍了共现在关系中的提取,使用 python 编写代码实现对《釜山行》文本的人物关系提取,最终利用 Gephi 软件对提取的人物关系绘制人物关系图。


你可以按照此法,试着去提取下《百年孤独》的^_^

教程和在线练习地址: https://www.shiyanlou.com/courses/677
代码: https://github.com/Forec/text-cooccurrence
4066 次点击
所在节点    分享发现
7 条回复
Luzifer
2016-11-09 14:47:31 +08:00
《权力的游戏》
kingscof
2016-11-09 18:17:34 +08:00
《红楼梦》
21grams
2016-11-09 18:22:50 +08:00
三国演义
laycher
2016-11-09 18:27:36 +08:00
水浒传
wolfan
2016-11-09 18:29:54 +08:00
请出示柯南的关系图谱~
sobigfish
2016-11-09 19:53:09 +08:00
哪来的剧本-.-,对话里面没有昵称 /别名么,如果有怎么和原名字联系起来(不主动设置关联的情况下)
lionkin
2016-11-10 16:21:21 +08:00
教程里有剧本,这个项目是基于共现关系实现的,关系紧密的人物往往会在文本中多段内同时出现,可以通过识别文本中已确定的实体(人名),计算不同实体共同出现的次数和比率。当比率大于某一阈值,我们认为两个实体间存在某种联系。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/319250

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX