V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lionkin
V2EX  ›  分享发现

用 Python 提取《釜山行》人物关系

  •  
  •   lionkin · 2016-11-09 14:19:35 +08:00 · 4053 次点击
    这是一个创建于 2725 天前的主题,其中的信息可能已经有所发展或是发生改变。
    推荐下 Foerc 同学的 [ Python 基于共现提取《釜山行》人物关系] 项目。

    《釜山行》是一部丧尸灾难片,人物少、关系简单,非常适合学习文本处理。这个项目介绍了共现在关系中的提取,使用 python 编写代码实现对《釜山行》文本的人物关系提取,最终利用 Gephi 软件对提取的人物关系绘制人物关系图。


    你可以按照此法,试着去提取下《百年孤独》的^_^

    教程和在线练习地址: https://www.shiyanlou.com/courses/677
    代码: https://github.com/Forec/text-cooccurrence
    7 条回复    2016-11-10 16:21:21 +08:00
    Luzifer
        1
    Luzifer  
       2016-11-09 14:47:31 +08:00
    《权力的游戏》
    kingscof
        2
    kingscof  
       2016-11-09 18:17:34 +08:00
    《红楼梦》
    21grams
        3
    21grams  
       2016-11-09 18:22:50 +08:00
    三国演义
    laycher
        4
    laycher  
       2016-11-09 18:27:36 +08:00
    水浒传
    wolfan
        5
    wolfan  
       2016-11-09 18:29:54 +08:00 via Android
    请出示柯南的关系图谱~
    sobigfish
        6
    sobigfish  
       2016-11-09 19:53:09 +08:00
    哪来的剧本-.-,对话里面没有昵称 /别名么,如果有怎么和原名字联系起来(不主动设置关联的情况下)
    lionkin
        7
    lionkin  
    OP
       2016-11-10 16:21:21 +08:00
    教程里有剧本,这个项目是基于共现关系实现的,关系紧密的人物往往会在文本中多段内同时出现,可以通过识别文本中已确定的实体(人名),计算不同实体共同出现的次数和比率。当比率大于某一阈值,我们认为两个实体间存在某种联系。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3385 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 10:40 · PVG 18:40 · LAX 03:40 · JFK 06:40
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.