V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
ldd
V2EX  ›  奇思妙想

想用医院的数据练手神经网络,请问可以做些什么事?

  •  
  •   ldd · 2018-03-29 22:56:54 +08:00 · 6625 次点击
    这是一个创建于 2191 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我是做 HIS 的,也就是医院信息系统。

    现在正在学习神经网络,学了很多了,想要实践一下。正好手边有很多家医院的数据库,想利用神经网络 + 医院大数据做个有意义、难度又不是很大的事情。

    本来想着“预测下一日 /下一小时的就诊人次”,这样难度应该不大。但是又转念一想,这样的预测做出来也没什么意义,也不值得提供给医院管理层去分析什么,所以想请各位说道说道,集思广益一下,看看有什么值得做又不是太难的。

    PS:这些数据都只是我一个人使用,不会拿来对外的。

    第 1 条附言  ·  2018-03-30 11:29:02 +08:00
    我的这些数据都是存储在数据库的,完全结构化、标准化。包含所有运营数据、就诊数据、病人信息、消费明细……

    大家的思路可以再开拓一些,比如:
    1.本身医院也是一家企业,可以站在企业角度来分析这些运营数据。
    2.其实可以有三个面,目前第 2)的回帖比较多一些
    1 )患者:自助导诊
    2 )医生:辅助诊断
    3 )管理层:分析本院人源画像、主要收入来源……


    PS:数据不外给,请自重。
    67 条回复    2018-04-09 23:04:23 +08:00
    imn1
        1
    imn1  
       2018-03-29 22:58:52 +08:00
    什么数据?
    ldd
        2
    ldd  
    OP
       2018-03-29 23:01:01 +08:00
    @imn1 所有的运营数据,包括医嘱、诊断、处方、计费等等等等
    murmur
        3
    murmur  
       2018-03-29 23:01:41 +08:00   ❤️ 1
    能拿到一些高清的 ct 或者核磁片子可能做一些图像处理的东西
    其余的似乎没卵用。。。
    SorryChen
        4
    SorryChen  
       2018-03-29 23:02:23 +08:00   ❤️ 1
    现在医疗很多结合机器学习,当年很早的时候,贝叶斯网就在国外来诊断结核病,现在也有很多用医疗影像结合深度学习做辅助诊断的,还有很多用病例记录做预测的,记得读过一篇论文,很诡异的名字:DeepDeath = =预测你怎么死
    hinate
        5
    hinate  
       2018-03-29 23:03:55 +08:00 via iPhone   ❤️ 1
    可以做推荐,根据病人的描述给出初步的诊断及治疗方案...之后不断优化推荐算法.(胡思乱想)
    ldd
        6
    ldd  
    OP
       2018-03-29 23:05:45 +08:00
    我是楼主。

    除了图像分析,有没有其他的点?我的这些数据都是存在数据库的,完全结构化、标准化。包含所有运营数据、就诊数据、病人信息、收入明细。

    我的初衷是用神经网络分析出来点什么结论、或者预测出点什么趋势,来提供给医院管理层参考
    murmur
        7
    murmur  
       2018-03-29 23:06:21 +08:00
    @SorryChen 肺结核确诊不是靠细菌培养么。。
    feverzsj
        8
    feverzsj  
       2018-03-29 23:08:20 +08:00
    预测人次,那是统计学的事情,要自己训练神经网络没这么简单的,你如果以为拿一堆数据塞进去就能出结果,那是天方夜谭
    hcymk2
        9
    hcymk2  
       2018-03-29 23:09:18 +08:00   ❤️ 1
    其实可以试下做分类。
    murmur
        10
    murmur  
       2018-03-29 23:09:38 +08:00
    @ldd 个人外行的感觉现代医学特别依赖仪器检验 有了检验科的结果你靠百度也能诊断
    但就是这种牛逼的仪器和靠谱的检验科难找
    小时后肺炎误诊的路过
    真的。。牛逼。。小医院拍 X 光愣是没看出肺部有问题来

    患者是不会按课本生病的 何况你用神经网络预测出的结果和医生首诊的结果也差不了多少。。。
    yu099
        11
    yu099  
       2018-03-29 23:15:45 +08:00 via Android
    之前谷歌的那个 ai 公司不是刚搞出来心脏的一个图像诊断分类的吗?似乎有九十几的准确率,人类七十几,但似乎那样也没用,疑难杂症还是得有经验的医生,结果出来医生还是得自己复核一遍,似乎还没什么卵用
    ldd
        12
    ldd  
    OP
       2018-03-29 23:24:18 +08:00
    @hcymk2 分类这个点提醒了我,可能有搞头,比如根据就诊情况,提前判断某个门诊病人是否会住院……还不够有意义,我再深入想想,可能这个方向是对的
    SorryChen
        13
    SorryChen  
       2018-03-29 23:28:14 +08:00 via iPhone
    @murmur 如果你学学贝叶斯网就知道了,根据很多症状来判定
    murmur
        14
    murmur  
       2018-03-29 23:29:22 +08:00
    @ldd 这个是没法提前判断的啊,判断病人会不会住院要等诊断结果出来再说
    而且有的病是可以住院可以选择每天来门诊的
    或者是有钱人选择比较刺激的治疗方法。。比如全麻拔牙。。一次搞定所有智齿。。刺激不

    所以判断某个门诊病人是否会住院其实就 3 点:1、钱够不 2、床位有不 3、病多重

    1 和 2 不用 AI 也能判断出来 3 的话没诊断结果也预测不了
    。。。所以还没卵用
    murmur
        15
    murmur  
       2018-03-29 23:30:14 +08:00
    @SorryChen 你忘了一点,病人的主诉是不准的,甚至有时候有的病人看了百度会胡说八道
    但是诊断结果是不会撒谎的
    所以症状只能是医生做什么检查的参考
    最终还是以仪器诊断为准
    murmur
        16
    murmur  
       2018-03-29 23:31:22 +08:00
    有句话说叫,内科怕发烧,外科怕腹痛,症状就摆在这,你的贝叶斯去诊断吧
    SorryChen
        17
    SorryChen  
       2018-03-30 00:05:39 +08:00 via iPhone
    @murmur 不是啊...我只是举了个贝叶斯诊断结核的例子...这是个很有名的例子啊……节点都是表示的类似去没去过亚洲,咳不咳嗽这种很明确的特征了,那你要说我咳嗽到要死我非给医生说我不咳嗽,那什么都不管用。这个诊断系统微软开发的人在国外比较知名了。
    327beckham
        18
    327beckham  
       2018-03-30 00:08:09 +08:00
    看一下最近的 kaggle 上正在进行中的 data science bowl 喽
    jowuIM
        19
    jowuIM  
       2018-03-30 00:35:25 +08:00
    一个医院的数据集太小了,你以为能做什么?不是大数据,不如 excel ?
    shoaly
        20
    shoaly  
       2018-03-30 07:51:42 +08:00
    可能 最有戏的就是 分析 CT 照片的图像了...
    murmur
        21
    murmur  
       2018-03-30 08:09:56 +08:00
    @SorryChen 知乎那个我是看了的
    根本不需要那么麻烦
    直接一个 DR 一个痰培养一个抽血就搞差不多了
    如果说为啥国内这几年才搞什么 AI 诊断 国外是因为诊疗成本太高 等的太慢才靠患者主诉搞什么贝叶斯诊断 国内不确诊一个痰培养做出来就完了么 还要那么多主诉干嘛

    真的国内 X 光太便宜了 抽血拍片一套搞定就 100 来块钱 一个 DR 片社区报销才七八十块钱 胜过千言万语
    贝叶斯这种东西也就停留在理论研究 在国内落地乘上患者巨大基数能把任何一个医院告破产
    有些东西永远是技术解决不了的
    一是检查是要花钱的 有些检查是小医院做不出来的
    二是某些诊断真的是金字指标 但是这些东西大多数都是创伤检查 比如穿刺活检
    三是某些病例即便是诊断出来了,你也无能为力,典型的就是癌症,太小了拍片拍不出来,等拍出来已经扩散了
    binux
        22
    binux  
       2018-03-30 08:10:15 +08:00
    @feverzsj 你把 (星期几+时间=>就诊人数) 扔给神经网络它也能训练出来的,我觉得和统计的没区别。神经网络会把结果记下来。。
    Felldeadbird
        23
    Felldeadbird  
       2018-03-30 08:19:03 +08:00 via iPhone   ❤️ 1
    可以分析季度流行病?
    ldd
        24
    ldd  
    OP
       2018-03-30 08:39:02 +08:00   ❤️ 1
    @murmur 纠正几个误区
    1.仪器是用来确定和排除病情的,具体的治疗方案和程度拿捏还是靠医生。
    2.跟据拍片结果做出诊断,除了和仪器精度有关,也和技师的知识库有很大关系。
    3.病人的主述是公认的确定病情的有效依据,更何况记录下的主诉都是医生再整理的,有一定的参考价值。
    4.癌细胞是由病理切片分析,不是拍片,初期就可以确认。
    omph
        25
    omph  
       2018-03-30 08:49:23 +08:00
    更适合用统计学吧,神经网络不是包打一切的
    murmur
        26
    murmur  
       2018-03-30 08:53:01 +08:00
    @ldd
    1、但是的却是高端仪器的普及让误诊率下降了不少,以前我在校医院做尿检就那么一个小纸条,现在密密麻麻能打满半张 B5 纸,当然有一部分是尿沉渣有一部分是镜检复查,不过的却首先,你得有仪器啊,尤其是几百万几千万的 CT MRI 不是想有就有的起的
    2、这个同意,但是我也怀疑
    3、靠谱的主诉当然有效,但是现代仪器检查能让肚子疼、发烧这些主诉落到具体某个病或者某些病上,尤其是对于表达能力有限或者查阅百度胡思乱想的患者
    4、同意,但是病理切片不是随便做的啊,有的可以穿刺有的要做术中病理,但是没有拍片检查哪里有上来就穿刺或者开刀的
    murmur
        27
    murmur  
       2018-03-30 08:53:47 +08:00
    @murmur 2 打漏了,我从来没质疑或者认为高端技师会失业
    green15
        28
    green15  
       2018-03-30 08:54:34 +08:00 via iPhone
    我知道的,IBM 和 Google 就是在做楼主说的这套东西……
    Len1133
        29
    Len1133  
       2018-03-30 09:06:54 +08:00   ❤️ 2
    识别处方上的汉字。。。算了,难度太大了
    ldd
        30
    ldd  
    OP
       2018-03-30 09:08:16 +08:00
    @Len1133 汗……现在都电子化了,都在电脑里录处方,用第三范式存储,我的数据库就包含这些
    ldd
        31
    ldd  
    OP
       2018-03-30 09:17:19 +08:00
    @Len1133 哈哈哈,刚看明白,玩笑啊。确实,难度太太太太大了。
    murmur
        32
    murmur  
       2018-03-30 09:28:37 +08:00   ❤️ 1
    有点水了 总结一下我认为可能落地的方面
    1、影像诊断,理由不说了,很多大厂也都在投资,不过这个对数据要求很高,我看一个文章说参加数据标注的都是高年资医生,确保图像清晰、标注准确、诊断无误,也就是要求每一个训练数据都做到金字指标的要求,这个怕是楼主做不到吧
    2、知识库,就是让医生不要忘记那种罕见病的可能性,不过现在怕是中小医院诊断不了直接让转大医院,因为就算诊断出罕见病也不好治疗
    3、罕见病、癌症、基因相关,这个也是楼主搞不了大厂加名医才能联合做的,常见病都有金字诊断指标,不需要什么 AI 只要检查到位可以几乎不误诊,但是癌症这个就难治了,有的诊断出来化疗甚至是进口药都不好使,所以国外一些机构貌似在研究基因和治疗效果的关系,这种没有成文的、需要探索的才是机器学习大显身手的地方
    barble
        33
    barble  
       2018-03-30 09:48:32 +08:00
    我觉得可以根据病人陈述去追溯一些不明原因的疾病的病因,比如川崎病、突发性耳聋等
    Morriaty
        34
    Morriaty  
       2018-03-30 10:08:28 +08:00
    楼主愿意分享下数据吗
    murmur
        35
    murmur  
       2018-03-30 10:24:13 +08:00
    @Livid 已经有人开始跟楼主要数据了 涉及隐私的还是先删一下吧 虽然楼主可能真是自用 但是不经允许使用患者数据总归不好
    php01
        36
    php01  
       2018-03-30 11:10:33 +08:00
    根据妇产科孕妇的 x 光片的各项指标值,配合产后婴儿性别做分析与筛选。最后要求得出结论,哪几项指标决定了胎儿的性别。凭借这个,财务自由没问题的。
    murmur
        37
    murmur  
       2018-03-30 11:13:29 +08:00
    @php01 这东西还用的到 AI b 超的是个医生都能看出来 这不是大陆法律禁止的问题还要机器学习干嘛
    或者不在大陆做 去香港做就行 不在香港很多小诊所都偷着可以做性别鉴定
    php01
        38
    php01  
       2018-03-30 11:20:03 +08:00
    @murmur 做个网站还能用 0 和 1 敲出来呢,只是每人这样做而已
    murmur
        39
    murmur  
       2018-03-30 11:22:42 +08:00
    @php01 在 V2EX 的讨论都要在法律允许的范围内进行
    awenxjtu
        40
    awenxjtu  
       2018-03-30 11:40:24 +08:00 via Android   ❤️ 1
    从病例入手,分析症状是哪些,比例多少,什么症状容易忽视导致恶果,用了什么药,效费比如何
    Phox
        41
    Phox  
       2018-03-30 11:58:19 +08:00   ❤️ 1
    可以帮助更多人,比如根据大数据分析年龄,体温,心跳,用药,等分析出未来一两天内晚上可能需要急救的病人
    Doodlister
        42
    Doodlister  
       2018-03-30 12:08:31 +08:00 via Android
    @Morriaty 违法的兄弟。
    murmur
        43
    murmur  
       2018-03-30 12:12:54 +08:00
    @Phox 未来需不需要急救在他入院的时候基本就知道了,还需要预测么
    另外不可能因为你预测出未来没有患者需要急救就给医生护士放假
    预测失败就是人命关天 成本太高了 没人敢用预测给急诊科或者重症科安排排班表
    hcymk2
        44
    hcymk2  
       2018-03-30 12:15:43 +08:00   ❤️ 1
    其实也先试下分诊辅助,这个风险最小。
    zhouyou457
        45
    zhouyou457  
       2018-03-30 12:39:01 +08:00 via iPhone   ❤️ 1
    流行病学统计?根据患者描述与检测报告,再加上患者的各类疾病的患病风险,给予医生辅助分析诊断,还可以提供医疗建议...
    easylee
        46
    easylee  
       2018-03-30 12:42:10 +08:00
    “ PS:数据不外给,请自重。”
    点赞👍!
    zeraba
        47
    zeraba  
       2018-03-30 12:43:51 +08:00 via Android   ❤️ 1
    优化诊断流程方面,医院可以想象成一个工厂,每个科室是一条流水线,它们公用了几个车间,分别是血常规,B 超之类的检验科,在资源有限的情况下,如果一个病人需要做多重检测,可以根据每种检测所需时间做个推荐,先去某某窗口做 A 检测,再去某某窗口做 B,做为一个病人不可能跑去不同的地方先去看看排队情况,他们也不了解每个检测的所需时间,这个可以帮助更快的诊断。当然还有很多思路,大体方向一个是提高总体营收,提升效率,另一个可以是减少成本,比如药品库存的控制等等
    zhaojjxvi
        48
    zhaojjxvi  
       2018-03-30 12:45:52 +08:00 via iPhone
    先考虑清楚这部分数据能不能用
    idler
        49
    idler  
       2018-03-30 13:25:26 +08:00   ❤️ 1
    外行好奇问一句,楼主将这些数据用于未知用途不用经过患者同意吗?还是已经经过同意了?因为我感觉这件事里,医院如同 Facebook,楼主如同 Cambridge Analytica。
    ayumilove
        50
    ayumilove  
       2018-03-30 13:25:46 +08:00   ❤️ 1
    对于公立三甲医院,HIS 当中 取得的数据,目前 大部分 还是被用于 医院评价科室 医保(自费)药品、器材比例 分析上。
    领导需要的 这些数据 基本用不到神经网络。
    ayumilove
        51
    ayumilove  
       2018-03-30 16:16:54 +08:00
    除了 AI 自动根据 PACS 影像诊断病情以外,
    以上提出的 功能 在 通过 HIMSS 7 级认证的 医院都基本具备。
    logOo
        52
    logOo  
       2018-03-30 16:21:07 +08:00
    我擦,感觉到了一丝丝恐惧啊,icloud 迁到贵州就被喷成那样,您这随随便便就生产数据了?
    XinLake
        53
    XinLake  
       2018-03-30 16:48:40 +08:00
    美图不是号称 AI 发现生病么。

    拿一堆疾病皮肤图片数据集训练,然后自拍图跑神经网络模型,看看能不能检测出疾病。
    csx163
        54
    csx163  
       2018-03-30 16:50:54 +08:00
    觉得这个帖子是违法的,而且不道德
    northisland
        55
    northisland  
       2018-03-30 16:54:56 +08:00
    依照年龄、生病部位、身体状况什么的,做个聚类

    然后,别人可以根据自己情况,查看自己的病得花多少钱,还有几年好活
    murmur
        56
    murmur  
       2018-03-30 16:56:23 +08:00
    @northisland 这就是预后么,你想问的话医生会告诉你的,干嘛要自己根据软件查自己寿命
    ss0xt
        57
    ss0xt  
       2018-03-30 17:07:23 +08:00
    楼主是医院内部信息科的人还是 HIS 厂商的实施人员??数据这么容易拿?
    banksiae
        58
    banksiae  
       2018-03-30 17:14:02 +08:00
    国内有个新兴公司,就是做你这个的,前几天好像刚拿到融资,利用 AI 手段给医生提供诊断支持,具体的名字一时想不起了
    lekai63
        59
    lekai63  
       2018-03-30 17:16:32 +08:00
    楼主可以帮忙解答一下关于数据合规性方面的问题么?
    可能会要给社区医院做一套慢病管理的解决方案,其中会涉及病人电子病历、数据的管理。本来是想加点有意思的元素:比如采用区块链相关技术,将数据存储于联盟链上。防止医院单方面修改,在医患关系中能以不能篡改的电子病历作为一项证据。
    ——————目前暂未实施————————
    有个问题就是,我作为系统开发商(即医院、病人、卫计委等之外的服务机构),是否可以存储该区块数据——相当于我第三方存了这些数据,不知道会不会违规。
    qinrui
        60
    qinrui  
       2018-03-30 17:18:04 +08:00 via iPhone
    病人特征交叉分析,比如发现某类病人具有某些特征,然后筛选出符合这个特征的尚未得病的人,进行风险预警。

    我手上也有一批数据,按人头算是千万规模,时间序列的数据有 10 亿条,也想分析出一些有价值的东西,但不知道用什么工具或者方法,求指导。
    lekai63
        61
    lekai63  
       2018-03-30 17:19:07 +08:00
    至于数据应用,你跟个内行的医生聊聊就会有很多可以实操的东西拉,比如:
    横向的:同一科室不同医生的诊疗流程、给药习惯可能存在比较大的差异。
    纵向的:同一医生多年来诊疗流程、给药习惯的变化、趋势等
    只是举个例子,可能进一步分析下去会有更多的发现哦~
    goodbest
        62
    goodbest  
       2018-03-30 17:20:25 +08:00 via iPhone
    医生手写处方识别…
    lekai63
        63
    lekai63  
       2018-03-30 17:30:25 +08:00
    by the way
    不知道楼主 base 何方,患者数据的分析(即隐去敏感的患者个人信息后),尤其是心血管方面的。如有机会,希望能聊聊看。我们有技术团队以及浙江省心血管领域的权威专家,比较关注医生在诊疗和给药过程中的行为数据,研究不同行为下给病患带来的影响。(比如诊疗步骤 ABCD,有的医生走 ABC,有的走 ACD。开的药也会不太一样。需要结合病症、愈后效果等交叉分析。)
    eric1202
        64
    eric1202  
       2018-03-30 17:31:44 +08:00
    医疗软件系统 是每个地区都不一样的吗?你们数据库怎么同步?
    evanvane
        65
    evanvane  
       2018-03-30 20:43:35 +08:00 via iPad
    作为医生,只想说你这种行为还是偷偷做的好,有点令我恶心。
    letitbesqzr
        66
    letitbesqzr  
       2018-04-01 00:49:36 +08:00
    请问医院有同意你使用这些数据进行分析了吗?
    chentydev
        67
    chentydev  
       2018-04-09 23:04:23 +08:00
    自助导诊和辅助诊断都不可行。相比于模糊的就诊数据,自助导诊更依赖于基于精确医学知识构建的规则树。医学影像的计算机辅助诊断确实会用到很多数学、计算机算法的东西,但是这块门槛也比较高,本身没有扎实数学功底又不懂医学的连入门都困难,更别说创新了。以前读书的时候影像科的老师给了一个基于小世界模型的脑部 CT 还是什么分析的文章,我表示作为普通工科学生读过之后完全看不懂里面的数学模型。
    单纯就这一堆数据而言,我觉得还是做做传统的数据可视化和基础统计分析比较靠谱,比如 XX 病种平均开销 17 年 X 元,18 年涨到 Y 元; XX 科室中药开得多; XX 科室自费病人多。这些数据就算强行弄弄预测什么的,也没什么实际意义啊。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2901 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 11:23 · PVG 19:23 · LAX 04:23 · JFK 07:23
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.