本科毕设主题是「网络谣言识别」,完全没有思路,有没有大神可以指点一下迷津,感激不尽

2019-03-09 09:14:58 +08:00
 yx1100

导师比较坑爹,只给了个这么个方向就了无音讯了。

目前的背景情况是:平时的课程「几乎没有」学习过相关的技术,大概只知道可能要用到 Python、机器学习相关的知识,但具体再细分的就不清楚了。

有个学长大概给了个思路:

  1. 拿一些现成的句子
  2. 使用机器学习中的 svm knn 还有优化后的算法进行训练
  3. 拿其他的句子进行比较分析准确率、召回率就好了

  1. 取一些常用的网络谣言
  2. 提取谣言的特征(语义的理解)对谣言进行分类(机器学习中较为常见的 svm 等)
  3. 使用你的优化的特征算法与传统的特征算法进行比较得出结论:你最好

然而我承认比较学渣,也没看的懂他说的意思。。。

所以想问的是,有没有大神指点一下,我这个学长他说的这个每个阶段,具体指的是什么?该做的是什么?比如他说谣言分类用 SVM,这个「分类」和「 SVM 」之间怎么联系起来?有没有什么「相关的推荐的书、视频、课程、论文之类的」可以阅读学习参考的?

说到底就是,我现在到底应该干什么😂,越具体越好。现在完全无从下手

如有帮助,万分感谢🙏

13541 次点击
所在节点    程序员
135 条回复
SsuchingYu
2019-03-09 16:48:20 +08:00
@murmur #99 弱弱地问一下,新京报散播过啥谣言?
murmur
2019-03-09 16:49:24 +08:00
@SsuchingYu 搜索引擎搜 新京报 造谣
SsuchingYu
2019-03-09 16:53:46 +08:00
@murmur #102 100% 理中客是不可能的。
Aixtuz
2019-03-09 16:54:23 +08:00
又仔细看了下问题和回复,也如以上大多观点:
对某一条信息的语言逻辑进行谣言判定,暂时想不到什么可行方案。

对传播特点判定可能性,对大量数据归类特征,准确率终究也是个问题。
zkwang
2019-03-09 16:56:14 +08:00
须了解,没有辟谣的事情未必是真的
taobibi
2019-03-09 16:56:37 +08:00
现在不是有征信机制吗?好像可以购买个人征信的接口,然后把征信低的,提升谣言比例。然后在学习判定
murmur
2019-03-09 16:57:13 +08:00
@SsuchingYu 现在谣言都升级了,太弱智的谣言一看就被看出来,早就没有这种的东西,只有朋友圈才会有这种低等谣言
paopaotangdong
2019-03-09 17:02:22 +08:00
谣言用机器学习分类( svm。。。等)是不可能做出来的,特征也没有用,谣言的传播路径、传播时间特性、传播者行为特征和非谣言的这些特征完全一样(仔细想想是不是)。 标题党不一定是谣言,不是标题党也不能说明他正确,
jssyxzy
2019-03-09 17:06:08 +08:00
ls 我觉得关注点不太对,
关注点应该是写一篇“网络谣言识别”的论文,而不是“网络谣言识别”本身,
你指望一个本科毕业的人能解决这个大问题,是不可能的。
incompatible
2019-03-09 17:17:33 +08:00
光看主贴的话,我觉得这个不太难,做一个贝叶斯分类器,然后用已有的谣言去训练它就好了。这个对于本科毕设来说是难度适中的。

看到你的补充,我觉得你的导师很可能是个水货,然后他在网上看了 “阿里巴巴达摩院造个“神器” 谣言识别准确率 81%”之类的新闻就灵机一动想到一个通过传播路径判断谣言的点子。阿里巴巴有资源干这个,你导师一个高校教师自己有没有资源支持学生干这个难道心里没点数吗。。。。
evagreenworking
2019-03-09 18:11:35 +08:00
"网络安全空间"都出来了, 你导师看来学习 app 积分很高啊。
winglight2016
2019-03-09 18:29:46 +08:00
lz,就冲你看不懂师兄给的建议来说,这题目你做不了,早点考虑怎么外包出去吧
metrxqin
2019-03-09 18:56:50 +08:00
很简单,谣言的必要条件是没有**来源注明**。 如果有来源注明,在根据来源的权重来判断可信度,判定是否为谣言。
metrxqin
2019-03-09 18:57:53 +08:00
可以参考谷歌或者 Facebook 打击假新闻的解决思路。
DAPTX4869
2019-03-09 19:33:59 +08:00
这玩意的难度是本科生能干的吗。。。
zheyu
2019-03-09 19:53:51 +08:00
传播路径的话可以看看 social network 相关的论文?我也不懂,随口说说。
ftdx112
2019-03-09 20:08:37 +08:00
外行表示好高大上。。。但咋感觉一个语义分析的东西变成了一个标签匹配的东西
w2er
2019-03-09 20:17:16 +08:00
这个题目简直前途不可限量。不过呢,如果宽泛说谣言两个字怕是有点难。。不如考虑一下某个细分领域的或者某个特定媒体的,会不会好一些呢
bilibilifi
2019-03-09 20:17:21 +08:00
这个成果我觉得至少图灵奖级别的吧,可靠地判断任意谓词逻辑的真值
Heyavc
2019-03-09 21:11:37 +08:00
这个项目阿里达摩院里有,叫 AI 谣言粉碎机还参加了比赛。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/542718

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX