本科毕设主题是「网络谣言识别」,完全没有思路,有没有大神可以指点一下迷津,感激不尽

2019-03-09 09:14:58 +08:00
 yx1100

导师比较坑爹,只给了个这么个方向就了无音讯了。

目前的背景情况是:平时的课程「几乎没有」学习过相关的技术,大概只知道可能要用到 Python、机器学习相关的知识,但具体再细分的就不清楚了。

有个学长大概给了个思路:

  1. 拿一些现成的句子
  2. 使用机器学习中的 svm knn 还有优化后的算法进行训练
  3. 拿其他的句子进行比较分析准确率、召回率就好了

  1. 取一些常用的网络谣言
  2. 提取谣言的特征(语义的理解)对谣言进行分类(机器学习中较为常见的 svm 等)
  3. 使用你的优化的特征算法与传统的特征算法进行比较得出结论:你最好

然而我承认比较学渣,也没看的懂他说的意思。。。

所以想问的是,有没有大神指点一下,我这个学长他说的这个每个阶段,具体指的是什么?该做的是什么?比如他说谣言分类用 SVM,这个「分类」和「 SVM 」之间怎么联系起来?有没有什么「相关的推荐的书、视频、课程、论文之类的」可以阅读学习参考的?

说到底就是,我现在到底应该干什么😂,越具体越好。现在完全无从下手

如有帮助,万分感谢🙏

12214 次点击
所在节点    程序员
135 条回复
webfamer
2019-03-09 09:20:56 +08:00
我的毕设题是 基于模糊控制的智能油烟机.....
dangyuluo
2019-03-09 09:21:08 +08:00
```python
rumor_words=["彻底出名了", "恳请帮忙", "马上就删了", "危害更大", "剧毒", "最新!", ...]
for f in rumor_words:
if f in text:
return true
```
yangzhezjgs
2019-03-09 09:21:30 +08:00
先了解一下文本分类的概念,然后了解分词,文本向量化(word2vec 等),最后分类算法
《机器学习实战》第四章有个文本分类的例子,你可以学习一下,入个门
https://book.douban.com/subject/24703171/
greatx
2019-03-09 09:22:47 +08:00
为什么不在百度学术 /谷歌学术之类的网站搜一搜关键词,了解一下别人怎么做的。
yx1100
2019-03-09 09:26:15 +08:00
@yangzhezjgs 我在图书馆借了一本周志华的《机器学习》(那本西瓜书)。我简单翻了一下,那个是不是好像偏理论?你推荐的这个是偏实战操作的?

😂我现在就是时间不是很多了,所以想能直接上手做完就够了,没那么多时间从头再学了。

先谢谢你的帮助
swulling
2019-03-09 09:28:28 +08:00
机器学习什么时候能识别谣言了?随便做做吧…
yx1100
2019-03-09 09:28:35 +08:00
@greatx 搜过了,并不多。相关的论文期刊都是一些偏理论讨论的,都是些算法之类的。并没有具体怎么做的。我们导师的要求是要「基本」(通过率不做过高的要求)能实现这个功能,他也说了,目前这个方向研究的人并不是特别的多
xfcy
2019-03-09 09:29:32 +08:00
扒一下腾讯较真的 api (//∇//)
yangzhezjgs
2019-03-09 09:29:37 +08:00
@yx1100 是偏实际操作的,但是未必符合你的要求
necomancer
2019-03-09 09:29:39 +08:00
yx1100
2019-03-09 09:29:42 +08:00
@swulling emmm,我就是因为不太懂,所以只是大概了解一下「可能」是这个方向。如果我说的不对,还希望能指明一下
wobushizhangsan
2019-03-09 09:30:35 +08:00
前段时间看了一个谣言判断的,忘了是哪家的了。大概意思是看这个消息被哪些人转发过,有没有知名人士评论,如果有相关专业的知名人士给背书,大概率是真的。
lhx2008
2019-03-09 09:32:18 +08:00
就那么几种训练方法,主要是分词和词选择,人工打表估计准确率也不会低
clifftts
2019-03-09 09:34:00 +08:00
阿里达摩院不是出了一个谣言粉碎机嘛
zzj0311
2019-03-09 09:36:05 +08:00
这种反正肯定做不好的东西就 xjb 扯就对了
Tomotoes
2019-03-09 09:36:05 +08:00
很好奇,谣言中能有什么识别特征。。
xiaomimei
2019-03-09 09:39:03 +08:00
yx1100
2019-03-09 09:44:34 +08:00
@zzj0311 能扯都好了,我的开题报告直接被导师驳回了,说写的太少了,没有具体的计划,要至少 5 页纸。。。
yx1100
2019-03-09 09:48:36 +08:00
@necomancer 谢谢,我去看看先。英文的就是一是阅读理解有点麻烦,二是我下不了😂

不过还是先谢谢,我想想办法
yx1100
2019-03-09 09:53:06 +08:00
@clifftts 我导师要求的应该是要自己实现,这个现成的东西可能没办法直接用。

而且我 Google 了一下,也没查到这个东西具体是个什么😂

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/542718

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX