[小论文神器] 基于 30w 文献数据的论文自动生成工具,设置主题、文风与字数即可,段落可无限更新

2020-02-06 21:34:20 +08:00
 n3r0

迭代了一个多月,目前对常见类目的文章生成效果较好。对大量数据进行了一些简单的机器学习和过滤,主要是通过题目和关键词来匹配段落。

使用非常简单,设定参数三步生成,然后针对段落进行调整到满意为止。

图 1:设定参数

图 2:调整段落(底下一排圆形按钮为 切换,更新,增减当前段落)

一些特性:

欢迎使用!

连接:小论文神器

推荐给各位的同时,也想探讨一个问题:论文的自动生成可以走什么样的思路?是否可以把文章结构抽出来,只要给予核心的思想,就能生成格式和内容上都可行的文章。有些人或许有想法,但不擅于写文章。后面我想逐渐向这方面靠拢,毕竟以目前的方法,优化再好也只能是个参考。

Thx

8470 次点击
所在节点    分享创造
26 条回复
easylee
2020-02-06 21:57:21 +08:00
n3r0
2020-02-06 22:04:06 +08:00
@easylee 这种情况,一般是某些关键词匹配到的数据没有优化好🤦‍♂️可以重新生成试试,或者替换相关段落。

数据量太大,过滤了好多遍还是有漏网之鱼,头痛啊。
sevenQu
2020-02-07 11:47:07 +08:00
太狠了,我收藏了,其实我觉得可以换一个思路,不一定要直接生成全文。按更细的粒度需求生成文章的某个段落,我觉得就挺好,省的自己去想这段套话怎么写,哈哈
cxsz
2020-02-07 11:52:11 +08:00
挺好玩的,支持一下
n3r0
2020-02-07 13:21:10 +08:00
@sevenQu 有道理,目前整篇文章就是按段落为单位生成的,只是还没有具体做一些区分,后面应该可以把正文再分成几个部分,然后按套路生成😁
mosbic
2020-02-08 16:59:36 +08:00
可以开始编了(^-^)V
hhxiaolei
2020-02-08 18:39:22 +08:00
能否开放 api?
n3r0
2020-02-08 20:20:11 +08:00
@hhxiaolei 目前还不行,一是考虑到自己服务器可能支撑不了,二是目前的数据整理的太乱🤣放出去有点丢人,还在进一步的优化当中。日后如果效果比较稳定了,可以开放一些高级接口,直接获取相关的段落。
n3r0
2020-02-08 20:21:21 +08:00
@mosbic 会努力让它编的越来越好😝
hhxiaolei
2020-02-08 20:55:39 +08:00
@n3r0 怎么联系您
n3r0
2020-02-08 21:57:44 +08:00
@hhxiaolei 网站的菜单,关于作者,里面有工作邮箱。抱歉不想留在公共场合,容易被爬虫广告邮件骚扰🤣
luo7
2020-02-09 02:37:06 +08:00
我的天啊这真的是神器
Dreax
2020-02-09 04:51:08 +08:00
tql
dick20cm
2020-02-09 22:04:03 +08:00
楼主挺厉害的,我记得几年前听说亚研院有做过类似工作,但可能因为各种原因并没有变成真正的产品
n3r0
2020-02-10 09:29:10 +08:00
@dick20cm 之前我只查到过 MIT 有做过英文假论文的生成,这个倒是不清楚,回去了解一下,感谢😁
我觉得对真正的产品考验最大的,应该还是通用性,单一类目的生成还是比较容易的。
tfdetang
2020-02-10 10:41:53 +08:00
楼主可以说下思路吗? 是基于 gpt-2 训练的吗?
n3r0
2020-02-10 13:09:20 +08:00
@tfdetang 不是。目前的效果还不够理想,等优化的差不多了可以放出来交流一下🤦‍♀️
现在只能说是,“人工”的部分还大于“智能”🤣
tfdetang
2020-02-10 16:09:14 +08:00
@n3r0 好的啊,到时可以交流下。 其实 NLP 的东西,都是先人工再智能的。 一上来就智能的除非 PPT
cainiuwow
2020-02-10 22:14:13 +08:00
哈哈,挺有意思的,刚试了一下,根据手里的诉讼案件,整理了几个关键词,然后生成论文,节省了一部分找资料的时间。
粗略看了一下,有些内容还是可以直接作为论述观点的。nice~
n3r0
2020-02-11 09:40:36 +08:00
@cainiuwow 能帮上忙就太好了😁一度因为它直接生成的效果不稳定打算放弃,后面还是加了个段落替换功能,感觉做个参考还可以。现在每天小几百人访问,也挺有成就感的,哈哈。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/642632

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX