第 13 期-在线的文章摘要生成器, 自己写了一个支持中文的

2020-02-15 16:51:05 +08:00
 zixiao233

大家可能还记得我写的第 12 期-在线的文章摘要生成器,使用 NLP 生成简介

在那篇文章里我们介绍了一款通过 NLP 分析文章,自动生成摘要的一个小工具。

当时我就说这个玩意,还是很实用的,于是就上手自己撸了一个支持中文生成文章摘要的生成器。访问地址http://zhaiyao.xiezuoguan.cn/ 效果还可以,我找一篇腾讯网的新闻报道来给大家试验一下,报道为《无聊催生的一次狂欢:云蹦迪、云睡觉,虚火一场?》

经过我们的自动生成器,将内容概括如下

博主“谁家的圆三”也意外掀起了一场互联网的狂欢,带起睡觉直播的风潮,人气最旺的一晚,一共有 1850 万用 户围观他睡觉。

1 月 9 日开始,每天 5 小时,连续三天“云蹦迪”直播后,北京知名夜店 ONE THIRD 在抖音赚到了 332.36 万打赏,单日超过 100 万元,直播首日收看人数就已破百万。博主“谁家的圆三”也意外掀起了一场互联网的狂欢,带起睡觉直播的风潮,人气最旺的一晚,一共有 1850 万用户围观他睡觉。

从我个人的使用效果来看,效果并非完全令人满意,最好还是有人为介入来二次加工一下。二是现在文字阅读内容质量堪忧,自从自媒体开始兴起,每天网上产生的都是大量的文字垃圾,大部分人更是失去了对于 1000 字长文以上的阅读能力。篇篇都是几百字的小文章根本没什么好办法生成 120 字内的摘要概括啊。

另一方面流量也越来越便宜,人们的文字阅读兴趣更是被图片和短视频瓜分掉了。我自己试用这个工具时,去腾讯网上翻了很多篇新闻,结果三分之一是以图片为主,图片中有零散文字(确实排版会更精美,信息量也足够),另外三分之一都是不超过 1000 字的短篇。剩下的三分之一里面,还被视频给占据了一部分,只有极少数的文章能写到 1000 字以上用这个工具来好好概括了。

技术方案

难度系数 ⭐ 我这边是用 python 写的,参考了网上的一些方案。部署时本来打算探索一下新东西用一下腾讯云的云函数和 api 网关,结果折腾了半天好麻烦啊,最终还是部署在了服务器里。 前端我不擅长,做的特别丑,能用就行吧。

我们可以怎么做:

上次提到的,Chrome 插件这个需求还可以做。

另外我还发现,如果以后大家倾向于视频内容,不如做一个能够支持视频自动摘要的工具。但是这个就很难了,随口一说,短期内应该还是人力才能解决的工作。

2221 次点击
所在节点    分享创造
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/644820

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX