GitHub 十周岁 HanLP 自然语言处理包用户量超越 CoreNLP

2018-10-10 17:27:11 +08:00
 shuyun008

GitHub 十周岁 HanLP 自然语言处理包用户量超越 CoreNLP

在本周,GitHub 终于度过了属于它自己的十周岁生日。这个在 2008 年由 3 个来自旧金山的年轻人创建的基于 Git 的代码托管网站,先后超越了元老级的 SourceForge 和背景强大的 Google Code,成为了全世界范围内最受欢迎的代码托管网站。

“十年前的今天,GitHub 正式上线。最一开始,我们只有一个特别简单的目标:链接所有的开发者,让他们用 Git 更轻松地进行项目协作。”联合创始人 Chris Wanstrath 在博客里写道,“十年过去了,我们作为公司,作为平台都有了很大的变化,但 GitHub 存在的意义从未改变。” 截至到去年 5 月底,GitHub 完成了第 1 亿个 PR 合并请求命令。截至今天,GitHub 上已经能够拥有超过 8000 万个 repo,活跃用户达到 2700 万人,超过 150 万家公司和机构进驻。大快搜索的 HanLp 自然语言处理开源项目同样进驻了 GitHub。 GitHub 团队作为对十周年的纪念和庆祝,并没有像大多数公司一样选择回顾公司的发展历史,而是整理了一份过去十年的几大里程碑事件。这份光荣,不止属于平台自己,更是属于那些为了让这个世界变得更好,通过 Git、GitHub、用 JS、Python 和各种语言共享代码的人们。 在 GitHub 十周年之际,大快搜索 AI 研究小组的,自然语言处理专家 Hancks 所主持的 HanLP 开源项目,全球用户量首次超过了斯坦福大学的 CoreNLP,以及老牌的自然语言处理开包 Ansj,成为全球范围内最受开发人员喜爱的自然语言处理技术。

自 2014 年首次发布,通过 3 年的不断迭代,HanLP 的分词准确性和分词速率得到了极大的提升。据阿里杨尚川的一份测评报告显示,HanLP 的分次准确率在全球排名第三,分词速度在全球排名第一。卓越的性能自然带来了大量的使用者。终于,在太平洋时间 10 月 25 日,GitHub 上 HanLP 的用户量超过 Stanford-CoreNLP。

自然语言处理是人工智能的一个重要分支,HanLP 的用户量证明了国产技术的高性能与可靠性,也再一次证明了大快搜索用心做技术、专注于大数据与人工智能基础软件的决心。大快今后也将开发出更多组件用于建设大数据与人工智能生态,绘出人工智能与大数据的中国智慧。

937 次点击
所在节点   2018
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/496409

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX