Poplar - 基于 Web 技术的 NLP 文本标注工具

2018-08-25 17:03:43 +08:00
 grzhan

Poplar 是由我们 森亿智能 AI 团队自主研发的 NLP 文本标注工具。 基于内部版本的 NLP 标注系统已经稳定运行了两年,而这次经过了重新设计后以 GPLv3 协议开源。

文本标注的效果如下图:

这个工具的灵感主要来源于 brat ,而相对于 brat,poplar 采用了更加现代的 Web 技术进行开发,我们选用了 Typescript 作为开发语言,使用了 RxJSSvg.js 等库,同时借鉴了一些 FluxDDD 的思想,因此使项目在保证一定开发规范的前提下,达到了不错的实用效果。

欢迎有需要的同学使用我们的 demo 项目来解决一些简单的标注问题,也欢迎大家到我们的项目里提交 issue 或 star 来支持我们的项目。

18853 次点击
所在节点    自然语言处理
6 条回复
askfermi
2018-08-25 18:09:08 +08:00
我们做了 CV 的图像标注工具,感觉可以多交流一波:D https://github.com/unarxiv/cvtron
grzhan
2018-08-25 18:46:07 +08:00
@askfermi 感觉你们的工具完成度很高,非常厉害。
请问 unarxiv 大概是个什么形式的组织呢?
askfermi
2018-08-25 23:00:40 +08:00
@grzhan 还有很多地方有坑,希望能在明年 4 月份左右搞定:D

unarxiv 只是个(待定的)名字,因为这个项目还有学校的实验室和其他的公司参与,于是放在了一个独立的组织账号里。最终愿景是想做一个开源软件的基金会 /非盈利组织。
grzhan
2018-08-27 11:00:57 +08:00
@askfermi 原来如此,相对 NLP 标注感觉 CV 这块可能逻辑上会更复杂一些。期待你们工具的正式发布 :)
如果我们这边以后也开始接触 CV 的话,希望可以进行更多的交流
askfermi
2018-08-28 16:05:11 +08:00
@grzhan 是的,感觉 CV 的标注相对比较简单。如果您这边后面有需要的话,可以随时联系我:D
internetant
2019-07-19 10:53:21 +08:00
@grzhan hi,V 友,这个项目特别棒!我目前负责我们公司的数据采集、标注,也正在接触智能医疗这块,OCR、NLP、语义分割等项目 (我司: https://www.testin.cn/business/ai/index.htm ),看能不能沟通下?

应该有合作空间,可以加我微信:LinuxNews

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/483173

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX