有没有这种智能的采集器?

2017-07-03 21:59:26 +08:00
 cjjia
假如我要从上市公司的财报里采集他们公司的贷款情况,但是这些公司财报风格各不相同,根本无法标记采集开始和结束,这种情况还能采集吗?

理想情况是把所有可能出现的“开始”词汇收集起来,比如“信用借贷”、“银行贷款”等等,然后收集这些词汇后面的数字,结束设定为出现非数字的就结束,没有数字就跳过,这样能做到吗?如果能,大概要多少钱?
1050 次点击
所在节点    问与答
2 条回复
qwjhb
2017-07-03 23:43:16 +08:00

不过上市公司财报风格不同但基本不太会变的吧 准确起见 还不如搭好框架 一家公司一家公司做模板
herozhang
2017-07-03 23:59:16 +08:00
有商业数据库,可以直接买这些数据啊,算是市场情报费用。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/372783

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX