怎么用 Python 抓取上市公司的财务数据呢

2020-07-29 23:11:15 +08:00
 iwukong
怎么用 python 抓取上市公司的财务数据呢

我想抓取港股 美股的

港股是 PDF 美国是 HTM
5986 次点击
所在节点    Python
25 条回复
hakono
2020-07-30 11:44:42 +08:00
@relic 只是爬虫爬一下的话的确简单,但是分析的话你自己都做过,有多少坑你也应该是知道的。
你说 90%差不多,但是实际上是在这 90%差不多的公司里,会影响到整个财报评价的关键数据内容都会有所不同(上市公司为了财报好看,明显的数据都是会搞的比较好看。而真正能代表真实财务数据的部分,可能就会在哪个旮旯角落用些小字注释下,或者用一般人都想不到的说法给说出来,目的就是不让你注意到,这种只有有看财报经验的人才可能注意到)
以及,也欢迎来日股财报玩玩,能让你怀疑人生
财报这种东西真的想了半天,想做出个精确提取的话得要上 AI
zzzmh
2020-07-30 12:02:51 +08:00
如果花钱走捷径的话,可以去找找别人爬然后出来卖 api 的项目。我见过一两个但觉得贵又怕不追就没深入了解。
lewis89
2020-07-30 13:32:57 +08:00
@hakono 只能说套路太多,实际上真正要了解一家公司 ,财报很难反应出来的,例如上市公司持有的非上市公司股票,但是非上市公司不公布财报,你怎么界定上市公司所持有股份的价值,还有折旧率润色 把货卖给经销商 虚报营业额跟利润,套路简直太多..
iwukong
2020-07-30 13:33:38 +08:00
@hakono 我们先把现在数据抓取下来 再说财务美化问题 这个就是个人来处理了
zxcfka2004
2020-07-30 16:37:10 +08:00
抓股票 app 的接口,或者东财网站

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/694172

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX