最近沉迷股市,请问 600G 的文本 tick 数据,用什么数据库存储性价比更高?

2014-10-21 11:03:19 +08:00
 lu18887
我只有两台PC,VPS的CPU和内存比较小(用大的不划算,网络延迟也比较难受),这些数据打算存储起来然后进行一些计算分析,用什么样的方案比较合适?
14476 次点击
所在节点    程序员
79 条回复
barbery
2014-10-21 12:22:47 +08:00
lz,是日K线数据吗?
zhangshine
2014-10-21 12:30:49 +08:00
tick数据搞成日k或4小时就好了,大大减少数据了而且tick数据也没有什么用,怎么着也要4小时以上周期吧
lu18887
2014-10-21 12:37:38 +08:00
@royzheng 自用,先把数据存起来,后面再慢慢找算法选股。就是这样
lu18887
2014-10-21 12:38:14 +08:00
@zhangshine 有些算法需要更精确的数据,4个小时太粗了。跟日K没太大区别了
lu18887
2014-10-21 12:39:24 +08:00
@aru 这是必须的,两个维度,股票代码维度和时间线维度。
lu18887
2014-10-21 12:39:48 +08:00
@qichunren 暂时分析的算法没想好,先把数据存储起来再说。
lu18887
2014-10-21 12:42:06 +08:00
某天某股票的数据样例如下

时间 价格 价格变动 成交量(手) 成交额(园) 买卖性质
09:25:00 11.56 0.02 498 575688 买盘
09:30:03 11.56 0.00 352 407128 买盘
@barbery
lu18887
2014-10-21 12:43:19 +08:00
@mulog 股票太多,想选出好的。
eriale
2014-10-21 12:46:25 +08:00
挑战A股,是真的勇士。
merlin852
2014-10-21 12:50:13 +08:00
沪深 tickdata 每交易日数据量大概1-2G,每年差不多300G,你这两三年的量?
我们是直接oracle处理,也还好,我们算法不复杂
建议用MonetDB,Sybase, DB2等列式数据库处理,可能速度上会好点
lu18887
2014-10-21 12:53:13 +08:00
@merlin852 我拿到的数据是免费的,没你的详细……
关于容量,122M,是昨天拿到的大小……我根据这个估算的2000年到2014年总计,是个初略估计。
我拿到的数据是没有挂买盘和挂卖盘的数据的,只有时间,成交价格,笔数,金额以及买盘性质。



@eriale

我想明白了,挑战A股不敢说,挑战下自己是真的、
ven
2014-10-21 13:10:10 +08:00
数据分析,应该在国外市场下手吧,国内的太诡异了
lu18887
2014-10-21 13:13:25 +08:00
@ven 国外的分析了也好买,没利益驱动……
hntee
2014-10-21 13:14:35 +08:00
楼主可以分享一下数据或者抓数据的脚本嘛?
aru
2014-10-21 13:14:57 +08:00
很推荐用mysql的myisam 表来存储
em70
2014-10-21 13:26:35 +08:00
长期来看,股票年收益超过10%就很不错了,这年头几十倍,上百倍的资产增值只能在科技创业圈出现
imn1
2014-10-21 13:34:06 +08:00
一般股票计算很少需要联动,顶多就是指数和个股联动分析,所以循这个思路分表就足够了

当然不排除你有很高深的能力,或者内部消息,能够探测某些个股之间存在联动关系,那这个数据结构就相对复杂了
mahone3297
2014-10-21 13:39:15 +08:00
lz哪里抓的数据?
soulteary
2014-10-21 13:51:09 +08:00
@mulog 这回答好机智。


@lu18887 实时性似乎没有要求的话,mysql似乎问题也不大,又不是一只股票数据那么多...如果愿意买硬盘,可以考虑用mongo,当天的数据可以直接对象形式存redis中。

另外,可能直接存文件或者csv也是不错的方案,(如果大量点数据,以年月日分层级建立目录的话,请上块至少128g的ssd把近期数据从机械上挪过来)
WildCat
2014-10-21 13:57:20 +08:00
算法分析国内数据也是醉了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/140441

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX