V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  xxfye  ›  全部回复第 1 页 / 共 28 页
回复总数  559
1  2  3  4  5  6  7  8  9  10 ... 28  
1. hash
2. 加序号
3. 按照 hash 分区
4. 逐个处理分区
5. 分区内排序
6. 分区外归并排序

只有单机的话,可以考虑用 duckdb ,多机就用 spark 吧。
@drymonfidelia 看错了,还以为是 6GB 的 csv 文件在线处理呢,那确实不适合 duckdb 。

还是上 spark 吧,硬盘配大点就行。

203 亿行 csv 有那么大吗,我们每天备份全量的 17 亿行信息,保留几十天,用 orc 存储,也就几百 G 。
duckdb 值得拥有
@liyafe1997 对呀,客户当然有权利可以分发,但是红帽就终止合同,停止你获得后续的二进制和源码的机会。这个并没有限制你已经到手的源码和二进制的分发权利。因此不违背 gpl 协议。
gpl 规则是获得二进制的人,也能获得源码。
因此只要限制二进制的获得合同就行。
可以的,红帽就是这么干的。
你订阅 redhat ,我就给源码给你。但你一旦共享出去,咱们合同立刻取消。
实际上 redhat 不是带头这样干的,高通 MTK 博通英飞凌等等都有类似协议。

gpl 只需要遵守二进制的
@wuerbuzuo 建议直接锁死 win xp
你自己不升级固件,导致体验不佳。
升级了新固件后,体验大大好转。

然后结论是不想用中兴,中兴有坑?
国内巴不得不要密码,通通要指纹,手机号,人脸识别,掌纹,免密,虹膜,进行登录和付款。
@Aawhale 真删除数据还得看 google cloud ,前几天把澳大利亚的基金巨头的数据全删除了,多地机房,所有备份,都给 google 霍霍完了。
幸亏基金巨头自己做了多云备份,才免招 google 毒手。
25 天前
回复了 hubaq 创建的主题 互联网 RustDesk 由于诈骗猖獗,暂停国内服务
等等,为啥反诈要推到银行头上。
懂不懂什么叫存取款自由啊😅
26 天前
回复了 airchaoz 创建的主题 职场话题 大家是如何感知就业行情好坏的
我们是国企,基本上只招应届生...
所以只要看看今年招的人质量高不高就行。
比如 23 届质量真的是杠杠的,从来没有那么好过。
今年 24 届比不过 23 届,说明行情还是好了不少。
@drymonfidelia 越来越像博客园那篇文章了,好像也是高代对象的问题,你可以搜一下文章试试。
@drymonfidelia 那看起来就是高代现象的问题了。
1  2  3  4  5  6  7  8  9  10 ... 28  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   886 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 27ms · UTC 20:54 · PVG 04:54 · LAX 13:54 · JFK 16:54
Developed with CodeLauncher
♥ Do have faith in what you're doing.