yangxin0

yangxin0

V2EX 第 35131 号会员,加入于 2013-03-03 15:25:18 +08:00
今日活跃度排名 13188
根据 yangxin0 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
yangxin0 最近回复了
分治:
1 、用空间换时间(计算)
2 、用时间(计算)换空间

针对( 1 )有 spark 集群很快的,如果预算有限那么方法( 2 ):
1 、把数据分成 N 块,并针对 N 块内进行去重
2 、从 n 块中取一块,和剩下的 n-1 块去重,取这一块建立 hash or map 都可以,n-1 按照顺序读取
3 、从剩下的 n-1 块中又进行步骤( 2 ), 直到 n=0
4 、经过上述思路处理的 csv 就包含重复
我的 iPhone 贷款了 2 年,终于要还完了,抢首发其实真不好,等几个月真香。
Save As PDF and Annotate
最开心的还是刚毕业的时候,拿到工资吃吃喝喝
有孩子、没房贷、没车贷、没有任何消费欲望、以前还买 1k+的体恤现在优衣库新款一样拿一件。
73 天前
回复了 foru17 创建的主题 问与答 我的老婆确诊肺癌,希望能得到你的帮助
感谢
73 天前
回复了 foru17 创建的主题 问与答 我的老婆确诊肺癌,希望能得到你的帮助
老哥,看了你的帖子,我说实话被吓住了,回去就去医院检查肺结节。
all in AI 至少 4090 起步吧,你这个配置最多 all in AI 学习。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1095 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 23:21 · PVG 07:21 · LAX 16:21 · JFK 19:21
Developed with CodeLauncher
♥ Do have faith in what you're doing.