想问一道 Java 面试题,关于数据处理

2022-11-19 19:57:08 +08:00
 NeilMaster

具体的题目内容是: 有 1TB 的数据,一秒钟只能处理 1MB ,问如何 10 内处理完

求助,各位大佬。谢谢啦

2617 次点击
所在节点    程序员
16 条回复
NeilMaster
2022-11-19 19:58:57 +08:00
第一次用 V2EX ,少打了一个,要求是 10 秒内处理完这个大数据文件
dqzcwxb
2022-11-19 20:54:13 +08:00
104857.6 个线程并行
v2eb
2022-11-19 22:02:54 +08:00
比我移动硬盘复制快
ruanimal
2022-11-19 22:08:55 +08:00
什么硬盘 1s 能读 100G ?
cdlnls
2022-11-19 22:13:01 +08:00
如果这个处理指的是”删除文件“,并且一秒只能删除 1MB

所以 格式化磁盘 / 删除分区,10 秒应该够了:)
liangkang1436
2022-11-19 23:06:20 +08:00
10s 处理 1TB 的数据?我想问问现在有什么硬件架构能做到这一点
kkkkkrua
2022-11-19 23:10:30 +08:00
确定是面试官说清楚了吗?
你反问他,一秒钟吃 1 粒米,怎么在 10 秒吃完一桶饭
EarthChild
2022-11-19 23:31:01 +08:00
@kkkkkrua 哈哈哈把他头砍了,往里倒
knightdf
2022-11-20 00:12:32 +08:00
这问题跟 java 没关系吧,我把 1TB 数据分成 N 份 1MB 数据然后用 N 个机器 1 秒就能处理完,沙雕问题
NeilMaster
2022-11-20 07:46:42 +08:00
@kkkkkrua 哈哈,我在准备一家公司面试,我在网上找到往期的面试题目。 我也是对这个题目很疑惑才来求问的, 目前来说很多人的建议就是开多个线程并行解决问题。
NeilMaster
2022-11-20 07:47:41 +08:00
@ruanimal 要走内存吧。我觉得
NeilMaster
2022-11-20 07:48:34 +08:00
@liangkang1436 我也不懂。。
mortalbibo
2022-11-20 09:07:04 +08:00
大规模分布式处理呗, 又没说限制机器数量[doge]
NeilMaster
2022-11-20 10:15:37 +08:00
@mortalbibo 嗯,谢谢指导,因该就是分布式处理
blankmiss
2022-11-20 17:52:35 +08:00
@knightdf 那硬盘不会卡 io 吗
dog82
2022-11-21 11:32:17 +08:00
脑残问题,就是空间换时间,哪有那么多玄学
bthulu
2022-11-21 14:22:25 +08:00
数据跟数据之间是互相独立的, 不用管前后因果关系的吗? 那就简单了, 阿里云临时申请 100 台 128 核心的按量付费的机器, 再建一条 100GB/S 的光纤专线到阿里机房, 把这 1TB 数据拆成 100 分发到这 100 台机器上处理就好了.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/896472

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX