想问一道 Java 面试题,关于数据处理

2022 年 11 月 19 日
 NeilMaster

具体的题目内容是: 有 1TB 的数据,一秒钟只能处理 1MB ,问如何 10 内处理完

求助,各位大佬。谢谢啦

3359 次点击
所在节点    程序员
16 条回复
NeilMaster
2022 年 11 月 19 日
第一次用 V2EX ,少打了一个,要求是 10 秒内处理完这个大数据文件
dqzcwxb
2022 年 11 月 19 日
104857.6 个线程并行
v2eb
2022 年 11 月 19 日
比我移动硬盘复制快
ruanimal
2022 年 11 月 19 日
什么硬盘 1s 能读 100G ?
cctv6
2022 年 11 月 19 日
如果这个处理指的是”删除文件“,并且一秒只能删除 1MB

所以 格式化磁盘 / 删除分区,10 秒应该够了:)
liangkang1436
2022 年 11 月 19 日
10s 处理 1TB 的数据?我想问问现在有什么硬件架构能做到这一点
kkkkkrua
2022 年 11 月 19 日
确定是面试官说清楚了吗?
你反问他,一秒钟吃 1 粒米,怎么在 10 秒吃完一桶饭
EarthChild
2022 年 11 月 19 日
@kkkkkrua 哈哈哈把他头砍了,往里倒
knightdf
2022 年 11 月 20 日
这问题跟 java 没关系吧,我把 1TB 数据分成 N 份 1MB 数据然后用 N 个机器 1 秒就能处理完,沙雕问题
NeilMaster
2022 年 11 月 20 日
@kkkkkrua 哈哈,我在准备一家公司面试,我在网上找到往期的面试题目。 我也是对这个题目很疑惑才来求问的, 目前来说很多人的建议就是开多个线程并行解决问题。
NeilMaster
2022 年 11 月 20 日
@ruanimal 要走内存吧。我觉得
NeilMaster
2022 年 11 月 20 日
@liangkang1436 我也不懂。。
mortalbibo
2022 年 11 月 20 日
大规模分布式处理呗, 又没说限制机器数量[doge]
NeilMaster
2022 年 11 月 20 日
@mortalbibo 嗯,谢谢指导,因该就是分布式处理
blankmiss
2022 年 11 月 20 日
@knightdf 那硬盘不会卡 io 吗
dog82
2022 年 11 月 21 日
脑残问题,就是空间换时间,哪有那么多玄学
bthulu
2022 年 11 月 21 日
数据跟数据之间是互相独立的, 不用管前后因果关系的吗? 那就简单了, 阿里云临时申请 100 台 128 核心的按量付费的机器, 再建一条 100GB/S 的光纤专线到阿里机房, 把这 1TB 数据拆成 100 分发到这 100 台机器上处理就好了.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/896472

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX