kex0916 最近的时间轴更新

kex0916

V2EX 第 238839 号会员，加入于 2017-07-05 14:48:46 +08:00

kex0916 提问技术话题好玩工作信息交易信息城市相关

根据 kex0916 的设置，主题列表被隐藏

二手交易相关的信息，包括已关闭的交易，不会被隐藏

kex0916 最近回复了

2020-08-24 17:15:43 +08:00

回复了 ysn2233 创建的主题 › Hadoop › Hadoop 读取 10 万个文件初始化过程很慢有方便的解决办法么？

把文件合并下，或者把读取文件过程拆分成多个任务跑，最后再 union 起来

2020-03-12 09:33:25 +08:00

回复了 ysn2233 创建的主题 › Hadoop › 有什么好的办法可以用 Flink/Spark 高效率并行处理大量大小不一的压缩数据

可以先将大文件解压缩后放到 hdfs 上后再做计算，或者可以试试 https://github.com/nielsbasjes/splittablegzip 这种

2019-11-11 11:25:44 +08:00

回复了 ccfoucs 创建的主题 › 推广 › 双十一🐶东购物超强省钱方案来了，这样做直接返现！

邀请码:nlb4o8

2019-04-23 13:54:19 +08:00

回复了 KOSKERS 创建的主题 › Scala › 请教下关于用 Flume+kafka+Spark 实现实时监控错误日志报警的功能

看官网吧，比较系统全面
http://spark.apache.org/docs/latest/structured-streaming-programming-guide.html
http://spark.apache.org/docs/latest/structured-streaming-kafka-integration.html

2019-04-18 10:10:38 +08:00

回复了 blackcurrant 创建的主题 › 程序员 › 上百亿个键值对使用什么数据库好？

hbase

2019-03-06 11:34:50 +08:00

回复了 PingCAP 创建的主题 › 酷工作 › 这些「神秘」团队到底是做什么的？| PingCAP 招聘季

@qiuyesuifeng 我看官网上大数据岗位在北京，成都有岗位吗?

2019-02-27 15:51:41 +08:00

回复了 leechow 创建的主题 › 成都 › 成都招银网络科技云平台（云计算）开发社招

@leechow 好的，谢谢

2019-02-25 15:00:01 +08:00

回复了 leechow 创建的主题 › 成都 › 成都招银网络科技云平台（云计算）开发社招

老哥可以帮推大数据的吗

2019-02-20 15:20:50 +08:00

回复了 casillasyi 创建的主题 › 程序员 › 最近在准备弃了 Java ，入 Clojure 的坑

可以试试 scala 瑟

2019-02-02 15:35:22 +08:00

回复了 qqq8724 创建的主题 › 问与答 › 问个 Spark 的问题,为什么 stage 没跑完,整个 job 就已经完了

你要找应用真正停止的原因，是正常执行完还是遇到了错误
ERROR scheduler.LiveListenerBus: SparkListenerBus has already stopped! 这个应该是 SparkContext 停止引起的，java.io.IOException: Broken pipe 这个要看看调用栈
数据的话你可以重新跑这个任务吗，计算一下条数什么的比较一下

» kex0916 创建的更多回复