liucudliucud 最近的时间轴更新
liucudliucud

liucudliucud

V2EX 第 302509 号会员,加入于 2018-03-22 16:45:16 +08:00
liucudliucud 最近回复了
2018-04-15 17:47:30 +08:00
回复了 unboy 创建的主题 问与答 1000 万行文本数据如何做筛选?
传到集群上用任务搞,9 亿行都没问题
2018-04-10 20:36:01 +08:00
回复了 luozhiyun 创建的主题 程序员 程序员选 x1c 2018 还是 macbook pro
无脑 mbp,根本不用想
上海沙龙吧,去哪都比较方便
滴滴巨坑,慎重
搭建一个 hadoop 集群
2018-03-30 08:56:53 +08:00
回复了 anonymoustian 创建的主题 Hadoop Spark 如何将一个 RDD 分成多个 RDD?
拆 rdd 这种一个两个还可以,多了效率很低的,强行串行了
2018-03-30 08:55:46 +08:00
回复了 anonymoustian 创建的主题 Hadoop Spark 如何将一个 RDD 分成多个 RDD?
把数据 flatten 再详细写 reduce 方法呗
可以详细说下需求
类似于 name type score
2018-03-29 23:19:08 +08:00
回复了 anonymoustian 创建的主题 Hadoop Spark 如何将一个 RDD 分成多个 RDD?
不用拆,放在一起处理
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4960 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 57ms · UTC 09:50 · PVG 17:50 · LAX 01:50 · JFK 04:50
Developed with CodeLauncher
♥ Do have faith in what you're doing.