第1题
A.Map/Reduce把待处理的数据集分割成许多大的数据块
B.大数据块经Map()函数并行处理后输出新的中间结果
C.reduce()函数把多任务处理后的中间结果进行汇总
D.reduce阶段的作用接受来自输出列表的迭代器
第5题
A.支持计算在内存中进行,中间结果不落地
B.支持Map后连续任意多个Reduce操作
C.可以在上一次的reduce结束之后,直接增加一次map
D.从Map直接到Reduce,省去Shuffle阶段
第6题
关于Hadoop Map Reduce,以下描述中正确的是()。
A.reduce()函数的输入是value集
B.reduce()函数将最终结果写到HDFS系统中
C.用户可以自己定义reduce()函数
D.reduce()函数的输入数据是经过map()函数处理之后的数据
第8题
A.合并value值,形成较小集合
B.采用迭代器将中间值提供给reduce函数
C.map()函数处理后结果才会传输给reduce()
D.内存中不会存储大量的value值
第9题
A.600600
B.3000600
C.3000300
D.300300
第10题
Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎,将Job中间输出结果可以保存在()中,从而不再需要读写HDFS。因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的Map Reduce的算法。