题目内容
(请给出正确答案)
[单选题]
Hadoop生态系统中,()主要解决的是日志类数据的收集和处理问题。
A.Mahout
B.Flume
C.Sqoop
D.HBase
查看答案
如果结果不匹配,请 联系老师 获取答案
A.Mahout
B.Flume
C.Sqoop
D.HBase
A.Hive是基于Hadoop的数据仓库工具
B.Hive可以将结构化的数据文件映射为一张数据库表
C.最初,Hive由Google开源,用于解决海量结构化日志数据统计问题
D.Hive的主要应用场景是离线分析
A.TextInputFormat
B.KeyValueInputFormat
C.SequenceFileInputFormat
D.以上都不对
A.Spark引进了弹性分布式数据集RDD(ResilientDistributedDataset)的抽象,容错性高
B.Spark提供的数据集操作类型不仅限于Map和Reduce,大致分为:Transformations和Actions两大类
C.Spark程序由Python语言进行编写,不支持Java语言进行的程序编写
D.Spark把中间数据放到内存中,迭代运算效率高