题目内容
(请给出正确答案)
[单选题]
在spark中,以下关于dataframe描述,错误的是()
A.dataframe是指定列名称的dataset
B.dataframe提供详细的结构信息
C.dataframe不是面向对象的
D.dataframe在序列化与反序列化时,要对数据和数据结构进行序列化
查看答案
如果结果不匹配,请 联系老师 获取答案
A.dataframe是指定列名称的dataset
B.dataframe提供详细的结构信息
C.dataframe不是面向对象的
D.dataframe在序列化与反序列化时,要对数据和数据结构进行序列化
A.HIVE构建于HDFS和MapReduce之上
B.HIVE使用类SQL的HQL语言作为查询接口
C.HIVE的并行执行主要依赖MapReduce来实现
D.HIVE不能运行在Spark上
B.Carbon使用轻量级压缩和重量级压缩的组合压缩算法压缩数据,可以减少60%-80%数据存储空间,大大节省硬件存储成本
C.Carbon是一种新型的ApacheHadoop本地文件格式,使用先进的列式存储.索引.压缩和编码技术,以提高计算效率,有助于加速超过PB数量级的数据查询,可用于更换的交互查询
D.Carbon也是一种将数据源与Spark集成的高性能分析引擎
A.在Spark任务提交端,即应用服务器安装Spark即可
B.需要在集群各节点安装Spark才可以运行
C.不需在任何机器安装Spark
D.在NameNode上安装Spark
A.Scala是一种多范式编程语言
B.Scala运行于Java平台,兼容现有的Java程序
C.Scala具备强大的并发性,支持函数式编程
D.Scala是Spark的主要编程语言,但Spark还支持Java、Python、R作为编程语言