首页 > 职业鉴定考试

题目内容（请给出正确答案）

[单选题]

在spark中，以下关于dataframe描述，错误的是（)

A.dataframe是指定列名称的dataset

B.dataframe提供详细的结构信息

C.dataframe不是面向对象的

D.dataframe在序列化与反序列化时，要对数据和数据结构进行序列化

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“在spark中，以下关于dataframe描述，错误的是()”相关的问题

第1题

关于HIVE，以下说法不正确的是（）。

A.HIVE构建于HDFS和MapReduce之上

B.HIVE使用类SQL的HQL语言作为查询接口

C.HIVE的并行执行主要依赖MapReduce来实现

D.HIVE不能运行在Spark上

点击查看答案

第2题

以下关于FusionInsight中CarbonData说法正确的有？（）

A.使用Carbon的目的是对大数据即席查询提供超快速响应

B.Carbon使用轻量级压缩和重量级压缩的组合压缩算法压缩数据,可以减少60%-80%数据存储空间,大大节省硬件存储成本

C.Carbon是一种新型的ApacheHadoop本地文件格式,使用先进的列式存储.索引.压缩和编码技术,以提高计算效率,有助于加速超过PB数量级的数据查询,可用于更换的交互查询

D.Carbon也是一种将数据源与Spark集成的高性能分析引擎

点击查看答案

第3题

Sparkonyarn运行方式中，对Spark安装要求说法正确的是（)。

A.在Spark任务提交端，即应用服务器安装Spark即可

B.需要在集群各节点安装Spark才可以运行

C.不需在任何机器安装Spark

D.在NameNode上安装Spark

点击查看答案

第4题

一般情况下，对于迭代次数较多的应用程序，Spark程序在内存中的运行速度是HadoopMapReduce运行速度的（)多倍。

A.2

B.10

C.100

D.1000

点击查看答案

第5题

Spark中每一个RDD都可以用不同的存储级别进行保存，从而允许持久化数据集在硬盘或者在内存作为序列化的______对象。

点击查看答案

第6题

针对仅存储数据在内存中的存储策略，如果内存不足的话，Spark会使用______缓存策略清除最老的分区，为新的RDD提供空间。

点击查看答案

第7题

以下哪一种计算模型是不适合处理实时计算的？（)

A.Storm

B.MapReduce

C.Yarn

D.Spark

点击查看答案

第8题

以下哪个不是大数据时代新兴的技术（)？

A.HBase

B.Spark

C.Hadoop

D.Mysql

点击查看答案

第9题

以下哪项是Spark的架构核心部分（)。

A.RDD

B.Standalone

C.Mesoes

D.yarn

点击查看答案

第10题

下列关于Scala的说法正确的是（)。

A.Scala是一种多范式编程语言

B.Scala运行于Java平台，兼容现有的Java程序

C.Scala具备强大的并发性，支持函数式编程

D.Scala是Spark的主要编程语言，但Spark还支持Java、Python、R作为编程语言

点击查看答案

湖南拓肯信息安全技术有限公司版权所有 ©2024

湘ICP备19012461号-3 湘公安备案43019002002174号营业执照

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）