题目内容
(请给出正确答案)
[单选题]
Spark中DataFrame的()方法是进行分组查询。
A.orderby
B.groupby
C.selectby
D.sortby
查看答案
如果结果不匹配,请 联系老师 获取答案
A.orderby
B.groupby
C.selectby
D.sortby
A.Scala是一种多范式编程语言
B.Scala运行于Java平台,兼容现有的Java程序
C.Scala具备强大的并发性,支持函数式编程
D.Scala是Spark的主要编程语言,但Spark还支持Java、Python、R作为编程语言
B.Carbon使用轻量级压缩和重量级压缩的组合压缩算法压缩数据,可以减少60%-80%数据存储空间,大大节省硬件存储成本
C.Carbon是一种新型的ApacheHadoop本地文件格式,使用先进的列式存储.索引.压缩和编码技术,以提高计算效率,有助于加速超过PB数量级的数据查询,可用于更换的交互查询
D.Carbon也是一种将数据源与Spark集成的高性能分析引擎
A.NoSQL数据库因为不受schema的限制,可以获得比传统关系型数据库更好的读写性能,因此,所有应用都可以使用NoSQL数据库替代关系型数据库。
B.NoSQL数据库类型可以分为键值型NoSQL数据库,文档型NoSQL数据库,列存储型NoSQL数据库和图NoSQL数据库
C.Redis是单纯的内存数据库,不提供数据持久化功能,因此可靠性很低。
D.Spark分布式计算框架可以支持多种计算模式,包括批处理、流处理和SQL查询。
B、运行作业任务的工作节点Worker Node
C、每个应用的任务控制节点Driver
D、每个工作节点上负责具体任务的执行进程Executor