B.Carbon使用轻量级压缩和重量级压缩的组合压缩算法压缩数据,可以减少60%-80%数据存储空间,大大节省硬件存储成本
C.Carbon是一种新型的ApacheHadoop本地文件格式,使用先进的列式存储.索引.压缩和编码技术,以提高计算效率,有助于加速超过PB数量级的数据查询,可用于更换的交互查询
D.Carbon也是一种将数据源与Spark集成的高性能分析引擎
A.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
B.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌Big Table的开源实现
C.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
D.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
A.能基于Atlas的Web页面查询用户的数据查询操作历史
B.能基于Atlas的Web页面浏览数据的血缘关系
C.能基于Atlas的Web页面标注元数据,为元数据分类
D.Atlas支持与Hive数据源的集成,可以实时获取Hive的元数据变化