一家公司希望通过日期范围和在AWS上运行的自定义应用程序来分析日志数据.该应用程序每天产生大约10GB的数据,并且有望增长.解决方案架构师的任务是将数据存储在AmazonS3中,并使用Amazon Athena分析数据.哪个步骤的组合将确保随着数据的增长而获得最佳性能(选择两个.)()
A.将每个对象存储在Amazon S3中,每个键的前面都有一个随机字符串
B.将数据存储在多个S3存储桶中
C.将数据以列格式(例如Apache Parquet或Apache ORC)存储在Amazon S3中
D.将数据存储在小于10 MB的对象中的Amazon S3中
E.使用Apache Hive分区在Amazon S3中使用包含日期的键(例如dt =2019-02)存储数据
CE
解析:优化列式数据存储的生成和分区通过雅典娜存储和分区数据,可以实现Athena的最佳性能.https://aws.amazon.com/blogs/big-data/top-10-performance-tuning-tips-for-amazon-athena/