一家制造公司使用Amazon S3来存储其数据。该公司希望使用AWS Lake Formation在这些数据资产上提供细粒度级别的安全性。数据以Apache Parquet格式存储。公司已经设定了顾问在构建数据湖之前完成任务的最后期限。那么,顾问应该如何创建最具成本效益的解决方案,满足这些要求呢?
一家能源公司从连接到建筑物上的传感器实时收集电压数据。该公司希望在同一建筑物突然电压增加后的10分钟内检测到序列两个电压下降时收到通知。所有通知都必须尽快交付。系统必须高度可用。公司需要一个解决方案,当这项监测功能在其他城市实施时,能够自动扩展。通知系统已订阅到Amazon Simple Notification Service(Amazon SNS)主题以进行修复。哪个解决方案能够满足这些要求?
一家公司想使用自动机器学习(ML)随机剪枝(RCF)算法来可视化复杂的现实场景,例如检测季节性和趋势,排除外部因素,填补缺失值。负责这个项目的团队是非技术人员,正在寻找一个超出预期的解决方案,该解决方案需要最少的管理开销。哪个解决方案能够满足这些要求?
一位数据架构师正在为一家银行构建Amazon S3数据湖。目标是提供一个客户数据需求的数据仓库,例如个性化推荐。银行使用Amazon Kinesis Data Firehose从事务关系数据库中实时摄入客户的个人信息银行账户和交易。银行要求存储在AWS云中的所有可识别个人身份信息(PII)都被遮盖。这个解决方案能够满足这些要求吗?
一家公司有一个业务单元,将.csv文件上传到亚马逊S3存储桶中。公司的数据平台团队已经设置了一个AWS Glue爬虫来进行发现、创建表和架构。AWS Glue工作负载将处理创建的表中的经过处理的数据显示到亚马逊Redshift数据库中。AWS Glue工作负载处理列映射并适当地创建Amazon Redshift表。在AWS Glue工作负载运行 reasons for re-running any day, duplicates are introduced into the Amazon Redshift表。 解决方案:在重新运行作业时,哪个解决方案可以更新Amazon Redshift表,而无需重复记录?