在线经销商有一个大型的多列数据集,其中一列缺少30%的数据。一位机器学习专家认为,数据集中的某些列可以用来重建缺失的数据。专家应使用哪种重建方法来保持数据集的完整性?
一位机器学习专家正在构建一个模型,该模型将使用Amazon SageMaker进行时间序列预测。专家已经完成了模型的培训,现在正计划在端点上执行负载测试,以便他们可以为模型变量配置自动缩放。哪种方法允许专家在负载测试期间检查延迟、内存利用率和CPU利用率?
机器学习专家正在为分类问题决定是建立一个朴素的贝叶斯模型还是建立一个完整的贝叶斯网络。专家计算每个特征之间的皮尔逊相关系数,发现它们的绝对值在0.1到0.95之间。哪种模型描述了这种情况下的基础数据?
监控服务每分钟生成1 TB的规模度量记录数据。一个研究团队使用Amazon Athena对这些数据进行查询。由于数据量大,查询运行缓慢,团队需要更好的性能。记录应该如何存储在AmazonS3中以提高查询性能?
一位机器学习专家希望为Amazon SageMaker带来一种自定义算法。专家在Amazon SageMaker支持的Docker容器中实现算法。专家应该如何包装Docker容器,以便Amazon SageMaker能够正确启动培训?