AWS Certified Machine Learning Specialty (MLS-C01)

AWS Certified Machine Learning Specialty (MLS-C01) 更新于今天
  • 查看第 10 至第 57 页.
  • 查看第 46-50 至第 285 道题
Disclaimers:
  • - ExamTopics website is not related to, affiliated with, endorsed or authorized by Amazon.and Azure
  • - Trademarks, certification & product names are used for reference only and belong to Amazon.and Azure

Topic 1 - Exam A

Question #46 Topic 1

一家农业公司对在100英亩的草地上使用机器学习来检测特定类型的杂草感兴趣。目前,公司使用拖拉机安装的摄像头来捕捉该场地的多张图片,每10到10网格。公司还有一个大的训练数据 Pool,其中包括标注了受欢迎杂草类别的图像,如 broadleaf 和 non-broadleaf docks。公司希望建立一个能检测特定杂草类型及其在场地内位置的杂草检测模型。一旦模型准备就绪,它将托管在Amazon SageMaker端点上。该模型将使用摄像头捕获的图像进行实时推理。那么,一位机器学习专家应该采取哪种方法来获得准确的预测呢?

  • A 准备RecordIO格式的图像并将其上传到Amazon S3。使用Amazon SageMaker,使用图像分类算法对模型进行训练、测试和验证,以将图像分类为各种杂草类别。
  • B 准备Apache Parquet格式的图像并将其上传到AmazonS3。使用AmazonSageMaker使用物体检测单镜头多盒检测器(SSD)算法来训练、测试和验证模型。
  • C 准备RecordIO格式的图像并将其上传到Amazon S3。使用Amazon SageMaker,使用物体检测单镜头多盒检测器(SSD)算法来训练、测试和验证模型。
  • D 准备Apache Parquet格式的图像并将其上传到Amazon S3。使用Amazon SageMaker使用图像分类算法将图像分类为各种杂草类,以训练、测试和验证模型。
正确答案: C
解析:
Question #47 Topic 1

数据科学家使用Amazon SageMaker笔记本实例进行数据探索和分析。这需要在笔记本实例上安装Amazon SageMaker上本机不可用的某些Python包。机器学习专家如何确保笔记本实例上自动提供所需的软件包供数据科学家使用?

  • A 在底层Amazon EC2实例上安装AWS Systems Manager Agent,并使用Systems Manager Automation执行包安装命令。
  • B 创建一个Jupyter笔记本文件(.ipynb),其中包含要执行的包安装命令的单元格,并将该文件放置在每个Amazon SageMaker笔记本实例的/etc/init目录下。
  • C 在Jupyter笔记本控制台中使用conda包管理器将必要的conda包应用于笔记本的默认内核。
  • D 使用包安装命令创建Amazon SageMaker生命周期配置,并将生命周期配置分配给笔记本实例。
正确答案: B
解析: 参考:https://towardsdatascience.com/automating-aws-sagemaker-notebooks-2dec62bc2c84
Question #48 Topic 1

汽车发动机制造商在汽车行驶时收集汽车数据。收集的数据包括时间戳、发动机温度、每分钟转数(RPM)和其他传感器读数。该公司希望预测发动机何时会出现故障,以便提前通知驾驶员进行发动机维修。引擎数据被加载到数据湖中进行训练。哪种预测模型最适合用于生产?

  • A 随着时间的推移添加标签,以指示哪些发动机故障发生在将来的什么时间,从而将其转化为监督学习问题。使用递归神经网络(RNN)来训练模型,以识别发动机何时可能因某个故障需要维护。
  • B 该数据需要无监督学习算法。使用Amazon SageMaker k-means对数据进行聚类。
  • C 随着时间的推移添加标签,以指示哪些发动机故障发生在将来的什么时间,从而将其转化为监督学习问题。使用卷积神经网络(CNN)来训练模型,以识别发动机何时可能因某个故障需要维护。
  • D 这一数据已经形成时间序列。使用Amazon SageMaker seq2seq对时间序列进行建模。
正确答案: B
解析:
Question #49 Topic 1

一家信用卡公司希望建立一个信用评分模型,以帮助预测新的信用卡申请人是否会拖欠信用卡付款。该公司从大量来源收集了数千种原始属性的数据。早期训练分类模型的实验表明,许多属性高度相关,大量特征显著降低了训练速度,并且存在一些过度拟合问题。该项目的数据科学家希望在不丢失原始数据集的大量信息的情况下加快模型训练时间。数据科学家应该使用哪种特征工程技术来实现目标?

  • A 对所有功能运行自相关并删除高度相关的功能
  • B 将所有数值规格化为介于0和1之间
  • C 使用自动编码器或主成分分析(PCA)将原始特征替换为新特征
  • D 使用k均值对原始数据进行聚类,并使用每个聚类的样本数据构建新的数据集
正确答案: B
解析:
Question #50 Topic 1

一家制造公司将结构化和非结构化数据存储在Amazon S3存储桶中。机器学习专家希望使用SQL对该数据运行查询。哪种解决方案需要最少的努力才能查询此数据?

  • A 使用AWS数据管道转换数据,使用Amazon RDS运行查询。
  • B 使用AWS Glue对数据进行编目,使用Amazon Athena运行查询。
  • C 使用AWS Batch对数据运行ETL,使用Amazon Aurora运行查询。
  • D 使用AWS Lambda转换数据,使用Amazon Kinesis数据分析运行查询。
正确答案: B
解析: