AWS Certified Machine Learning Specialty (MLS-C01)

AWS Certified Machine Learning Specialty (MLS-C01) 更新于今天
  • 查看第 4 至第 57 页.
  • 查看第 16-20 至第 285 道题
Disclaimers:
  • - ExamTopics website is not related to, affiliated with, endorsed or authorized by Amazon.and Azure
  • - Trademarks, certification & product names are used for reference only and belong to Amazon.and Azure

Topic 1 - Exam A

Question #16 Topic 1

机器学习专家正在使用线性模型(如线性回归和逻辑回归)为大量特征构建预测模型。在探索性数据分析期间,专家观察到许多特征彼此高度相关。这可能会使模型不稳定。应该做什么来减少拥有如此多功能的影响?

  • A 对高度相关的特征执行一次热编码。
  • B 对高度相关的特征使用矩阵乘法。
  • C 使用主成分分析(PCA)创建新的特征空间
  • D 应用皮尔逊相关系数。
正确答案: C
解析:
Question #17 Topic 1

一位机器学习专家先前在本地机器上使用scikit学习训练了一个逻辑回归模型,现在该专家希望将其部署到生产中,仅用于推断。应该采取什么步骤来确保Amazon SageMaker能够托管本地培训的模型?

  • A 使用推理代码构建Docker映像。用注册表主机名标记Docker映像并将其上传到AmazonECR。
  • B 序列化经过训练的模型,以便为部署压缩格式。用注册表主机名标记Docker映像并将其上传到AmazonS3。
  • C 序列化经过训练的模型,以便为部署压缩格式。构建图像并将其上传到Docker Hub。
  • D 使用推理代码构建Docker映像。配置Docker Hub并将图像上传到Amazon ECR。
正确答案: D
解析:
Question #18 Topic 1

一位机器学习专家使用AmazonSageMaker和ROC曲线下的面积启动了基于树的集成模型的超参数调整工作(AUC)作为客观指标。该工作流最终将部署在一个管道中,该管道每晚重新训练和调整超参数,以对每24小时过时的数据进行点击建模。为了减少训练这些模型所需的时间,并最终降低成本,专家希望重新配置输入超参数范围。哪种可视化将实现这一点?

  • A 显示最重要的输入特征是否为高斯的直方图。
  • B 用目标变量着色的点的散点图,使用t-Distributed Random Neighbor Embedding(t-SNE)以更易于阅读的维度可视化大量输入变量。
  • C 显示目标度量在每次训练迭代中的性能的散点图。
  • D 显示最大树深度和目标度量之间相关性的散点图。
正确答案: B
解析:
Question #19 Topic 1

一位机器学习专家正在为一家公司设计一个提高销售的系统。其目的是利用公司掌握的关于用户行为和产品偏好的大量信息,根据用户与其他用户的相似性来预测用户想要哪些产品。专家应该做些什么来实现这一目标?

  • A 在Amazon EMR上使用Apache Spark ML构建基于内容的过滤推荐引擎
  • B 在AmazonEMR上使用ApacheSparkML构建协作过滤推荐引擎。
  • C 在Amazon EMR上使用Apache Spark ML构建基于模型的过滤推荐引擎
  • D 在Amazon EMR上使用Apache Spark ML构建组合过滤推荐引擎
正确答案: B
解析: Many developers want to implement the famous Amazon model that was used to power the ג€People who bought this also bought these itemsג€ feature on Amazon.com. This model is based on a method called Collaborative Filtering. It takes items such as movies, books, and products that were rated highly by a set of users and recommending them to other users who also gave them high ratings. This method works well in domains where explicit ratings or implicit user actions can be gathered and analyzed. Reference: https://aws.amazon.com/blogs/big-data/building-a-recommendation-engine-with-spark-ml-on-amazon-emr-using-zeppelin/
Question #20 Topic 1

大型消费品制造商有以下产品出售:*34种不同的牙膏变体*48种不同的牙刷变体*43种不同的漱口水变体亚马逊S3提供了所有这些产品的整个销售历史。目前,该公司正在使用定制的自回归综合移动平均值(ARIMA)模型来预测这些产品的需求。该公司希望预测即将推出的新产品的需求。机器学习专家应该应用哪种解决方案?

  • A 培训定制ARIMA模型以预测新产品的需求。
  • B 训练Amazon SageMaker DeepAR算法来预测新产品的需求。
  • C 培训Amazon SageMaker k均值聚类算法,以预测新产品的需求。
  • D 培训定制XGBoost模型以预测新产品的需求。
正确答案: B
解析: Amazon SageMaker DeepAR预测算法是一种监督学习算法,用于使用递归神经网络(RNN)预测标量(一维)时间序列。经典的预测方法,如自回归综合移动平均(ARIMA)或指数平滑(ETS),适用于每个单独的时间序列。然后,他们使用该模型将时间序列外推到未来。参考:https://docs.aws.amazon.com/sagemaker/latest/dg/deepar.html