AWS Certified Machine Learning Specialty (MLS-C01)

AWS Certified Machine Learning Specialty (MLS-C01) 更新于今天
  • 查看第 2 至第 57 页.
  • 查看第 6-10 至第 285 道题
Disclaimers:
  • - ExamTopics website is not related to, affiliated with, endorsed or authorized by Amazon.and Azure
  • - Trademarks, certification & product names are used for reference only and belong to Amazon.and Azure

Topic 1 - Exam A

Question #6 Topic 1

一家技术初创公司正在使用复杂的深度神经网络和GPU计算,根据每个客户的习惯和互动向现有客户推荐公司的产品。该解决方案目前从Amazon S3存储桶中提取每个数据集,然后将数据加载到TensorFlow模型中,该模型从该公司在本地运行的Git存储库中提取。然后,该作业运行数小时,同时不断将其进度输出到同一个S3存储桶。在发生故障时,作业可以随时暂停、重新启动和继续,并从中央队列运行。高级管理人员担心解决方案资源管理的复杂性以及定期重复该过程所涉及的成本。他们要求工作量自动化,以便每周运行一次,从周一开始,到周五结束工作。应使用哪种体系结构以最低成本扩展解决方案?

  • A 使用AWS深度学习容器实施解决方案,并在GPU兼容的Spot实例上使用AWS批处理将容器作为作业运行
  • B 使用与低成本GPU兼容的Amazon EC2实例实施解决方案,并使用AWS instance Scheduler调度任务
  • C 使用AWS深度学习容器实现解决方案,使用运行在Spot实例上的AWS Fargate运行工作负载,然后使用内置任务调度器调度任务
  • D 使用运行在Spot实例上的Amazon ECS实现解决方案,并使用ECS服务调度器调度任务
正确答案: C
解析:
Question #7 Topic 1

一家游戏公司推出了一款在线游戏,人们可以开始免费玩,但如果他们选择使用某些功能,则需要付费。该公司需要建立一个自动化系统,以预测新用户是否会在1年内成为付费用户。该公司从100万用户中收集了一个标记数据集。培训数据集由1000个阳性样本(来自1年内付费的用户)和999000个阴性样本(来自未使用任何付费功能的用户)组成。每个数据样本包含200个特征,包括用户年龄、设备、位置和游戏模式。使用该数据集进行训练,数据科学团队训练了一个随机森林模型,该模型在训练集上的收敛精度超过99%。然而,测试数据集的预测结果并不令人满意数据科学团队应采取以下哪种方法来缓解此问题?(选择两个。)

  • A 向随机林中添加更多的深树,以使模型能够学习更多的特征。
  • B 在训练数据集中包含测试数据集中的样本副本。
  • C 通过复制正样本并向复制的数据添加少量噪声来生成更多正样本。
  • D 更改成本函数,使假阴性对成本值的影响大于假阳性。
  • E 更改成本函数,使误报对成本值的影响大于误报。
正确答案: CD
解析:
Question #8 Topic 1

一家零售公司在营销活动中使用Amazon Personalize为客户提供个性化产品推荐。该公司发现,在部署新的解决方案版本后,立即向现有客户推荐的产品的销售额显著增加,但这些销售额在部署后很短时间内就会减少。只有营销活动之前的历史数据可用于培训。数据科学家应该如何调整解决方案?

  • A 使用AmazonPersonalize中的事件跟踪器来包括实时用户交互。
  • B 添加用户元数据并使用Amazon Personalize中的HRNN元数据配方。
  • C 在Amazon SageMaker中使用内置因子分解机(FM)算法实现新的解决方案。
  • D 将事件类型和事件值字段添加到AmazonPersonalize中的交互数据集。
正确答案: D
解析:
Question #9 Topic 1

一位机器学习专家正在与一家大公司合作,在其产品中利用机器学习。该公司希望根据客户在未来6个月内是否会流失,将其客户分类。公司已为专家提供的数据贴上标签。专家应该使用哪种机器学习模型来完成此任务?

  • A 线性回归
  • B 分类
  • C 聚类
  • D 强化学习
正确答案: B
解析: The goal of classification is to determine to which class or category a data point (customer in our case) belongs to. For classification problems, data scientists would use historical data with predefined target variables AKA labels (churner/non-churner) ג€" answers that need to be predicted ג€" to train an algorithm. With classification, businesses can answer the following questions: ✑ Will this customer churn or not? ✑ Will a customer renew their subscription? ✑ Will a user downgrade a pricing plan? ✑ Are there any signs of unusual customer behavior? Reference: https://www.kdnuggets.com/2019/05/churn-prediction-machine-learning.html
Question #10 Topic 1

一家保险公司正在为车辆开发一种新设备,该设备使用摄像头来观察驾驶员的行为,并在他们出现分心时提醒他们。该公司在受控环境中创建了大约10000张训练图像,机器学习专家将使用这些图像来训练和评估机器学习模型。在模型评估过程中,专家注意到,训练错误率随着时间段的数量增加而降低得更快,并且模型没有准确地推断出看不见的测试图像。应使用以下哪项解决此问题?(选择两个。)

  • A 向模型添加消失渐变。
  • B 对培训数据进行数据扩充。
  • C 使神经网络架构变得复杂。
  • D 在模型中使用渐变检查。
  • E 将L2正则化添加到模型中。
正确答案: BE
解析: