一位机器学习专家正在为Amazon SageMaker设计一个可扩展的数据存储解决方案。现有一个基于TensorFlow的模型作为火车实现。py脚本,该脚本依赖于当前存储为TFRecords的静态训练数据。哪种向Amazon SageMaker提供培训数据的方法可以满足业务需求,且开发开销最少?
一家飞机发动机制造公司正在按时间序列测量200项性能指标。工程师希望在测试过程中近实时地检测关键的制造缺陷。需要存储所有数据以进行离线分析。哪种方法最有效地执行近实时缺陷检测?
一家医疗保健公司计划使用神经网络将他们的X射线图像分为正常和异常两类。标记的数据被分成1000个图像的训练集和200个图像的测试集。具有50个隐藏层的神经网络模型的初始训练在训练集上产生了99%的准确度,但在测试集上只有55%的准确度。专家应考虑哪些变化来解决此问题?(选择三个。)
一家通过提供云连接设备来促进健康睡眠模式的公司目前在AWS上托管了一个睡眠跟踪应用程序。应用程序从设备用户收集设备使用信息。该公司的数据科学团队正在构建一个机器学习模型,以预测用户是否以及何时停止使用该公司的设备。下游应用程序使用该模型的预测结果来确定联系用户的最佳方法。数据科学团队正在构建多个版本的机器学习模型,以根据公司的业务目标评估每个版本。为了衡量长期有效性,团队希望长期并行运行模型的多个版本,并能够控制模型所提供的推理部分。哪种解决方案以最小的努力满足这些要求?
一个城市希望监测其空气质量,以解决空气污染的后果。机器学习专家需要预测城市未来2天的空气质量(百万分之几的污染物)。由于这是一个原型,因此只有去年的每日数据可用。哪种模型最可能在Amazon SageMaker中提供最佳结果?