一位机器学习专家正在公司专有网络的私有子网中使用Amazon SageMaker笔记本实例。ML专家将重要数据存储在Amazon SageMaker笔记本实例的Amazon EBS卷上,并需要拍摄该EBS卷的快照。但是,ML专家无法在VPC中找到Amazon SageMaker笔记本实例的EBS卷或Amazon EC2实例。为什么ML专家在VPC中看不到实例?
一家基于网络的公司希望提高其登录页面的转化率。该公司使用大量客户访问历史数据集,在Amazon SageMaker上反复训练了一种多类深度学习网络算法。然而,存在一个过度拟合的问题:训练数据显示预测的准确率为90%,而测试数据仅显示70%。在将其部署到生产中之前,该公司需要增强其模型的通用性,以最大限度地实现访问到购买的转换。建议采取哪种措施为公司的测试和验证数据提供最高精度模型?
机器学习专家必须使用AmazonAthena在AmazonS3上构建一个查询数据集的过程。该数据集包含80多万条以明文CSV文件形式存储的记录。每条记录包含200列,大小约为1.5 MB。大多数查询只能跨越5到10列。机器学习专家应该如何转换数据集以最小化查询运行时间?
公司使用长期短期记忆(LSTM)模型来评估特定能源行业的风险因素。该模型审查多页文本文档,以分析文本的每一句,并将其分类为潜在风险或无风险。尽管数据科学家对许多不同的网络结构进行了实验,并调整了相应的超参数,但该模型的表现并不理想。哪种方法将提供最大的性能提升?
一位机器学习专家正在开发包含多个ETL作业的日常ETL工作流。工作流由以下流程组成:*数据上传到AmazonS3后,立即启动工作流。*当AmazonS3中的所有数据集都可用时,启动ETL作业,将上传的数据集与已存储在Amazon中的多TB大小的数据集连接起来S3中。*将连接数据集的结果存储在AmazonS3中。*如果其中一个作业失败,请向管理员发送通知。哪种配置将满足这些要求?