一家零售公司打算使用机器学习对新产品进行分类。向数据科学团队提供了当前产品的标记数据集。该数据集包括1200种产品。标记的数据集具有每个产品的15个特征,如标题尺寸、重量和价格。每个产品都被标记为属于图书、游戏、电子产品和电影等六个类别之一。使用提供的培训数据集对新产品进行分类时,应使用哪个模型?
一名机器学习专家正在培训一名模型,以识别图像中车辆的品牌和型号。专家希望使用转移学习和基于一般对象图像训练的现有模型。专家整理了一个包含不同车辆品牌和型号的大型自定义图片集。专家应该如何初始化模型以使用自定义数据重新训练它?
公司的机器学习专家需要使用TensorFlow提高时间序列预测模型的训练速度。该培训目前在单个GPU机器上实施,大约需要23小时才能完成。培训需要每天进行。模型的准确性是可以接受的,但该公司预计培训数据的规模将持续增加,并且需要每小时而不是每天更新模型。该公司还希望尽量减少编码工作和基础设施的变化。机器学习专家应该对培训解决方案做什么,以使其能够根据未来需求进行扩展?
在针对分类问题的神经网络的小批量训练过程中,一位数据科学家注意到训练精度波动。这个问题最可能的原因是什么?
一家金融服务公司希望采用Amazon SageMaker作为其默认的数据科学环境。该公司的数据科学家运行机器学习(ML)机密财务数据模型。该公司担心数据泄露,希望一名ML工程师来保护环境。ML工程师可以使用哪些机制来控制SageMaker的数据出口?(选择三个。)