Amazon SageMaker – 庄闲棋牌官网官方版 -199IT //www.otias-ub.com 发现数据的价值-199IT Tue, 20 Jun 2023 06:46:07 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.4.2 Amazon SageMaker地理空间功能现已全面可用,新增安全特性及更多用例 //www.otias-ub.com/archives/1618339.html Tue, 20 Jun 2023 06:46:07 +0000 //www.otias-ub.com/?p=1618339 2023年6月20日 亚马逊云科技在re:Invent 2022大会上宣布了Amazon SageMaker地理空间功能的预览版,它让数据科学家和机器学习工程师能够使用地理空间数据来构建、训练和部署机器学习模型。Amazon SageMaker地理空间机器学习功能支持访问现成的地理空间数据、专门构建的处理操作和开源库、预训练机器学习模型和内置的可视化工具。

预览期间,该功能获得了很多客户的关注和反馈。现在Amazon SageMaker地理空间功能已全面可用,新增了安全特性和更多用例。

在Amazon SageMaker Studio使用地理空间机器学习功能

Amazon SageMaker地理空间功能具备以下三大优势:

· 地球观测任务——使用专门构建的地理空间操作采集、转换和可视化卫星图像数据,基于预训练机器学习模型实现预测并获取洞察。

· 矢量扩展任务——优化运营增强用户数据,例如将地理坐标转换为可读地址。

· 地图可视化——实现CSV、JSON或GeoJSON文件上传的卫星图像或地图数据的可视化。

用户可以在SageMaker Studio Notebook中创建所有地球观测任务(Earth Observation Jobs, EOJ),进而使用专门构建的地理空间操作来处理卫星数据。

矢量扩展任务(VEJ)通过专门构建的反向地理编码和地图匹配操作使位置数据更加丰富。用户在使用SageMaker Studio Notebook执行VEJ的同时,也可以通过用户界面查看创建的所有任务。如果要在Notebook中使用可视化功能,用户首先需要将输出结果导入到Amazon Simple Storage Service(Amazon S3)存储桶中。

用户可以使用地图可视化功能对地理空间数据、EOJ或VEJ任务的输入以及从Amazon S3存储桶导出的输出进行可视化。

新增安全特性

在Amazon SageMaker地理空间功能全面可用的同时,亚马逊云科技还针对其安全方面推出了两项更新:客户自行管理Amazon KMS的密钥服务Amazon Key Management Service(Amazon KMS),以及客户在Amazon VPC环境下进行地理空间操作的 Amazon Virtual Private Cloud(Amazon VPC)。

Amazon KMS客户管理密钥使客户能够使用自己的密钥对地理空间工作负载进行加密,从而提高了灵活性和可控性。

用户可以使用KmsKeyId在地球观测任务和矢量扩展任务中指定自己的密钥作为可选参数。如果客户没有提供KmsKeyId,则将使用服务自带的密钥对客户内容进行加密。如需了解更多信息,请参阅亚马逊云科技文档Amazon KMS支持的SageMaker地理空间功能。

借助Amazon VPC,用户可以完全控制自己的网络环境,并更安全地连接到亚马逊云科技上的地理空间工作负载,也可以在Amazon VPC环境中使用SageMaker Studio或Notebook进行SageMaker地理空间操作,并通过SageMaker地理空间操作中的VPC端点接口执行SageMager地理空间的API操作。

地理空间机器学习应用案例

各行各业的客户都在利用Amazon SageMaker地理空间功能构建应用于现实世界的应用程序。

最大限度地提高粮食产量和食品安全

数字农业指应用数字解决方案,通过先进的数据分析和机器学习技术,帮助农民优化农作物生产。数字农业应用需要使用地理空间数据,包括农民田地所在地区的卫星图像。

通过预训练土地覆盖物分割模型,用户可以使用SageMaker在卫星图像中识别农田边界。

损害评估

自然灾害愈加频繁且伤害严重,因此,为决策者和急救人员提供快速准确的损害评估非常重要。用户可以借助地理空间图像来预测自然灾害造成的损失,并在自然灾害发生后立即使用地理空间数据来快速评估其对建筑物、道路或其他关键基础设施的损害。

用户利用2022年10月中旬澳大利亚罗切斯特洪水发生前后的图像训练和部署模型,并预测洪水造成的自然灾害损失,最终获得了罗切斯特洪水的分割标记结果图。从下图可以看到,模型已经确定了洪水区域内可能受损的位置。

通过GitHub存储库,用户可以使用多时态Sentinel-2卫星数据训练和部署地理空间分割模型,以评估山火损失。本示例关注的地区位于加利福尼亚州北部,该地区在2021年曾遭受迪克西山火的影响。

监测气候变化

全球变暖增加了干旱的风险。以美国最大的水库米德湖为例,用户可以使用SageMaker地理空间功能获取数据、执行分析,并直观显示其变化,以监测因气候变化而导致的海岸线萎缩。

用户可以在GitHub存储库中找到该示例的Notebook代码。

预测零售需求

用户还可以使用SageMaker地理空间功能来执行基于矢量的地图匹配操作,并实现结果可视化。地图匹配允许用户将庞杂的GPS坐标与路段相匹配。借助Amazon SageMaker的地理空间功能,用户可以执行VEJ对地图进行匹配。执行这类任务,用户需要输入包含路线信息(如经度、纬度和GPS度量的时间戳)的CSV文件,最终获得包含预测路线的GeoJSON文件。

支持城市可持续发展

Arup是亚马逊云科技的客户之一,它使用机器学习等技术来探索高温对城市的影响以及当地气温的影响因素,以实现更好的城市规划并助力可持续发展。城市热岛效应及其带来的相关风险与问题是当今城市面临的最大挑战之一。

利用Amazon SageMaker地理空间功能,Arup通过地球观测数据识别和测量城市热因子,显著提高了他们为客户提供咨询服务的能力。Arup工程团队通过访问更多数量、更多类型数据,以及对更大型数据集的分析,从而完成了以前很难开展的分析工作。

现已可用

Amazon SageMaker地理空间功能现已在美国西部(俄勒冈州)区域全面可用。作为亚马逊云科技免费套餐( Free Tier )的一部分,用户可以免费开始使用SageMaker地理空间功能,有效期30天,包含10小时的免费ml.geospatial.interactive计算、以及高达10GB的免费存储空间,无需支付每月150美元的使用费。

]]>
亚马逊云科技推出八项Amazon SageMaker全新功能 //www.otias-ub.com/archives/1532337.html Mon, 05 Dec 2022 07:50:31 +0000 //www.otias-ub.com/?p=1532337 亚马逊云科技在2022 re:Invent全球大会上宣布,为端到端机器学习服务Amazon SageMaker 推出八项新功能。众多开发人员、数据科学家和业务分析师使用 Amazon SageMaker 提供的全托管基础设施、工具和工作流,轻松快速地构建、训练和部署机器学习模型。客户使用机器学习不断创新,他们创建的模型比以往任何时候都多,因此,他们需要高级功能来有效管理模型的开发、使用和性能。本次发布包括新的 Amazon SageMaker 治理功能,它可以在整个机器学习生命周期中提供对模型性能的可见性。新的 Amazon SageMaker Studio Notebook 功能提供了增强的Notebook体验,让客户只需点击几下即可检查和解决数据质量问题,促进数据科学团队之间的实时协作,通过将Notebook代码转变到自动化作业加速机器学习实验到生产的过程。最后,Amazon SageMaker新功能可自动执行模型验证,并且让地理空间数据处理变得更容易。要开始使用 Amazon SageMaker,请访问 aws.amazon.com/sagemaker。

“当前,数以万计各种规模和各行各业的客户都在使用 Amazon SageMaker。亚马逊云科技客户每个月都在构建数百万个模型、训练数十亿参数规模的模型、生成数万亿个预测。 许多客户正在以几年前闻所未闻的规模使用机器学习。”亚马逊云科技人工智能和机器学习副总裁Bratin Saha表示, “今天发布的Amazon SageMaker新功能让团队能够更轻松地加快机器学习模型的端到端开发和部署。 从专门构建的治理工具到下一代Notebook体验和简化的模型测试,再到对地理空间数据的增强支持,我们在 Amazon SageMaker 的基础上不断创新,帮助客户大规模利用机器学习。”

对很多用户而言,云计算让机器学习触手可及。但直到几年前,构建、训练和部署模型的过程仍然是艰苦而乏味的,人手不多的数据科学家团队需要进行为期数周或数月的持续迭代,才能使模型达到生产水平。亚马逊云科技在五年前推出 Amazon SageMaker以应对这些挑战,此后陆续增加了250 多项新特性和功能,让客户能够更轻松地在多项业务中使用机器学习。当前,一些客户聘请了数百名专业人员,他们使用 Amazon SageMaker 做出预测,用以在改善客户体验、优化业务流程和加速新产品和服务开发等方面帮助解决最严峻的挑战。随着机器学习应用的增长,客户想要使用的数据类型不断增加,客户需要的治理、自动化和质量保证水平也与日俱增,以期实现对机器学习负责任的应用。Amazon SageMaker一向致力于为全球所有技能水平的专业人员提供支持,此次发布也秉承了这一创新传统。

Amazon SageMaker 机器学习治理新功能

Amazon SageMaker新功能可以帮助客户更轻松地在机器学习模型生命周期中扩大治理规模。 随着企业内模型和用户数量的增长,设置最低权限的访问控制和创建治理流程以记录模型信息(如输入数据集、训练环境信息、模型使用描述和风险评级)都变得愈发困难。模型部署后,客户还需要监测偏差和特征偏移,从而确保模型按预期运行。

Amazon SageMaker Role Manager 可以更轻松地控制访问和权限:适当的用户访问控制是治理的基石,它保护数据隐私,防止信息泄露,确保专业人员可以访问他们完成工作所需的工具。但一旦数据科学团队增加到数十甚至数百人,实施这些控制就会变得越来越复杂。机器学习管理员(创建和监控组织内机器学习系统的人)必须平衡对简化开发的需求和对管控机器学习工作流内任务、资源和数据访问的需求。当前,管理员通常创建电子表格或使用临时列表导览数十种不同活动(如数据准备和训练)和角色(如机器学习工程师和数据科学家)所需的访问策略。这些工具需要手动维护,而且可能需要数周时间才能明确新用户有效完成工作所需的具体任务。Amazon SageMaker Role Manager 让管理员可以更轻松地控制访问并为用户定义权限。管理员可以根据不同的用户角色和职责选择和编辑预建模板。之后,该工具会在几分钟内自动创建具有必要权限的访问策略,持续降低添加和管理用户所投入的时间和精力。

Amazon SageMaker Model Cards简化模型信息收集:当前,大多数专业人员依靠不同的工具(如电子邮件、电子表格和文本文件)记录模型开发和评估期间的业务需求、关键决策和观察结果。专业人员需要用这些信息支持审批工作流、注册、审计、客户查询和监控,但要为每个模型都收集这些详细信息则需要几个月的时间。一些专业人员试图通过构建复杂的记录保存系统来解决问题,但这样的系统需要手动操作、耗时且容易出错。Amazon SageMaker Model Cards在亚马逊云科技控制台提供了单独的位置存储模型信息,从而在整个模型生命周期中简化文档管理。新功能会自动将输入数据集、训练环境和训练结果等详细的训练信息直接输入到 Amazon SageMaker Model Cards。用户还可以使用自助问卷的形式保存模型信息(如精度目标、风险评级)、训练和验证结果(如偏差或精准度指标)以及供将来参考的观察结果,用以进一步提升治理水平、支持负责任地使用机器学习。

Amazon SageMaker Model Dashboard 提供集中界面以跟踪机器学习模型:模型部署到生产环境后,专业人员希望不断跟踪模型以了解其性能、识别潜在问题。这一任务通常针对每个模型单独完成。但当组织开始部署数千个模型时,这种方式会变得越来越复杂,需要大量的时间和资源。 Amazon SageMaker Model Dashboard 可以全面概览已部署的模型和端点,让专业人员只需在一个地方就可以跟踪资源和模型行为。通过模型看板,客户还可以使用内置集成的Amazon SageMaker Model Monitor(具备模型与数据偏移监控功能)和Amazon SageMaker Clarify(具备机器学习偏差检测功能)。这种对模型行为和性能的端到端可见性为简化机器学习治理流程、快速解决模型问题提供了必备的信息。

要了解有关 Amazon SageMaker 治理功能的更多信息,请访问 aws.amazon.com/sagemaker/ml-governance。

下一代Notebook

Amazon SageMaker Studio Notebook 为专业人员提供了从数据探索到部署的全托管Notebook体验。 随着团队规模和复杂性的增加,可能有数十名专业人员需要使用Notebook协作开发模型。亚马逊云科技推出三项新功能帮助客户协调和自动化Notebook代码,进一步为用户提供最佳Notebook体验。

简化数据准备:专业人员在准备训练数据时希望直接在Notebook中探索数据集,以发现和纠正潜在的数据质量问题(如信息缺失、极值、数据集失真和偏差)。专业人员可能要花费数月时间编写样板代码将数据集的不同部分可视化,检查数据集,以期识别和修复问题。Amazon SageMaker Studio Notebook提供内置的数据准备功能,让专业人员只需点击几下即可直观地查看数据特征、修复数据质量问题,所有这一切都直接在Notebook环境中进行。当用户在Notebook中显示data frame(即数据的表格形式)时,Amazon SageMaker Studio Notebook 会自动生成图表帮助用户识别数据质量问题,提供数据转换建议帮助解决常见问题。专业人员选择数据转换后,Amazon SageMaker Studio Notebook 会在Notebook中生成相应代码,可供每次运行Notebook时重复应用。

加速整个数据科学团队的协作:准备好数据后,专业人员就可以开始开发模型。这是一个迭代过程,可能需要团队成员在同一个Notebook中进行协作。当前,团队必须通过电子邮件或聊天应用交换Notebook和其它资产(如模型和数据集),以便在Notebook上实时协作,这会导致沟通疲劳、反馈迟滞和版本不统一等问题。 Amazon SageMaker 现在为团队提供了一个工作区,成员可以在其中实时阅读、编辑和运行Notebook,简化协作和沟通。团队成员可以一起查看Notebook结果,立即了解模型性能,无需反复传递信息。Amazon SageMaker Studio Notebook支持 BitBucket 和 Amazon CodeCommit 等服务,团队可以轻松管理不同的Notebook版本,比较版本变更。实验和机器学习模型这样的附加资源也会自动保存,让团队工作井井有条。

Notebook代码自动转换为生产就绪作业:当专业人员要将训练完成的机器学习模型用到生产中时,他们通常将代码片段从Notebook复制到一个脚本,再将脚本及其所有的依赖项打包到容器,最后调度容器运行。要在日程表上重复运行该作业,他们必须搭建、配置和管理持续集成和持续交付 (CI/CD)管道,才能实现自动化部署。搭建所有必要的基础设施可能需要数周时间,这会占用核心的机器学习开发活动时间。Amazon SageMaker Studio Notebook 现在让专业人员可以选择一个Notebook,将其自动化为可以在生产环境运行的作业。Notebook选择完成后,Amazon SageMaker Studio Notebook 会建立整个Notebook的快照,将其依赖项打包到容器,构建基础设施,按照专业人员设定的时间表将Notebook作为自动化作业运行,当作业完成时释放基础设施,如此可以将Notebook投入生产所需的时间从数周缩短到数小时。

要开始使用下一代 Amazon SageMaker Studio Notebook和这些新功能,请访问 aws.amazon.com/sagemaker/notebooks。

使用实时推理请求自动验证新模型

在部署到生产环境之前,专业人员会测试和验证每个模型,检查模型性能、识别可能对业务产生负面影响的错误。专业人员通常使用过去的推理请求数据测试新模型的性能,但这些数据有时无法代表当前的真实推理请求。例如,用于规划最快路线的机器学习模型的历史数据可能无法代表交通事故或突然关闭道路时交通流量的显著改变。为了解决这个问题,专业人员将发送到生产模型的推理请求副本路由到他们想要测试的新模型。他们需要花费数周时间构建这样的测试基础设施、镜像推理请求、比较新模型在关键指标(如延迟和吞吐量)上的表现。虽然这让专业人员对模型的执行情况更有信心,但为数百以至数千个模型实施这些解决方案的成本和复杂性太高,使其无法规模化。

Amazon SageMaker Inference 现在提供了一种功能,让专业人员可以更轻松地实时使用相同的真实推理请求数据,将新模型的性能与生产模型的性能进行比较。现在,他们可以轻松地将测试同时扩展到数千个新模型,无需构建自己的测试基础设施。首先,客户选择想要测试的生产模型,Amazon SageMaker Inference 随后会将新模型部署到具有完全相同条件的托管环境。Amazon SageMaker 将生产模型收到的推理请求副本路由到新模型,并创建控制面板显示关键指标之间的性能差异,客户便可以实时了解每个模型的不同之处。客户一旦验证了新模型的性能并确信它没有潜在错误,就可以安全地部署它。要了解有关 Amazon SageMaker Inference 的更多信息,请访问 aws.amazon.com/sagemaker/shadow-testing。

Amazon SageMaker全新的地理空间功能让客户可以更轻松地使用卫星和位置数据进行预测

当前,大部分收集到的数据都包含地理空间信息(如位置坐标、天气图和交通数据)。但是,已经用于机器学习的只有一小部分,原因是地理空间数据集很难处理,通常达到PB 级的规模,且跨越整个城市或数百公里土地。要开始构建地理空间模型,客户通常会采购卫星图像或地图数据等第三方数据源以补充其专有数据。由于地理空间数据规模庞大,专业人员需要合并这些数据,准备数据用于训练,并编写代码将数据集划分为可管理的子集。当客户准备部署训练好的模型时,他们必须编写更多代码以重新组合多个数据集,将数据和机器学习模型预测关联起来。为了从完成的模型中提取预测结果,专业人员需要花费数天时间使用开源的可视化工具在地图上做渲染。从数据改进到可视化,整个过程可能需要几个月的时间,这使得客户很难利用地理空间数据及时产生机器学习预测。

Amazon SageMaker将客户丰富数据集、训练地理空间模型并将结果可视化的时间从数月缩短到数小时,从而加速和简化地理空间机器学习预测的生成。客户只需几次点击或使用 API就可以使用 Amazon SageMaker访问各种地理空间数据源,例如亚马逊云科技的位置服务Amazon Location Service、开放数据集Amazon Open Data、客户自有数据和来自Planet Labs等第三方供应商的数据。当专业人员选择了想要使用的数据集,他们可以利用内置的运算器将这些数据集与自己的专有数据合并起来。为了加快模型开发,Amazon SageMaker 提供了预训练的深度学习模型,其支持的用例包括通过精准农业提高作物产量、监测自然灾害后区域恢复以及改善城市规划等。训练完成后,内置的可视化工具在地图上显示数据,揭示新的预测。要进一步了解有关 Amazon SageMaker 全新的地理空间功能,请访问 aws.amazon.com/sagemaker/geospatial。

Capitec Bank 是南非最大的数字银行,拥有超过 1000 万数字客户。 “在 Capitec,我们在各个产品线都拥有大批数据科学家,他们构建不同的机器学习解决方案。”Capitec Bank 机器学习工程师 Dean Matter表示,“我们的机器学习工程师管理着一个基于 Amazon SageMaker 构建的集中式建模平台,支持所有这些机器学习解决方案的开发和部署。在没有任何内置工具的情况下,跟踪建模工作往往发生文档脱节,模型缺乏可见性。借助 Amazon SageMaker Model Cards,我们可以在统一环境中跟踪大量的模型元数据。而Amazon SageMaker Model Dashboard 提供了对每个模型性能的可见性。此外,Amazon SageMaker Role Manager 简化了对不同产品线数据科学家进行的访问管理。每一项功能都有助于我们的模型治理,足以保证客户对我们作为金融服务提供商的信任。”

EarthOptics 是一家土壤数据测量和制图公司,利用专有传感器技术和数据分析精确测量土壤健康状况和土壤结构。 “我们希望使用机器学习帮助客户利用经济实惠的土壤地图提高农业产量。” EarthOptics 首席执行官 Lars Dyrud 表示,“Amazon SageMaker 的地理空间机器学习功能使我们能够使用多个数据源快速构建算法原型,并且将研究和部署生产 API 之间的时间缩短到只有一个月。 得益于 Amazon SageMaker,我们为美国各地的农场和牧场部署了用于土壤固碳的地理空间解决方案。”

HERE Technologies 是一个领先的位置数据和技术平台,可帮助客户创建自定义地图和基于高精度位置数据的位置体验。 “我们的客户需要实时情境信息,利用空间模式和趋势洞察做出业务决策。”HERE Technologies 首席产品和技术官 Giovanni Lanfranchi 表示,“我们依靠机器学习自动从不同数据源获取位置数据,增强数据的情境信息,加速数据分析。Amazon SageMaker 的测试新功能让我们能够在生产中更严格、更主动地测试机器学习模型,避免对客户造成不利影响或者因为部署的模型出错导致任何中断。 这对我们至关重要,因为客户期待我们根据瞬息万变的实时位置数据提供及时的见解。”

Intuit 是全球性金融技术平台,通过 TurboTax、Credit Karma、QuickBooks 和 Mailchimp等产品支持全球超过 1 亿客户的繁荣发展。 “我们正在释放数据的力量,给我们平台上的消费者、个体经营者和小型企业带来金融变革。”Intuit 工程和产品开发总监 Brett Hollman 表示,“为了进一步提高团队效率、将 AI 驱动的产品快速推向市场,我们与亚马逊云科技密切合作,设计了 SageMaker Studio Notebook 中全新的团队协作功能。我们成功实现了简化沟通和协作,让我们的团队能够使用 Amazon SageMaker Studio 将机器学习开发规模化。”

]]>
亚马逊云科技机器学习扎根中国产业带:二三线城市独具创新潜力 //www.otias-ub.com/archives/1254339.html Mon, 31 May 2021 02:01:19 +0000 //www.otias-ub.com/?p=1254339 本文来源:199IT  作者: Ralf

作为人工智能的重要部分,机器学习已经走过几十年时间。伴随着大数据时代,数据量级的几何倍增加,让机器学习能有更多的用武之地并焕发新的生命力。

传统的认知上,机器学习为代表的人工智能技术,更多地存在于一线城市科技领域,特别是互联网巨头所盘踞的各个方向。资源丰富、业务量大、科研技术人员多、应用方向广等奠定了一线城市的独特优势。而二三线城市,基础资源薄弱和人才缺乏,限制了机器学习等顶尖技术的发展。

然而,在亚马逊云科技机器学习Amazon SageMaker落地中国区一周年之际,亚马逊云科技大中华区云服务产品管理总经理顾凡却给我们带来了一些不同的视角,颠覆了此前对二三线城市尖端技术发展的趋势预判。

首先从行业的角度,顾凡认为一线城市的确有其得天独厚的优势,一线城市有大量的互联网公司和软件公司。这些公司的业务特征决定了它们比其他行业不得不走得更快更早一点。“无论是看新闻、听音乐、看视频还是购物,它们哪种客户体验没有机器学习?“北上广深一线城市涵盖了整个移动互联网。就行业而言,一线城市机器学习的应用程度的确高于其他线城市。

但如果从产业的角度,结论就非常有意思。放眼全中国很多省份和地域都会有产业的特点,特别是传统工业制造业基本分布在二三线城市。怎么使用机器学习的方式去做智能的、基于人工智能的质量监测,提升良品率和效率,降低人的参与度,甚至在未来工业制造现代化的过程当中怎么做设备的预前故障检测等等。大量的需求在这些产业带中产生。当产业带中有企业通过机器学习解决了某个行业问题,行业都会复制,带动整个行业的技术创新,而这种创新会更多落在这些产业带所属的二三线城市。

顾凡认为,越是传统行业,杠杆效应越高,因为这些传统行业的基础面大影响面广,可能与每个居民都息息相关。

一个比较典型的例子是山东淄博市热力集团有限责任公司。在使用机器学习技术之前,热力行业普遍遇到了从传统供热到产业智能化方向的瓶颈。淄博热力集团选择与亚马逊云科技一道,解决行业难题,并形成了行业创新标准同时将这一创新能力向同行做技术输出。

淄博热力集团利用亚马逊云科技丰富的AL/ML技术和服务,快速构建、训练和部署机器学习模型,实现了精准供热,可以根据气象、工控数据、建筑物维护结构等信息计算出最佳的供热模式,并给出具体的操作指令,既让用户室温始终保持人体最佳舒适温度,又做到尽可能节约成本。

淄博市热力集团通过机器学习技术,将自身多年的行业专家级经验转化为全国领先的技术创新,成为众多同行的“产业智能化“师傅。这凸显了顶尖技术与产业带结合迸发出的创新潜力。而这些业务与民众的生活更为相关,解决了很多的实际问题。

淄博市能源集团公司、淄博市热力集团有限责任公司党委书记、董事长汪德刚表示,“多年来,淄博热力利用信息化手段改造传统供热,致力于成为行业标准的制定者和行业发展的引领者。通过与亚马逊云科技合作,借助机器学习能力创新,建成了基于机器学习和大数据分析的智能供热平台,帮助我们从传统供热向产业智能化方向转型,在满足用户需求的同时实现节能减排,建立绿色能源生态系统。未来,希望我们能借助先进的云技术持续创新,推动国内热力行业的数字化、智能化转型。“

据亚马逊云科技提供的数据,目前,全球数以十万计的客户选择亚马逊云科技运行机器学习工作负载。在中国,亚马逊云科技机器学习服务得到医疗健康、教育、出行、工业智能、游戏、新媒体等各个行业客户的青睐,益体康、晶泰科技、新世纪医疗、LEMONBOX、有道乐读、叽里呱啦、全美在线、首汽约车、德比软件、Momenta、图森未来、行者AI、天和荣、中科创达、华来科技、大宇无限、陕西科技大学、易点天下、淄博热力等一批企业和机构的广泛采用,在各行各业实现了丰富多样的人工智能应用创新。

顾凡认为,全中国很多省份蕴含着不同的产业带特性,包括很多自动驾驶的汽车研发基地、跨境电商基地等,这些散布在二三线城市区域存在很多创新场景。“谁先用机器学习解决了一个场景,别人就会关注这个场景,所以从行业维度来看其实是很明显的,可以看到有扩大的效应在形成。“

在Amazon SageMaker落地中国区一周年之际,亚马逊云科技宣布进一步落地多项人工智能与机器学习的新服务和功能。

其中技术部分包括顶层-人工智能服务、中间层-机器学习服务以及底层-框架和基础架构。

在人工智能(AI)服务层面,亚马逊云科技在北京区域推出了Amazon Personalize,客户无需具备机器学习专业知识,即可方便、快速地构建个性化推荐系统。

在中间层,将Amazon SageMaker在re:Invent 2020上亮相的包括Data Wranger、Feature Store、Pipelines等七项新功能在北京区域和宁夏区域上线,让客户可以更轻松地构建端到端的机器学习管道。

在算力层面,亚马逊云科技在北京区域和宁夏区域推出了Amazon EC2 Inf1实例,该实例基于亚马逊云科技自研机器学习推理芯片Amazon Inferentia,与当前成本最低的基于GPU的实例相比,可以提高多达30%的吞吐量,并使每次推断的成本最高降低45%。

2021年1月,工信部印发《工业互联网创新发展行动计划(2021-2023年)》,制定了一系列推动工业互联网新型基础设施建设量质并进的发展目标。3月,《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》(以下简称“纲要”)全文正式发布。在共19篇65章的纲要全文中,“智能”“智慧”相关表述达57处。

作为拥有全球领先机器学习技术能力的云计算厂商,亚马逊云科技正在扎根中国产业带,让这些传统的产业带与顶尖技术结合,碰撞出更多的创新机遇。

]]>
亚马逊云科技机器学习扎根中国产业带:二三线城市独具创新潜力 //www.otias-ub.com/archives/1253193.html Fri, 28 May 2021 09:53:49 +0000 //www.otias-ub.com/?p=1253193 本文来源:199IT  作者: Ralf

作为人工智能的重要部分,机器学习已经走过几十年时间。伴随着大数据时代,数据量级的几何倍增加,让机器学习能有更多的用武之地并焕发新的生命力。

传统的认知上,机器学习为代表的人工智能技术,更多地存在于一线城市科技领域,特别是互联网巨头所盘踞的各个方向。资源丰富、业务量大、科研技术人员多、应用方向广等奠定了一线城市的独特优势。而二三线城市,基础资源薄弱和人才缺乏,限制了机器学习等顶尖技术的发展。

然而,在亚马逊云科技机器学习Amazon SageMaker落地中国区一周年之际,亚马逊云科技大中华区云服务产品管理总经理顾凡却给我们带来了一些不同的视角,颠覆了此前对二三线城市尖端技术发展的趋势预判。

首先从行业的角度,顾凡认为一线城市的确有其得天独厚的优势,一线城市有大量的互联网公司和软件公司。这些公司的业务特征决定了它们比其他行业不得不走得更快更早一点。“无论是看新闻、听音乐、看视频还是购物,它们哪种客户体验没有机器学习?“北上广深一线城市涵盖了整个移动互联网。就行业而言,一线城市机器学习的应用程度的确高于其他线城市。

但如果从产业的角度,结论就非常有意思。放眼全中国很多省份和地域都会有产业的特点,特别是传统工业制造业基本分布在二三线城市。怎么使用机器学习的方式去做智能的、基于人工智能的质量监测,提升良品率和效率,降低人的参与度,甚至在未来工业制造现代化的过程当中怎么做设备的预前故障检测等等。大量的需求在这些产业带中产生。当产业带中有企业通过机器学习解决了某个行业问题,行业都会复制,带动整个行业的技术创新,而这种创新会更多落在这些产业带所属的二三线城市。

顾凡认为,越是传统行业,杠杆效应越高,因为这些传统行业的基础面大影响面广,可能与每个居民都息息相关。

一个比较典型的例子是山东淄博市热力集团有限责任公司。在使用机器学习技术之前,热力行业普遍遇到了从传统供热到产业智能化方向的瓶颈。淄博热力集团选择与亚马逊云科技一道,解决行业难题,并形成了行业创新标准同时将这一创新能力向同行做技术输出。

淄博热力集团利用亚马逊云科技丰富的AL/ML技术和服务,快速构建、训练和部署机器学习模型,实现了精准供热,可以根据气象、工控数据、建筑物维护结构等信息计算出最佳的供热模式,并给出具体的操作指令,既让用户室温始终保持人体最佳舒适温度,又做到尽可能节约成本。

淄博市热力集团通过机器学习技术,将自身多年的行业专家级经验转化为全国领先的技术创新,成为众多同行的“产业智能化“师傅。这凸显了顶尖技术与产业带结合迸发出的创新潜力。而这些业务与民众的生活更为相关,解决了很多的实际问题。

淄博市能源集团公司、淄博市热力集团有限责任公司党委书记、董事长汪德刚表示,“多年来,淄博热力利用信息化手段改造传统供热,致力于成为行业标准的制定者和行业发展的引领者。通过与亚马逊云科技合作,借助机器学习能力创新,建成了基于机器学习和大数据分析的智能供热平台,帮助我们从传统供热向产业智能化方向转型,在满足用户需求的同时实现节能减排,建立绿色能源生态系统。未来,希望我们能借助先进的云技术持续创新,推动国内热力行业的数字化、智能化转型。“

据亚马逊云科技提供的数据,目前,全球数以十万计的客户选择亚马逊云科技运行机器学习工作负载。在中国,亚马逊云科技机器学习服务得到医疗健康、教育、出行、工业智能、游戏、新媒体等各个行业客户的青睐,益体康、晶泰科技、新世纪医疗、LEMONBOX、有道乐读、叽里呱啦、全美在线、首汽约车、德比软件、Momenta、图森未来、行者AI、天和荣、中科创达、华来科技、大宇无限、陕西科技大学、易点天下、淄博热力等一批企业和机构的广泛采用,在各行各业实现了丰富多样的人工智能应用创新。

顾凡认为,全中国很多省份蕴含着不同的产业带特性,包括很多自动驾驶的汽车研发基地、跨境电商基地等,这些散布在二三线城市区域存在很多创新场景。“谁先用机器学习解决了一个场景,别人就会关注这个场景,所以从行业维度来看其实是很明显的,可以看到有扩大的效应在形成。“

在Amazon SageMaker落地中国区一周年之际,亚马逊云科技宣布进一步落地多项人工智能与机器学习的新服务和功能。

其中技术部分包括顶层-人工智能服务、中间层-机器学习服务以及底层-框架和基础架构。

在人工智能(AI)服务层面,亚马逊云科技在北京区域推出了Amazon Personalize,客户无需具备机器学习专业知识,即可方便、快速地构建个性化推荐系统。

在中间层,将Amazon SageMaker在re:Invent 2020上亮相的包括Data Wranger、Feature Store、Pipelines等七项新功能在北京区域和宁夏区域上线,让客户可以更轻松地构建端到端的机器学习管道。

在算力层面,亚马逊云科技在北京区域和宁夏区域推出了Amazon EC2 Inf1实例,该实例基于亚马逊云科技自研机器学习推理芯片Amazon Inferentia,与当前成本最低的基于GPU的实例相比,可以提高多达30%的吞吐量,并使每次推断的成本最高降低45%。

2021年1月,工信部印发《工业互联网创新发展行动计划(2021-2023年)》,制定了一系列推动工业互联网新型基础设施建设量质并进的发展目标。3月,《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》(以下简称“纲要”)全文正式发布。在共19篇65章的纲要全文中,“智能”“智慧”相关表述达57处。

作为拥有全球领先机器学习技术能力的云计算厂商,亚马逊云科技正在扎根中国产业带,让这些传统的产业带与顶尖技术结合,碰撞出更多的创新机遇。

]]>
亚马逊云科技在中国区域上线机器学习新服务 打造广泛而深入的人工智能与机器学习工具集 //www.otias-ub.com/archives/1244317.html Tue, 11 May 2021 09:13:51 +0000 //www.otias-ub.com/?p=1244317 Amazon SageMaker机器学习服务落地中国一周年

2021年5月11日,在完全托管的机器学习服务Amazon SageMaker落地中国区域一周年之际,亚马逊云科技宣布通过与光环新网和西云数据的紧密合作在中国区域进一步落地多项人工智能与机器学习的新服务和功能,丰富了其针对不同企业需求而打造的人工智能与机器学习 (AI/ML)工具集。亚马逊云科技针对不同需求的客户在机器学习技术堆栈三个层面提供广泛而深入的机器学习服务,包括顶层-人工智能服务、中间层-机器学习服务以及底层-框架和基础架构。在人工智能(AI)服务层面,亚马逊云科技在北京区域推出了Amazon Personalize,客户无需具备机器学习专业知识,即可方便、快速地构建个性化推荐系统;在中间层,将Amazon SageMaker在re:Invent 2020上亮相的包括Data Wranger、Feature Store、Pipelines等七项新功能在北京区域和宁夏区域上线,让客户可以更轻松地构建端到端的机器学习管道;在算力层面,亚马逊云科技在北京区域和宁夏区域推出了Amazon EC2 Inf1实例,该实例基于亚马逊云科技自研机器学习推理芯片Amazon Inferentia,与当前成本最低的基于GPU的实例相比,可以提高多达30%的吞吐量,并使每次推断的成本最高降低45%。

亚马逊云科技大中华区云服务产品管理总经理顾凡表示,“Amazon SageMaker落地中国区域一年以来,我们见证了中国各个行业各种类型客户积极应用亚马逊云科技服务进行机器学习创新,我们希望通过将更多服务落地到中国区域,并坚持‘授人以鱼不如授人以渔’,甚至更进一步‘扶上马,送一程’的方式,帮助客户更快应用机器学习技术,把机器学习的能力交到每一位构建者手中,加速人工智能和机器学习的普惠。”

目前,全球数以十万计的客户选择亚马逊云科技运行机器学习工作负载。在中国,亚马逊云科技机器学习服务得到医疗健康、教育、出行、工业智能、游戏、新媒体等各个行业客户的青睐,益体康、晶泰科技、新世纪医疗、LEMONBOX、有道乐读、叽里呱啦、全美在线、首汽约车、德比软件、Momenta、图森未来、行者AI、天和荣、中科创达、华来科技、大宇无限、陕西科技大学、易点天下、淄博热力等一批企业和机构的广泛采用,在各行各业实现了丰富多样的人工智能应用创新。

山东淄博市热力集团有限责任公司利用亚马逊云科技丰富的AL/ML技术和服务,快速构建、训练和部署机器学习模型,实现了精准供热,可以根据气象、工控数据、建筑物维护结构等信息计算出最佳的供热模式,并给出具体的操作指令,既让用户室温始终保持人体最佳舒适温度,又做到尽可能节约成本。淄博市热力集团有限责任公司董事长、党委书记汪德刚表示,“多年来,淄博热力利用信息化手段改造传统供热,致力于成为行业标准的制定者和行业发展的引领者。通过与亚马逊云科技合作,借助机器学习能力创新,建成了基于机器学习和大数据分析的智能供热平台,帮助我们从传统供热向产业智能化方向转型,在满足用户需求的同时实现节能减排,建立绿色能源生态系统。未来,希望我们能借助先进的云技术持续创新,推动国内热力行业的数字化、智能化转型。“

为进一步加速人工智能/机器学习的普惠,亚马逊云科技构建了强大的合作伙伴网络,通过合作伙伴网络成员构建行业机器学习模型,帮忙更多客户解决行业算法模型构建难题并落地行业解决方案。上海音智达信息技术有限公司是亚马逊云科技合作伙伴网络成员之一,提供围绕人工智能和大数据技术的预测性分析及商务智能解决方案的技术专家服务,帮助客户实现数字化转型。上海音智达信息技术有限公司CEO孙晓臻表示,“我们为亚洲地区数以百计的跨国企业及本土客户提供数据服务,拥有丰富的数据分析与业务实施经验,在生命科学、快消品、汽车、零售、电子消费产品、金融、保险、以及运输行业拥有众多实践和成功案例。但是,我们在机器学习方面的算法和人才储备远远不能够满足客户需求。亚马逊云科技丰富的机器学习服务大幅提升了音智达的技术开发和服务能力,助力我们打造了覆盖不同行业和场景的解决方案,实现了业务发展和持续创新。”

如今,各种规模、各种类型的企业和机构,都在积极探索人工智能和机器学习技术的应用并希望能尽快发挥实际效应。为满足不同客户的创新需求,亚马逊凭借在人工智能/机器学习领域20多年深厚的技术积累,提供了广泛而深入的、并且不断迭代创新的机器学习服务组合。

无需具备机器学习专业知识,即可通过Amazon Personalize构建个性化推荐系统

在人工智能服务层面,针对没有机器学习专业知识和能力的客户,亚马逊云科技提供开箱即用的人工智能服务。Amazon Personalize,一项用于构建个性化推荐系统的完全托管型机器学习服务,已在北京区域上线。开发人员无需具备机器学习专业知识,即可通过该服务训练、调整和部署自己定制的机器学习模型,构建个性化推荐系统,可用于产品推荐、个性化营销、个性化搜索和定制化直销等广泛的个性化推荐场景。

打造包罗万象的AI/ML工具集,七项新功能让Amazon SageMaker更强大

作为亚马逊云科技机器学习服务层面的核心产品,Amazon SageMaker是业界首个面向机器学习开发者的集成开发环境,它消除机器学习过程中的繁重工作,使客户能专注于自身的业务和应用创新,在提高客户工作效率的同时还大幅降低机器学习的总体拥有成本。去年12月在亚马逊云科技全球大会re:Invent 2020上刚刚亮相的七项 Amazon SageMaker新功能,近期已经在北京区域和宁夏区域落地。

1.Amazon SageMaker Data Wranger,简化机器学习的数据准备工作。通过该功能,客户可以将各种数据存储中的数据一键导入。Amazon SageMaker Data Wrangler内置了300多个数据转换器,让客户无需编写任何代码,就可以对机器学习用到的特征进行规范化、转换和组合。

2Amazon SageMaker Feature Store,一个完全托管且专门构建的特征存储库,用于存储、更新、检索和共享机器学习特征。客户可以在其中存储和访问特征,以便更轻松地在各个团队中对其进行命名、共享和重复使用。

3Amazon SageMaker Pipelines是业界首个针对机器学习专门构建、易于使用的持续集成和持续交付服务,通过编排和自动化提高机器学习工作的效率。借助该服务,用户可以大规模地创建、自动化和管理端到端机器学习工作流。

4Amazon SageMaker Clarify让机器学习开发人员可以更好地掌控其训练数据和模型,从而识别和限制偏差并解释做出相关预测的原因。

5Amazon SageMaker Distributed training libraries为训练大型深度学习模型和数据集提供了易用的方法,与现有分布式训练实现相比,以最高快 40% 的速度完成分布式训练,并且帮助用户减少手动实施数据并行和模型并行策略所需时间。

  1. Amazon SageMaker Model Monitor帮助客户时刻保持机器学习模型的准确性,它能够自动检测生产环境中部署的模型,并在检测到不准确的预测时发出警报,从而帮助客户维护高质量的机器学习模型。

7.Amazon SageMaker Debugger,可以通过实时捕获训练指标,自动识别机器学习训练任务中正在出现的复杂问题,例如梯度值变得过大或过小等它可以实时监控系资源(例如GPU、CPU、网络和内存等)的利用率,帮助用户提高资源利用率,对训练过程中的资源瓶颈进行告警,让开发者及时调度资源,快速采取纠正措施,减少时间和成本浪费。

基于高性能机器学习推理芯片Amazon InferentiaAmazon EC2 Inf1实例落地中国区域

在机器学习底层的框架和基础架构层面,亚马逊云科技全面提供基于各家芯片供应商的最新技术选项,提供从小到大多种配置,支持市面上流行的各种机器学习框架和算法。同时,为了不断给客户提供更好性价比的算力,亚马逊云科技自主设计芯片,推出了高性能机器学习推理芯片Amazon Inferentia。基于Amazon Inferentia的Amazon EC2 Inf1实例落地北京区域和宁夏区域,让中国区域客户又多一种云端高性能和更低成本机器学习推理的算力选择。了解更多有关Amazon EC2 Inf1实例的信息请访问:https://aws.amazon.com/cn/ec2/instance-types/inf1/

亚马逊云科技的人工智能与机器学习服务,还受益于亚马逊云科技在计算、存储、数据库和数据分析等方面广博深厚的能力,以及它们优异的安全性、可靠性、可扩展性和成本效率,这些服务无缝集成、有效支撑,赋能更多组织和个人进行数字化转型和创新。

]]>
从专业领域到大众领域 AWS牵手中国本土出行巨头首汽约车 //www.otias-ub.com/archives/1151641.html Thu, 12 Nov 2020 08:23:06 +0000 //www.otias-ub.com/?p=1151641 作为云计算全球一哥,亚马逊云服务(AWS)服务全球数百万客户,帮助其实现数字化的转型和创新。在众多高科技企业背后, 都浮现AWS技术的身影。对于中国C端用户而言,一般难以直接感知AWS服务。而日前AWS与中国本土出行巨头首汽约车的战略合作,将自身技术服务延展至大众领域。越来越多的中国用户能享受到AWS高性能技术带来的便利。

此次AWS与首汽约车的战略合作主要聚焦在智能语音方向。该解决方案是基于AWS机器学习服务Amazon SageMaker和Amazon Transcribe开发的,也是出行行业首个定制智能语音解决方案。

首汽约车CEO魏东

在首汽约车CEO魏东看来,中国网约车市场已经开始从粗放的1.0时代迈向精细化2.0时代,智能化是网约车2.0时代最核心的部分。如何通过智能化实现服务的标准化是摆在首汽约车、滴滴等网约车平台面前亟待解决的问题。“网约车过去几年虽然很热闹,但事实上我们都始终是在网约车1.0时代,不管我们从滴滴、uber,到神州、曹操、首汽约车等等,我们过去都做的只是连接而已,我们只是通过各种手段提升了司机和乘客的匹配效率。我们不断去挖掘我们的交易引擎、地图引擎、定价引擎,目的是不断让车更快的找到人,目的是让整体的交易效率更高一点,从而不断增加供给、不断增加匹配。这是我们过去一直在做的是1.0的模式,就是连接的效率问题。网约车的交易是基于一天这几个大平台每天都是上千万单的人的每次交易,不是上千万件物理货品的运输,而是一个活体的人去运送活体的人,所以这里面最难的在于这样两侧的融合要高效完成,尤其是驾驶员这侧,对于每一个个体,每一单都能够标准化,我们现在在朝这方面去做。”

如何实现网约车2.0智能智慧交通,魏东认为需要大量拥抱技术,进行大量运算,大量进行数据的处理。一方面是自有的数据、平台的数据、交易数据,一方面是基于对用户理解的用户标签化的数据。但这远远不够,还需要公共数据,包括道路数据、社会数据等任何影响出行最终结果的变量。“如何把这些因素都纳入到一个真正的计算里面,全社会联网不是难事,全社会的联脑怎么实现,这里面涉及到技巧的问题和管理能力的问题。这是真正摆在全行业面前的挑战,但我们非常高兴能够拥抱亚马逊AWS,在这方面已经做了非常多的事情。”

作为中国出行领域的代表性企业,首汽约车对高精尖技术有着开放心态。魏东认为需要更多的技术来解决2.0时代的问题,一方面首汽约车会积极探索,另一方面也会提出各种需求给到AWS,希望一起找到解决方案。“这样的话我们也不用自己增加团队,这不现实,这不是我们擅长的事情,我们需要有所为有所不为,我们可以聚焦在乘客体验上、聚焦在司机体验上,怎么样打造非常好的双边体验,把这样的技术运用起来,实现企业的增值,以及我们共同创造一种社会价值。”

AWS大中华区产品部总经理顾凡

AWS大中华区产品部总经理顾凡认为AWS与首汽约车双方的战略合作是水到渠成,首汽约车有场景,有愿景,也有数据,AWS有技术。AWS能够用更少的人、更少的成本去快速地试错,能够去验证人工智能真的能够帮助提升客服的效率,提升客户的体验。AWS和首汽约车两边的碰撞,其实就是一个技术去赋能行业中一个新的场景,带来客户体验的提升。

用人工智能技术提升出行行业客户体验,赋予企业差异化竞争能力,在顾凡看来中国的人工智能发展速度非常快,而且已经快速落地场景中。AWS已经与首汽约车一起发掘这些场景,真正把别人没有干的事情做出来,未来演变成一个服务,更多人会用到和看到首汽在利用语音方面怎么提升解决客诉和提升客户体验的实践。

此次AWS机器学习服务Amazon SageMaker再一次出现在客户服务中,这一全球领先的技术也是AWS今年4月落地中国地区的重磅级技术。在中国Amazon SageMaker在医疗健康、教育、出行、工业智能、游戏、新媒体等各个行业应用不同场景的实践中。从智能远程心电平台的AI训练和推理场景,提升了模型训练的速度 到快速地构建具有逼真语音体验的在线学习平台以及更高精尖的自动驾驶领域等。

在之前回答199IT的提问时,顾凡表示,AWS对Amazon SageMaker在中国的发展预期非常大。在中国,人工智能和机器学习最大的挑战在于人才,成本非常高,一个数据科学家基本在100万年薪起步,而且很多被超大型科技公司所垄断。Amazon SageMaker能够帮助企业实现不用雇佣数据科学家,只需要雇有一些数据经验的开发工程师,然后通过培训,用SageMaker几周就实现产出。这是SageMaker最厉害之处。

顾凡认为,SageMaker想象空间不在于AWS,而在于整个行业。AWS帮助行业降低门槛,让非大公司的其他客户有能力把ML做成一个工具,让他们去想象应用场景。“我们坐在屋里是想象不出来SageMaker是怎么用的,只有客户自己能想象出来。我们只不过帮他用逆向思维多测一测而已”。

与场景结合,SageMaker将迸发出强大的性能和生命力,这一趋势也在与首汽约车战略合作中体现出来。目前出行行业普遍采用行程录音辅助安全监控,以及用户问题投诉处理。然而,现有的语音解决方案常常因为录音质量问题难以达到实际目的。

AWS数据实验室和解决方案研发中心在深入了解行程录音的特点及技术需求后,开发了语音降噪和导航音分离算法,并利用Amazon SageMaker机器学习服务进行模型训练、部署和调优,实现模型的快速迭代。Amazon SageMaker机器学习服务极大地降低了首汽约车采用机器学习的门槛。通过这一全托管的服务,首汽约车的数据科学家和算法工程师只需要专注数据和业务逻辑,无需运营和管理复杂的机器学习系统。此外,首汽约车还通过Amazon Transcribe人工智能语音服务将行程录音自动转化为文字,从而实现通过场景化的关键词识别分析触发安全预警,结合后台安全监控人员的人工判断,让实时的行程安全监控从可能变成现实。在应用这一智能语音解决方案时,其对用户数据保留全部所有权,可以随时决定数据的存储及访问权,并确保所有访问行为的合规。

在用户问题投诉处理方面,客服人员可以综合利用文字和语音信息,及时准确地进行判别,提高工作效率,改善司乘满意度。通过使用智能语音解决方案,首汽约车实现客服人工审核工作量降低35%,客服人工听音审核时长缩短20%,并保证智能客诉处理准确率达90%以上,有效改善了司乘体验及满意度、提高企业运营效率,同时,通过智能判责替代人工,还可以有效的降低成本。首汽约车和AWS未来也将进一步紧密合作,丰富智能判责场景,如针对网约车服务中可能出现的司乘矛盾、行驶路线问题等,通过语音智能识别后用作判定的依据。

在AWS中国团队的不断努力下,2020年AWS在中国的落地速度大大加快,今年以来,AWS中国区域已经发布了290项新服务或新功能,远远超过了2019年的数量总和。新服务和新功能不仅涉及大数据分析、人工智能与机器学习、物联网等热门领域。

对于此次与首汽约车的战略合作,AWS大中华区产品部总经理顾凡表示,“当下,全球大部分云上机器学习工作负载都在AWS上进行,我们也将利用AWS全球领先的云技术持续赋能客户。此次,依托AWS广泛而深入的机器学习服务,我们在短短4个月内就完成了智能语音解决方案的开发和上线,也期待能够与首汽约车继续携手推动出行行业的智能化转型。”

]]>
Amazon SageMaker助力行者AI实现游戏内容过滤准确率96% //www.otias-ub.com/archives/1124136.html Wed, 23 Sep 2020 03:05:14 +0000 //www.otias-ub.com/?p=1124136 记者从行者AI(成都潜在人工智能科技有限公司旗下品牌,xingzhe.ai)获悉,该公司利用亚马逊云服务(AWS)旗下的全托管机器学习服务Amazon SageMaker开发的游戏内容过滤服务,对不恰当内容的识别率超过96%,大大高于同类产品的水平,上线短短三个月内,已经获得了几十家游戏客户青睐,服务于三国群英传、多多自走棋等多款游戏。借助AWS云服务,行者AI的上线时间比计划缩短了6个月,运营效率提升76%,运营成本节省45%。此外,行者AI还利用AWS云服务开发了AI对战机器人、AI情绪控制、AI自动测试、游戏数据平台等产品,将为游戏企业提供更多有价值的服务,帮助游戏企业改善运营,提高效益。

在游戏运营中,内容审核是一项成败攸关的工作。低俗色情谩骂等内容会导致用户反感,破坏正常交流环境;违规敏感内容会导致平台整顿、停摆;恶意商业推广、垃圾广告会导致用户流失、营收损失。人工审核要耗费大量的人力、时间和精力,而且很难做到实时、全部审核。而目前市场上的通用审核工具,准确率差强人意,而且模型不能进行更新,或者更新周期长。

为此,行者AI推出了一个具有强大机器学习能力的游戏内容过滤服务。团队在考虑IT基础设施建设时认识到,作为一家初创公司,行者AI只有20多人,要尽可能减少运维投入,把更多的精力投入到算法上;内容过滤服务开发和运行中需要大量的GPU、CPU计算资源,并且高峰需求是短暂、不连续的;数据是人工智能的核心要素,数据灾备不可或缺。于是,行者AI决定选择AWS上云,以云原生架构进行开发。

通过使用Amazon SageMaker机器学习服务,行者AI团队可以一键构建、训练、部署机器学习模型,无需自行运维和管理底层的计算资源和机器学习框架等,极大地提高了开发效率。在开发内容过滤服务的过程中,要进行大量的机器学习和深度学习训练。利用Amazon SageMaker,开发团队一旦有新的想法,就可以快速进行算法验证,根据结果做出优化和修正,使每一次模型训练都可以受益于SageMaker带来的效率提升。

行者AI首席技术官江天宇接受记者采访时表示,在他们的调研中,“Amazon SageMaker是所有云厂商中唯一实现了一站式机器学习服务的解决方案。从模型构建、训练、测试到最终的发布,SageMaker提供完善的解决方案,而且操作使用非常简单,基本能做到一键完成,给开发者节约了大量的时间。SageMaker对市面上绝大多数深度学习框架,比如Tensorflow、PyTorch等,都有非常好的支持。AWS的技术支持也非常到位,在模型发布过程中,及时快速地帮助行者AI解决了诸多疑难杂症,为内容过滤服务提前半年上线提供了强有力的保障。”

通过使用Amazon EC2 Spot(竞价)实例,也解决了行者AI对计算资源的弹性需求问题。与按需实例相比,可以将成本降低高达 90%。通过使用完全托管的Amazon Elasticsearch Service服务,行者AI可以搜索、分析和可视化 PB 级的日志数据,而不需要操心数据存储、灾备、扩展等运维问题。

AI对战机器人将深度强化学习技术应用于游戏中,机器人通过学习玩家战斗数据,在模拟环境中进行大量对抗式训练,能够在任意状态下找到最优决策,达到高手玩家操作水平。同时,通过对参数进行调节,可以生成各个难度等级的机器人。由于采用真人玩家数据训练,AI对战机器人将会模仿人类玩家的真实操作,提高游戏内的玩家体验。行者AI COO陈洪宇指出,目前《多多自走棋》AI对战机器人每日调用均值达到百万次,单次调用会持续30分钟左右。

“多年来,游戏行业通常将业务侧重点放在发行上,人力投入重在运维,以及跟游戏收入明显相关的工作。相对来讲,AI的渗透率并不高。”AWS相关负责人介绍。“行者AI凭借自研算法,推出内容过滤、游戏AI以及数据平台解决方案,为游戏企业做AI赋能,业务价值显著。相信未来在游戏行业将涌现更多样化的机器学习应用场景。”

]]>
亚马逊云服务(AWS)机器学习服务Amazon SageMaker发力中国 //www.otias-ub.com/archives/1121818.html Fri, 18 Sep 2020 01:37:09 +0000 //www.otias-ub.com/?p=1121818 2020年9月17日讯,记者从亚马逊云服务(AWS)获悉,今年4月于由光环新网运营的AWS中国(北京)区域及由西云数据运营的AWS中国(宁夏)区域落地的机器学习服务Amazon SageMaker,在短短不到半年的时间内发展迅速,已经被德勤、中科创达、东软、中科云谷、伊克罗德、行者AI、德比软件等多家AWS合作伙伴和客户采用。AWS解决方案团队正在推出更多的基于SageMaker的机器学习技术解决方案,如数字资产盘活机器人等。AWS合作伙伴团队也正与更多AWS合作伙伴开展紧密的合作,促进更多相关解决方案的开发和更多行业应用场景的落地,加快中国客户应用机器学习技术的步伐,实现业务创新。

Amazon SageMaker在中国受青睐

Amazon SageMaker机器学习服务之所以如此受欢迎,是因为它极大地降低了机器学习的门槛,通过全托管的机器学习服务,消除了计算基础设施、机器学习框架、模型构建、训练及部署、工作流程等方面的复杂性,开发者只需要专注数据和业务逻辑,不断优化算法,即可实现业务价值。

SageMaker机器学习服务可以极大地提升算法工程师和数据科学家的效率。其中,为机器学习开发者服务的IDE全集成开发环境Amazon SageMaker Studio目前只在全球6个区域落地,其中中国就占了两个区域。

德比软件(上海)有限公司是一家服务于酒店行业的技术公司,服务对象包含全球十大酒店集团、国内外知名酒店集团和单体酒店、全球知名的在线旅行社(OTA)及垂直搜索渠道、社交平台和电商平台等。最近,在AWS机器学习解决方案实验室(AWS ML Solutions Lab)及机器学习产品专家团队的帮助下,德比软件在SageMaker上,构建了全新的酒店库存智能缓存系统。这一系统通过分析德比软件实时产品查询入口产生的数据,以及多年的历史订单数据,建立了更为准确的算法模型,将酒店库存预测的准确率提高了超过20%,预计将为德比软件在酒店行业的客户带来数亿美金的额外订单收入。

行者AI是成都潜在旗下专注游戏AI应用的业务,他们利用SageMaker开发了游戏智能内容过滤服务,对不恰当内容的识别率超过96%,大大高于同类产品的水平,上线短短三个月内,已经获得了几十家游戏客户青睐,服务于三国群英传、多多自走棋等多种游戏。借助AWS云服务,行者AI的上线时间比计划缩短了6个月,运营效率提升76%,运营成本节省45%。

AWS合作伙伴中科创达通过把他们的视觉检测系统部署在SageMaker上,让产品质量检验过程变得更加简单高效。基于SageMaker部署的ADC 系统,帮助制造企业减少75%的工作量,产能提升35倍。相比人工检测,漏检率下降3%,准确率提升至99%。东软NetEye将其安全网关产品预置算法迁移到了SageMaker上,完全不需要投入昂贵的计算硬件,就可以高效完成算法构建和模型训练。

加速解决方案落地,助力中国客户应用机器学习

为了帮助客户更方便地应用机器学习技术,AWS利用全球领先的云技术和服务为客户打造了定制化机器学习技术解决方案。数字资产盘活机器人是最新部署到AWS中国区域的行业技术解决方案。它将机器学习应用于业务场景,客户只要将图片、PDF文档、视频等非结构化数据上传到AWS云上,利用Amazon Simple Storage Service (Amazon S3)的海量存储,以及SageMaker的Spot训练(价格通常只有按需实例资源的1/10),以低成本、批处理的方式标记数字资产。机器人将识别出来的信息安全地存储在客户私有的Amazon S3存储桶中。该解决方案是一个开源框架,使用者可以创建自己的模型或机器人,进一步完整这一框架。目前,这一方案已经在银行、证券、保险领域率先得到客户应用。

降低机器学习技术的学习门槛

AI技术日益成为广大开发者关注的热点,掌握AI技术意味着拿到通向高阶职场的入场券。但是AI技术往往也比较高冷,强化学习尤为前沿。为了方便大量的开发者动手尝试机器学习,AWS于2018年推出了由强化学习驱动的、1/18 比例的自动驾驶赛车AWS DeepRacer,并于2019年举办覆盖全球的AWS DeepRacer League赛车联盟自动驾驶大赛,同时推出基于云平台的 AWS DeepRacer 3D 赛车模拟器。参赛者可以在AWS上,利用SageMaker在线构建赛车的强化学习模型,将它部署到AWS DeepRacer或者AWS DeepRacer 3D 赛车模拟器,与其它开发者进行自动驾驶比赛,从而在游戏竞技中掌握机器学习。

2020年9月1日,AWS将受到全球众多开发者喜爱的赛车联盟(AWS DeepRacer League)线上竞赛第一次引入中国。该项赛事将持续到9月30日。参赛者在线上完成“计时赛”和“正面挑战赛”,成绩优秀的选手有机会参加今年晚些时候举办的AWS DeepRacer全球冠军杯赛,并获取现金奖励。

AWS希望通过此举,让科技以人为本,让技术融入生活,让AI充满乐趣,从而激发广泛参与,促进AI技术在中国的普及应用和发展。

]]>
亚马逊云服务(AWS)加快云产品和服务落地中国的速度 //www.otias-ub.com/archives/1096162.html Tue, 04 Aug 2020 14:08:52 +0000 //www.otias-ub.com/?p=1096162 日前,AWS大中华区云服务产品管理总经理顾凡接受记者采访表示,伴随着中国云计算市场的高速发展,AWS正在加速新服务和功能落地中国区域。仅今年上半年,亚马逊就在中国区域落地了150多项AWS云服务和功能。

(图:AWS大中华区云服务产品管理总经理顾凡 来源:199IT)

中国信息通信研究院7月29日发布的《云计算发展白皮书》显示,从2017到2019年,中国公有云的市场规模从264.8亿元增长689.3亿元,2018年、2019年的增速分别达到65.2%、57.6%。预计到2023年,市场规模将达到2307.4亿元,是2019年的3倍多。

2020年7月31日,亚马逊发布2020年第二季度财报,其中AWS季度收入为108亿美元。在中国,面对未来的良好增长前景,AWS也充满了期待和信心。

顾凡说,AWS要为中国企业和机构的创新赋能,非常重要的一点是要加快AWS云服务产品和功能在中国落地。

AWS云服务落地中国有两种情况:大部分服务和功能只需要做一些简单的本地化开发就可以在中国区域部署落地,有一些服务需要做更多的工作。但无论哪一种,AWS都会根据中国客户的需求,尽快、尽早地将全球的服务和功能落地到中国区域。

中国企业数据量的爆炸式增长,对大数据处理和分析有着非常迫切的需求。针对这些企业客户的需求,今年上半年AWS在中国区域就推出和部署了交互式查询服务Amazon Athena,数据提取、转换和加载 (ETL) 服务AWS Glue,以及流式数据处理服务Amazon MSK。

在容器领域,AWS在中国区域落地部署了Amazon EKS,让管理、运维K8S容器变得简单方便。

7月刚刚发布的AWS Cost Management,是一组帮助客户省钱、精细化管理云资源的服务。让客户少花钱,这种事情在IT界可以说是前所未有的。AWS还经常主动降价,截至2020年6月23日,AWS已经公布了自2006年上线以来的第85次降价。

在今年新落地中国区域的云服务和产品中,特别值得一提的是机器学习服务Amazon SageMaker。

人工智能现在是非常热门的话题。亚马逊认为,人工智能的本质和核心是机器学习。人工智能、机器学习的概念早在50年前就出现了。之所以现在才热起来,是因为过去机器学习的门槛比较高,只有少数科技巨头和硬核的研究机构才有条件进行研究。一方面是机器学习需要的庞大算力不容易获得;另一方面,机器学习模型的训练过程特别复杂,要搭建训练环境、准备数据、寻找合适的算法、进行大量的运算、优化算法。

现在有了云计算,算力不再是问题。SageMaker则可以降低机器学习模型训练过程的复杂性。SageMaker是一项完全托管的服务,它可以化繁为简,帮助开发者和数据科学家快速地规模化构建、训练和部署机器学习模型,大大降低了模型构建和训练的难度。

SageMaker是一个非常开放的产品,无论对于各类机器学习框架和算法的支持,模块化的设计方式,还是对于生态合作伙伴解决方案的支持,能够真正让各种类型、各种需求的客户都很方便地应用这个服务。此外,SageMaker Studio还是业界第一个面向机器学习的集成开发环境。

目前,Amazon SageMaker成为了全球上万家客户的选择。Gartner在2020年2月发布的《云上AI开发者服务魔力象限》,在技术执行力和对技术未来发展愿景的完整规划方面将AWS排名在领导者象限最高位置。

SageMaker一经推出就受到了中国客户和合作伙伴的欢迎。大宇无限、虎牙直播、嘉谊互娱、华来科技等公司已经在使用SageMaker解决机器学习技术的需求。中科创达、东软、伊克罗德分别将SageMaker运用到产品质检、企业安全网关、标签标注、文本分析、语意理解、预测分类、推荐系统与诈欺侦测等多种解决方案和应用场景之中。

AWS在加快产品落地、为中国的企业创新赋能的同时,也担当了中国市场全球化桥梁的角色。

一方面,很多知名的中国公司,例如像美的集团、猎豹移动、小米、OPPO、虎牙直播、海信、德比软件、安克创新、TP-Link、一加、币安、晶泰科技、华大基因、传音控股、网易游戏、我爱我家、携程旅行、迈瑞医疗等等,都在利用AWS的全球基础设施和云服务。得益于AWS全球24大区域、77个可用区的广泛布局,这些公司不需要费力地,去异国他乡构建IT设施,在中国就可以做好海外业务。AWS还利用亚马逊的全球资源,例如全球开店、Prime会员、物流配送体系、生态合作伙伴资源等等,为他们提供销售、市场、产品交付、融资等帮助。

另一方面,还有很多跨国公司,例如博西家电、英孚教育、玫琳凯、太古可口可乐、先锋电子、英伟达、赛默飞世尔、西门子、飞利浦等等,他们在海外就使用AWS。进入中国后,他们可以使用AWS中国区域,快速部署应用,在运营上享受一致的体验。

顾凡说,在海外区域使用AWS的客户,也是AWS新服务落地中国区域的向导,他们给AWS提供反馈,希望哪些服务尽快落地中国区域。根据客户反馈制定服务落地中国区域的优先级,让AWS赋能中国客户的工作事半功倍,更加高效。

]]>
中科创达携手亚马逊云服务(AWS) 加速智慧工业AI部署 ADC系统全面集成Amazon SageMaker //www.otias-ub.com/archives/1060802.html Thu, 04 Jun 2020 04:47:59 +0000 //www.otias-ub.com/?p=1060802 2020年6月4日,在亚马逊云服务(AWS)中国区域推出Amazon SageMaker机器学习服务之际,中科创达(ThunderSoft)率先宣布,已经将Amazon SageMaker集成到了中科创达智慧工业ADC (Automatic Defect Classification) 系统,让制造业客户可以在工业生产中轻松获得AI质检能力,通过Amazon SageMaker的弹性Notebook、实验管理、自动模型创建、模型调试分析,以及模型概念漂移检测等强大特性,中科创达将加速智能制造的落地进程,帮助企业以更少的工作量和更低的成本更快地投入生产,在节约人力的同时,提升产品良率,释放产能,提高竞争能力。

当前,以人工智能、大数据、物联网为标志的第四次工业革命方兴未艾,世界已步入智能化时代。今年以来,国家出台了多项加快新基建发展的政策和措施,进一步带动了5G、人工智能与工业领域的融合创新。劳动密集型的传统制造业越来越多地在生产环节主动引入人工智能等新型技术,解决生产效率低下和人力成本逐年增长的问题,提高行业竞争力。

作为全球知名的智能操作系统产品和技术提供商,中科创达深入了解传统制造业发展需求和趋势,基于在智能操作系统、图形图像处理和人工智能领域的深厚技术积累,在2018年推出了工业视觉检测一站式解决方案——智慧工业ADC系统。该系统包含缺陷自动化分类、新产品迭代数据清洗、业务作业员认证三个子系统,从作业员技能认证、数据集更新到新产品导入,贯穿工业检测的整个生命周期,有效帮助制造企业减少75%的工作量,产能提升35倍。相比人工检测,漏检率下降3%,准确率提升99%。目前,中科创达已经拓展到液晶面板、汽车制造、电子产品、化妆品制造、橡胶制造等行业,帮助众多客户提升工业自动化和智能化水平。

任何客户应用智慧工业ADC系统都需要实施机器学习工作。机器学习的实施是一项复杂的工作,涉及大量试错,需要大量专业技能,并消耗庞大的算力、数据存储和时间成本。Amazon SageMaker可以让这一过程变得更加简单高效,帮助客户去除机器学习涉及的混乱和复杂性,让客户能够迅速构建、训练和部署模型,来应对新的挑战。尤其是Amazon SageMaker Studio集成开发环境(IDE),为整个机器学习工作流提供了一个统一界面,使构建、训练、解释、检查、监视、调试和运行机器学习模型变得更简单、更快。

在智慧工业领域普遍涉及的边缘端,因为边缘设备内存和处理能力往往高度受限,但对延迟又非常敏感,还存在各种不同的硬件平台和处理器架构,开发者需要花费数周或数月的时间手工调优每个模型。同时,由于复杂的调优流程,模型部署到边缘后很少进行更新,开发者可能因此错失根据边缘设备所收集的数据来重新训练和改进模型的机会。借助 Amazon SageMaker Neo,开发者只需训练一次机器学习模型,便可在云端和边缘的任何位置运行。Amazon SageMaker Neo 可将模型的运行速度优化到两倍,同时仅占用 1/10 的内存,也不会对准确性造成任何影响。Amazon SageMaker Neo可以优化部署在Amazon EC2实例、Amazon SageMaker端点和AWS Greengrass管理的设备上的模型,实现工业视觉检测应用与其它应用无缝连接。

Amazon SageMaker可以有效贴近工业的实际需求,降低了算法实施过程中开发、环境、运维对工程师的依赖。例如,在电气行业ADC系统的实施中,通过集成Amazon SageMaker,最终用户的一次性投入成本降低了42%,软件开发的工作量降低了39%,系统的上线时间缩短了50%,系统运行效率是传统检测的35倍,解决了ADC系统落地工业场景的障碍。中科创达CTO邹鹏程表示:“中科创达智慧工业ADC系统汇集了我们在操作系统、人工智能和工程化建设等多方面优秀的能力,并已成功在液晶面板行业落地,具有非常完整的工业检测系统体系。近年来,中科创达提出‘服务上云’战略,打通前端和后端的产业链条,助推智能产业加速实现数字化。我们非常荣幸与AWS携手,通过集成Amazon SageMaker,大幅提升智慧工业ADC系统在工业制造领域落地、部署的效率。同时,依托AWS实现业务发展和持续创新,加速全球智慧行业的智能化、自动化和数字化升级。”

AWS中国区生态系统及合作伙伴部总经理汪湧表示:“中科创达是非常优秀的APN(AWS合作伙伴网络)合作伙伴,在IoT、人工智能方面的实力尤其突出。Amazon SageMaker一个重要的特点在于能够与各类行业应用进行集成,来进一步赋能各行业的应用场景。我们非常高兴中科创达能够成为首批在AWS中国区域利用Amazon SageMaker的APN合作伙伴。基于Amazon SageMaker,中科创达能够打造更加优秀的智慧工业视觉检测AI系统,满足更多客户的需求,助力他们实现智能化转型。”

关于中科创达

中科创达软件股份有限公司(股票代码300496)成立于2008年,是全球知名的智能操作系统产品和技术提供商。公司致力于提供智能操作系统产品、技术及解决方案。公司立足操作系统,聚焦人工智能技术,助力并加速智能手机、智能物联网、智能网联汽车、智能行业等领域的产品化与技术创新。中科创达拥有一支对操作系统技术有深入理解的国际化团队,总部位于北京,分子公司及研发中心分布于全球20+个地区,可以为全球客户提供便捷、高效的技术服务和本地支持。同时,中科创达与产业链中的芯片、元器件、终端、软件、互联网厂商、运营商以及云厂商等都拥有紧密的合作关系,具有独特的垂直整合优势。欲了解中科创达的更多信息,请访问www.thundersoft.com

关于AWS

14年来,Amazon Web Services(AWS)一直是世界上服务丰富、应用广泛的云服务平台。AWS提供超过175项全功能的服务,涵盖计算、存储、数据库、联网、分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面,遍及24 个地理区域的76个可用区(AZ),并已公布计划在印度尼西亚、日本和西班牙新建3个AWS区域、9个可用区。全球数百万客户,包括发展迅速的初创公司、大型企业和领先的政府机构都信赖AWS,通过AWS的服务强化其基础设施,提高敏捷性,降低成本。欲了解AWS的更多信息,请访问:http://aws.amazon.com

 

]]>
亚马逊云服务(AWS)中国宁夏及北京区域正式上线Amazon SageMaker //www.otias-ub.com/archives/1047088.html Tue, 12 May 2020 02:57:35 +0000 //www.otias-ub.com/?p=1047088 Amazon SageMaker 是一项完全托管的服务,使开发者和数据科学家能够更广泛、更成功地使用机器学习

[2020年5月12日,北京] 亚马逊云服务Amazon Web Services, Inc. (AWS) 今天宣布,Amazon SageMaker在由西云数据运营的AWS中国 (宁夏) 区域和光环新网运营的AWS中国(北京)区域正式上线。Amazon SageMaker 是一项完全托管的服务,可以帮助开发者和数据科学家快速地规模化构建、训练和部署机器学习 (ML) 模型。Amazon SageMaker在中国的上线还使中国客户获得一系列新发布的工具,例如弹性Notebook、实验管理、模型自动创建、模型调试分析,以及模型概念漂移检测等强大功能,所有这些工具都封装在首个面向机器学习的集成开发环境(IDE) Amazon SageMaker Studio中。进一步了解Amazon SageMaker,请访问: https://www.amazonaws.cn/sagemaker/

机器学习的实施是一项非常复杂的工作,涉及大量试错,并且需要专业技能。开发者和数据科学家首先必须对数据进行可视化、转换和预处理,这些数据才能变成算法可以使用的格式,用以训练模型。即使是简单的模型,企业也需要花费庞大的算力和大量的训练时间,并可能需要招聘专门的团队来管理包含多台GPU服务器的训练环境。从选择和优化算法,到调节影响模型准确性的数百万个参数,训练模型的所有阶段都需要大量的人力和猜测。然后,在应用程序中部署训练好的模型时,客户又需要另一套应用设计和分布式系统方面的专业技能。并且,随着数据集和变量数的增加,模型会过时,客户又必须一次又一次地重新训练模型,让模型从新的信息中学习和进化。所有这些工作都需要大量的专业知识,并耗费庞大的算力、数据存储和时间成本。而且,由于没有集成化的工具用于整个机器学习的工作流,机器学习模型的传统开发方式是复杂、繁复和昂贵的。

Amazon SageMaker消除了机器学习过程中各个步骤的繁重工作。通过预置的Notebook、针对PB级数据集优化的常用算法,以及自动模型调优,Amazon SageMaker大大降低了模型构建和训练的难度。并且,Amazon SageMaker显著简化和加快了模型训练过程,可以通过自动提供和管理基础设施来训练模型和运行推理。同时,AWS 最近宣布了多项重要功能和高级特性,让客户能够更轻松地构建、训练、调优和部署机器学习模型。这些功能包括:

  • 面向机器学习的集成开发环境(IDE):Amazon SageMaker Studio将所有用于机器学习的组件集中在一个地方。跟使用集成开发环境(IDE)做软件开发一样,开发者现在可以在Amazon SageMaker Studio中查看和组织源代码、依赖项、文档和其它应用程序资产,例如用于移动应用程序的图像。当前,机器学习工作流有大量组件,其中许多组件都带有它们自己的一组各自独立的工具。Amazon SageMaker Studio IDE为所有Amazon SageMaker功能和整个机器学习工作流提供了一个统一界面。Amazon SageMaker Studio为开发者提供了创建项目文件夹、组织Notebook和数据集,以及协作讨论Notebook和结果的功能。Amazon SageMaker Studio使构建、训练、解释、检查、监视、调试和运行机器学习模型变得更简单、更快。

 

  • 弹性笔记本:Amazon SageMaker Notebooks提供了一键启用的Jupyter Notebook,具有秒级的弹性计算提升能力。Notebooks包含了运行或重新创建机器学习工作流所需的一切要素。在此之前,要查看或运行Notebook,开发者需要在Amazon SageMaker中启动计算实例。如果他们发现需要更多的算力,必须启动一个新实例,转移Notebook,关闭旧实例。而且,由于Notebook与计算实例是耦合的,通常存在于开发者的工作站上,其共享和迭代协作很不容易。Amazon SageMaker Notebooks提供了弹性的JupyterNotebook,让开发者可以轻松地调高或降低Notebook需要的算力(包括GPU加速)。这些调整在后台自动发生,不会打断开发者的工作。开发者不再需要浪费时间来关闭旧实例、在新实例中重新创建所有工作,从而可以更快地开始构建模型。Amazon SageMaker Notebook还可以自动复制特定环境和库依赖项,实现Notebook一键共享。这将使构建模型的协作变得更容易,比如,一个工程师可以很容易地将手头工作共享给其他工程师,让他们在现有工作的基础上构建模型。

 

  • 实验管理:Amazon SageMaker Experiments可以帮助开发者组织和跟踪机器学习模型的迭代。机器学习通常需要多次迭代,目的是隔离和衡量更改特定输入时的增量影响。这些迭代过程可能会生成数百个实验构件,如模型、训练数据和参数设置。但是,开发者目前缺乏一个便利的实验管理机制,甚至不得不依赖电子表格来跟踪实验,手动对这些构件进行排序,以了解对应的影响。Amazon SageMaker Experiments自动捕获输入参数、配置和结果,并将它们存储为“实验”,帮助开发者管理这些迭代。开发者可以浏览活跃的实验,根据特征搜索以前的实验,回顾以前的实验结果,还能用可视化的方式比较实验结果。Amazon SageMaker Experiments也保留了实验的完整谱系,如果一个模型开始偏离其预期结果,开发者可以及时回溯和检查。因此,Amazon SageMaker Experiments使开发者更容易快速迭代和开发高质量的模型。

 

  • 调试与分析:Amazon SageMaker Debugger用于调试和分析模型训练,提高准确性,减少训练时间,让开发者更好地理解模型。当前,机器学习训练过程基本上是不透明的,训练时间可能很长、很难优化;而且,往往就像一个“黑箱”,解读和解释模型都很困难。使用Amazon SageMaker Debugger,在Amazon SageMaker中训练的模型将自动发出收集到的关键指标,这些指标可以在Amazon SageMaker Studio中查看,也可以通过Amazon SageMaker Debugger的API查看,为训练的准确性和性能提供实时反馈。当检测到训练问题时,Amazon SageMaker Debugger会提供警告和补救建议。Amazon SageMaker Debugger也可帮助开发者解读模型是如何工作的,向神经网络的可解释性迈出了第一步。

 

  • 自动构建模型:Amazon SageMaker Autopilot是业内首个可以让开发者对其模型保持控制和可见性的自动化机器学习功能。当前的机器学习自动化方法,在创建初始模型方面做得不错,但是对于如何创建模型、模型中包含什么内容,并没有数据提供给开发者。因此,如果模型达不到期望,开发者想要改进它,就没有什么办法了。此外,当前的机器学习自动化服务只给客户一个简单的模型。有时客户希望做出一些取舍,例如以某个版本的模型牺牲一点准确性,以换取更低延迟的预测。但是如果客户只有一个模型可用,就没有这样的可选项。Amazon SageMaker Autopilot会自动检查原始数据,应用特征处理器,挑选最佳算法集,训练多个模型,对它们进行调优,跟踪其性能,然后根据性能对模型进行排名。点击几下鼠标,用户可以得到用于部署的、性能最佳的模型推荐,而这只需很少一点时间和精力用于训练。并且,用户可以清楚地看到模型是如何创建的,以及模型中包含什么内容。缺乏机器学习经验的人可以使用Amazon SageMaker Autopilot轻松地生成仅基于数据的模型,经验丰富的开发者可以使用它快速开发基础模型,团队可以在此基础上进行进一步迭代。Amazon SageMaker Autopilot为开发者提供了多达50种不同的模型,可以在Amazon SageMaker Studio中查看。因此,开发者能够针对应用场景选择最佳模型,并且可以结合不同的优化因子考虑多个候选模型。

 

  • 概念漂移检测:Amazon SageMaker Model Monitor允许开发者检测和纠正概念漂移(conceptdrift)。影响部署到生产环境后的模型的准确性的一大因素就是生产环境中的输入数据开始不同于模型训练所使用的数据集,从而影响预测结果,例如经济状况改变导致的新利率会影响国内采购预测,季节变化带来不同的温度、湿度和空气压力会影响设备维护时间表的预测,等等。如果输入数据开始出现这样的差异,就会导致所谓的“概念漂移”,即模型用于预测的模式不再适用。Amazon SageMaker Model Monitor自动检测模型部署中的概念漂移。Amazon SageMaker Model Monitor在训练期间创建一组关于模型的基线统计数据,将用于预测的数据与训练基线进行比较。当检测到漂移时,Amazon SageMaker Model Monitor会向开发者发出告警,并帮助他们直观地确定原因。开发者可以使用Amazon SageMaker Model Monitor的开箱即用功能立即检测漂移,也可以为Amazon SageMaker Model Monitor编写自己的规则用于监测。Amazon SageMaker Model Monitor让开发者更容易调整训练数据或算法以解决概念漂移问题。

“国内越来越多的企业正在探讨机器学习和人工智能技术带来的巨大潜力,探索如何把这些技术融入到日常应用当中。但实际上,除了少数具有专家人才和数据科学家的企业外,大部分公司还是很难应用机器学习这项技术,因此客户希望我们可以让这项技术变得更方便、更易用。”AWS全球副总裁及大中华区执行董事张文翊表示,“AWS提供了广泛、深入的机器学习和人工智能服务。Amazon SageMaker在AWS中国(宁夏)区域和AWS中国(北京)区域上线,将帮助更多中国客户去除机器学习涉及的混乱和复杂性,让他们能够胜任构建、训练和部署模型的工作,以应对新的挑战。”

全球已有数以万计的客户利用Amazon SageMaker加快机器学习部署, Autodesk、Change Healthcare、拜耳、英国航空、盖洛普、洛杉矶快船队、松下航空电子(Panasonic Avionics)、环球邮报和T-Mobile等等。中国客户如虎牙、大宇无限、嘉谊互娱、华来科技等也已选择Amazon SageMaker大规模地构建、训练和部署机器学习模型。

大宇无限是一家专门从事移动应用程序开发的公司,主要为中东、东南亚和拉丁美洲等新兴市场提供移动短视频服务。大宇无限技术副总裁刘克东表示:“在大宇无限的产品中实现视频内容的在线推荐,对我们的开发团队来说是一个巨大的挑战。构建机器学习系统的整个流程极为复杂,需要大量的开发者耗费很长的时间才有可能完成。Amazon SageMaker极大地简化了机器学习系统的构建、训练和部署流程,使我们无需构建基础设施,我们的算法工程师只需为Amazon SageMaker准备数据,仅用了三个月的时间就从零完成了整个系统的建设并承受了实际用户访问的压力。”

借助AWS提供的Amazon EC2 GPU实例和Amazon SageMaker,华来科技以优化的成本将机器学习创新融合到其智能家居、智慧安防设备和服务中。天津华来科技有限公司云业务部总监季宝平说:“在AWS上,我们可以完成算法的构建和模型训练,并且该过程完全不需要我们在本地投资昂贵的计算硬件,一切都是在云端以按需使用的方式完成。与行业通用的公开算法不同,更重要的是我们自己训练的模型在应用场景中具有更多个性化空间,并且我们对自己训练出的模型具有知识产权,这将是我们未来的核心竞争力。”

AWS合作伙伴网络 (APN) 成员对Amazon SageMaker在中国区域的上线也表示欢迎。

德勤D.Data是一个基于AWS的 PaaS (平台即服务) 平台,为企业客户提供数据分析和业务洞察。它为不同的行业和业务场景提供了各种数据建模和预测服务。德勤创新、数字化研发中心主管合伙人賴有猷评价道:“通过Amazon SageMaker,我们大大提高了算法和机器学习建模能力,提高了分析效率。Amazon SageMaker的IDE平台也帮助我们加快了开发进程。”

伊克罗德是AWS的核心级咨询合作伙伴 (APN Premier Consulting Partner),其基于AWS的解决方案极大地减少了用户的开发时间与运营费用。伊克罗德中国区副总裁桂梓捷表示:“我们运用Amazon SageMaker平台加速企业导入行业AI解决方案,如标签标注、文本分析、语意理解、预测分类、推荐系统与诈欺侦测等,针对客户实际遇到的商业问题,量身打造真正解决问题的端到端AI应用。随着Amazon SageMaker在中国区域落地,我们将会以SageMaker平台作为企业MLOps(机器学习运营)核心,协助企业构建MLOps流程,尤其在金融行业领域,帮助企业内部数据科学家与AI工程师建立、训练与部署机器学习模型。”

###

]]>