阿里达摩院 – 庄闲棋牌官网官方版 -199IT //www.otias-ub.com 发现数据的价值-199IT Mon, 29 May 2023 12:43:32 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.4.2 阿里达摩院:GPT-4替代初级数据分析师的成本只有0.71% 换成高级数据分析师则是0.45% //www.otias-ub.com/archives/1609227.html Mon, 29 May 2023 12:43:32 +0000 //www.otias-ub.com/?p=1609227 GPT-4 替代初级数据分析师的成本只有 0.71%,换成高级数据分析师则是 0.45%……

你没看错,是百分之零点七一,不是百分之七十一。

按新加坡行情,年薪 8.6 万-9 万美元 (60-63 万人民币)的高级数据分析师,换成 GPT-4 就只需要三四百美元(2000 多人民币)了。

这项结论来自阿里达摩院新加坡南洋理工大学的新论文,被网友评价为对 AI 和数据分析领域感兴趣的必读论文。

具体来说,结论中高级分析师指在金融行业拥有多年工作经验的数据分析师。

而 GPT-4 的表现,在大多数指标上能与一位 6 年工作经验的人类相当,正确性低于人类,但复杂性和一致性指标高于人类。

在与另一位 5 年工作经验的分析师对比中,GPT-4 在信息的正确性、图表的美观性、洞察的复杂性等方面输给人类。

如果与 2 年工作经验的初级分析师对比,GPT-4 在正确性上表现更好,而且能完成更多的工作。

但 GPT-4 完成所有类型的任务都要比人类快得多。

在假设每个月有 21 个工作日,每天 8 小时工作时间,按市场价支付工资的前提下,得出最终结论。

GPT-4 当数据分析师,都能干什么

论文重点考察了 GPT-4 作为数据分析师的以下几种能力:

  • 生成 SQL 和 Python 代码
  • 执行代码获得数据和图表
  • 从数据和外部知识源中分析数据,得出结论

200 个样本的实验表明,对于绘制图表任务,GPT-4 能够理解指令含义,且对图表类型有一定背景知识,从而绘制出正确的图表。

图表大部分清晰可见,没有任何格式错误,图标的美观性指标满分 3 分,GPT-4 平均得分 2.73。

但手工检查还是能发现一些小错误,图表准确性指标满分 1 分,GPT-4 平均得分 0.78。

论文中特别说明他们的评估标准非常严格,只要 x 轴或 y 轴的任何数据或任何标签有错误,都要扣分。

对于数据分析任务,GPT-4 在一致性和流畅性中平均得到满分,验证了生成流畅且语法正确的句子对 GPT-4 来说绝对不是问题。

有意思的是,到了数据分析这一步的准确性要比图表信息的准确性高得多,说明尽管 GPT-4 画了错误的图表但分析出了正确的结论。

在案例分析中,研究团队还总结出三条 GPT-4 与人类数据分析师的主要区别:

  • 人类分析师可以用个人思想和情感来表达,比如在分析时写“令人惊讶的是……”;人类读者容易从这样的表述中理解数据是符合预期还是不正常的。
  • 人类分析师倾向于结合背景知识得出结论,如写到“…… 常见于……”;GPT-4 通常只关注提取到的数据本身,允许 GPT-4 上网搜索实时在线信息可以改善这一点。
  • 当提供见解或建议时,人类分析师倾向于保守,如声明“假如数据没有问题的话……”;GPT-4 会以自信的语气直接给出建议,不会提及假设。

另外团队表示,由于预算有限,主要是雇一个来与 GPT-4 对比的高级分析师太贵了,人工评估和数据标注的数量相对较少。

在最后的结论则是:

实验结果和分析表明,GPT-4 在数据分析上有与人类相当的性能,但是否可以取代数据分析师需要近一步研究才能得出结论。

论文:

https://arxiv.org/abs/2305.15038

本文来自微信公众号:量子位 (ID:QbitAI),作者:梦晨

]]>
阿里达摩院发布AI EARTH 可精准分析遥感卫星、无人机等影像信息 //www.otias-ub.com/archives/1121838.html Fri, 18 Sep 2020 06:13:00 +0000 //www.otias-ub.com/?p=1121838 从太空看地球,达摩院找到了新方法!9月18日,2020云栖大会上,达摩院发布首个泛自然资源行业AI引擎AI EARTH,首次实现对天、空、地多源数据精准分析的能力,可清晰记录分析地球每一寸土地变化,大到山川植被湖泊面积变化、小到农作物生长情况,都能快速、精准分析。

卫星遥感影像是人类观测地球的主要途径,但随着无人机影像、实时视频流、气象信息、IoT数据等全新数据源的涌现,数据规模呈几何级增长,人工观测和经验分析的方式已无法满足海量观测数据的需求。

AI EARTH可分析无人机影像、实时视频流、气象信息、IoT数据等数据源

AI EARTH采用达摩院视觉AI技术,是业界首个实现多源对地观测数据的智能分析的解决方案,支持RGB影像、多光谱影像、高光谱影像及普通视频影像,可快速提取地表覆盖现状信息和时空动态变化信息,并且拥有比传统遥感方案更高的精度。

据介绍,AI EARTH利用主动学习和半监督学习等技术,自研了多个创新算法。该引擎集成了达摩院自研遥感目标检测及分割框架,引入多尺度环境语义信息,实现遥感图像目标检测准确率的突破。以大棚监测为例,北京市规划和自然资源委员会使用阿里遥感技术,违章大棚房监测准确率达到90%。此外,遥感应用场景极为丰富和多样,同一解译对象在不同空间、时间维度下差异巨大,AI EARTH通过域自适应等迁移学习技术,大幅提升了AI算法在不同场景下的精度及泛化能力。

达摩院资深算法专家李昊表示,“未来AI对多源数据的融合分析是人类对地观测的趋势,我们希望AI EARTH能在空天信息领域发挥更大的价值,让AI看懂地球。”

阿里巴巴是国内最早将AI技术应用于卫星遥感影像领域的公司之一,相关研究成果已广泛应用于各行各业。今年汛情期间,达摩院团队一周内就开发训练出应用于防汛关键期的水体识别算法,影像分析速度提升百倍,大大提升防汛工作智能化水平。

]]>
阿里达摩院:2019十大科技趋势 //www.otias-ub.com/archives/816505.html Wed, 02 Jan 2019 15:47:44 +0000 //www.otias-ub.com/?p=816505 2018的冬天有点冷,但科技依然拥有瞬间点燃人们激情的魔力。1月2日,阿里巴巴达摩院发布了“2019十大科技趋势”,涵盖了智能城市、数字身份、自动驾驶、图神经网络系统、AI芯片、庄闲网络娱乐平台进入 、5G等领域。

在经济下行压力增大的大环境下,阿里巴巴达摩院让人们聚焦到真正创造价值的前沿技术,为2019年的发展提供理论支撑和想象力源泉。

2019年,AI依然将是科技界最热的方向。如果说2018年AI从实验室走入了现实,那么,2019年将开启人类和AI全面合作的新起点。达摩院认为,移动设备上的实时语音生成与真人语音可能将无法区分,甚至语音AI在一些特定对话中将会通过图灵测试。在城市里,会说话的公共设施将会越来越多。

AI技术虽然发展最热,但比它更快进入成熟阶段的是生物识别技术。达摩院认为,2019年,生物识别技术将进入大规模应用阶段。过去几年,很多人开始习惯出门不带钱包,不带现金,而未来,不带身份证走遍天下的时代也将不会太遥远。随着3D传感器的快速普及、多种生物特征的融合,每个设备都能更聪明地“看”和“听”。生物识别和活体技术将重塑身份识别和认证,数字身份将成为人的第二张身份证。

在很多人关心的5G领域,达摩院认为,5G网络的连接能力将增强至百亿级,带来海量的机器类通信及连接的深度融合。随着5G时代的来临,网络将向云化、软件化演进,也将会催生全新应用场景,例如车路协同、工业互联网等领域将获得全新的技术赋能。

2018年杭州云栖大会上,杭州城市大脑2.0的发布让人们再次震惊,城市大脑的能力从交通领域延展至包括在消防、城建、环境在内的社会精细化管理。达摩院认为,中国将会有越来越多城市拥有城市大脑。同时,城市实时仿真成为可能,城市局部智能将升级为全局智能,未来会出现更多的力量进行城市大脑技术和应用的研发,实体城市之上将诞生全时空感知、全要素联动、全周期迭代的智能城市,大大推动城市治理水平优化提升。

2018年,曾经炙手可热的自动驾驶经历冰火两重天,从资本企业一拥而上再到普遍看衰,自动驾驶寒冬论一度甚嚣尘上。达摩院认为,单纯依靠“单车智能”的方式革新汽车,确实在很长一段时间内将无法实现终极的无人驾驶,但并不意味着自动驾驶完全进入寒冬。车路协同技术路线,会加快无人驾驶的到来。在未来2-3年内,以物流、运输等限定场景为代表的自动驾驶商业化应用会迎来新的进展,例如固定线路公交、无人配送、园区微循环等商用场景将快速落地。

新技术令人憧憬,但也给人们带来安全和风险的担忧。因此,网络安全将在2019年继续成为科技领域的热点。达摩院认为,未来几年,黑客、黑产攻击不会停止,但数据安全保护技术将加码推出。各国政府都会趋向于推出更加严厉的数据安全政策法规,企业将在个人数据隐私保护上投入更多力量。跨系统的数据追踪溯源相关的技术将得到更加广泛应用。

趋势1:城市实时仿真成为可能,智能城市诞生

城市公共基础设施的感知数据与城市实时脉动数据流将汇聚到大计算平台上,算力与算法发展将推动视频等非结构化信息与其他结构化信息实时融合,城市实时仿真成为可能,城市局部智能将升级为全局智能,未来会出现更多的力量进行城市大脑技术和应用的研发,实体城市之上将诞生全时空感知、全要素联动、全周期迭代的智能城市,大大推动城市治理水平优化提升,预计在新的一年,中国会有越来越多城市具有大脑。

趋势2:语音AI在特定领域通过图灵测试

随着端云一体语音交互模组的标准化、低成本化,会说话的公共设施会越来越多,未来每一个空间都至少会有一个可以进行语音交互的触点。随着智能语音技术的提升,移动设备上的实时语音生成与真人语音可能将无法区分,甚至在一些特定对话中通过图灵测试。针对这一领域的规则甚至法律会逐步建立,引导行业走向规范化。

趋势3:AI专用芯片将挑战GPU的绝对统治地位

当下数据中心的AI训练场景下,计算和存储之间数据搬移已成为瓶颈,新一代的基于3D堆叠存储技术的AI芯片架构已经成为趋势。

AI芯片中数据带宽的需求会进一步推动3D堆叠存储芯片在AI训练芯片中的普遍应用。而类脑计算芯片也会在寻找更合适的应用中进一步推动其发展。在数据中心的训练场景,AI专用芯片将挑战GPU的绝对统治地位。真正能充分体现Domain Specific的AI芯片架构还是会更多地体现在诸多边缘场景。

趋势4:超大规模图神经网络系统将赋予机器常识

单纯的深度学习已经成熟,而结合了深度学习的图神经网络将端到端学习与归纳推理相结合,有望解决深度学习无法处理的关系推理、可解释性等一系列问题。强大的图神经网络将会类似于由神经元等节点所形成网络的人的大脑,机器有望成为具备常识,具有理解、认知能力的AI。

趋势5:计算体系结构将被重构

无论是数据中心或者边缘计算场景,计算体系将被重构。未来的计算、存储、网络不仅要满足人工智能对高通量计算力的需求,也要满足物联网场景对低功耗的需求。基于FPGA、GPU、ASIC等计算芯片的异构计算架构,以及新型存储器件的出现,已经为传统计算架构的演进拉开了序幕。从过去以CPU为核心的通用计算而走向由应用驱动(Application-driven) 和技术驱动(Technology-driven)所带来的Domain-specific 体系结构的颠覆性改变,将加速人工智能甚至是量子计算黄金时代的到来。

趋势6:5G网络催生全新应用场景

第五代移动通信技术将使移动带宽大幅度增强,提供近百倍于4G 的峰值速率,促进基于4K/8K超高清视频、AR/VR等沉浸式交互模式的逐步成熟。连接能力将增强至百亿级,带来海量的机器类通信及连接的深度融合。网络向云化、软件化演进,网络可切片成多个相互独立、平行的虚拟子网络,为不同应用提供虚拟专属网络,加上高可靠、低时延、大容量的网络能力,将使车路协同、工业互联网等领域获得全新的技术赋能。

 

趋势7:数字身份将成为第二张身份证

生物识别技术正逐渐成熟并进入大规模应用阶段。随着3D传感器的快速普及、多种生物特征的融合,每个设备都能更聪明地“看”和“听”。生物识别和活体技术也将重塑身份识别和认证,数字身份将成为人的第二张身份证。从手机解锁、小区门禁到餐厅吃饭、超市收银,再到高铁进站、机场安检以及医院看病,靠脸走遍天下的时代正在加速到来。

趋势8:自动驾驶进入冷静发展期

单纯依靠“单车智能”的方式革新汽车,在很长一段时间内无法实现终极的无人驾驶,但并不意味着自动驾驶完全进入寒冬。车路协同技术路线,会加快无人驾驶的到来。在未来2-3年内,以物流、运输等限定场景为代表的自动驾驶商业化应用会迎来新的进展,例如固定线路公交、无人配送、园区微循环等商用场景将快速落地。

趋势9:庄闲网络娱乐平台进入 回归理性,商业化应用加速

在各行业数字化的进程中,物联网技术将支撑链下世界和链上数据的可信映射,庄闲网络娱乐平台进入 技术将促进可信数据在流转路径上的重组和优化,从而提高流转和协同的效率。在跨境汇款,供应链金融,电子票据和司法存证等众多场景中,庄闲网络娱乐平台进入 将开始融入我们的日常生活。随着“链接”价值的体现,分层架构和跨链互联将成为庄闲网络娱乐平台进入 规模化的技术基础。庄闲网络娱乐平台进入 领域将从过度狂热和过度悲观回归理性,商业化应用有望加速落地。

趋势10:数据安全保护技术加速涌现

各国政府都会趋向于推出更加严厉的数据安全政策法规,企业将在个人数据隐私保护上投入更多力量。未来几年,黑客、黑产攻击不会停止,但数据安全保护技术将加码推出。跨系统的数据追踪溯源相关的技术,比如水印技术,数据资产保护的技术以及面向强对抗的高级反爬虫技术等将得到更加广泛应用。

]]>