互联网技术 – 庄闲棋牌官网官方版 -199IT
//www.otias-ub.com 发现数据的价值-199IT Thu, 03 Nov 2022 05:13:30 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.4.2 Web3.0:中国如何引领互联网技术变革?
//www.otias-ub.com/archives/1448464.html Mon, 13 Jun 2022 08:06:28 +0000 //www.otias-ub.com/?p=1448464

2021 年是新技术的爆发年:脑机接口技术、庄闲网络娱乐平台进入 和非同质化代币(NFT)、扩展现实技术(XR)等相关前沿加速发展,一个基于信任机制的、连接虚拟世界与现实世界的数字经济发展新互联网时代逐渐显现。

全球数字经济发展的领头羊,加速布局下一代互联网技术既是自身发展的实际需求,也是参与全球竞争的重要一步。

web3.0 与新一代数字经济产业发展趋势

(一)、web3.0 带来的三大影响

通常把上世纪 90 年代英国计算机科学家蒂姆 · 伯纳斯 · 李创造的浏览器访问的静态互联网称为 web1.0,它是一个可以通过浏览器访问、只能读取信息的互联网模式。进入 2000 年以来,web 2.0 时代随着 Google Facebook 等大型平台企业的兴起而到来,用户可读可写,甚至成为内容创造的主体。2006 年后,伴随着移动互联网产业的日趋成熟,产业界已经开始畅想和探索下一代互联网(web3.0),概括总结相关技术路径主要分为三大方向:

⏩以万维网(www)之父蒂姆 · 伯纳斯 · 李在 1998 年提出语义网并一路发展到今天的知识图谱派

⏩以比特币之父中本聪在 2008 年提出的庄闲网络娱乐平台进入 到今天以庄闲网络娱乐平台进入 技术、加密货币以及非同质化代币(NFT为核心构建的下一代互联网去中心化派

⏩以美国科幻小说家尼奥斯蒂文森在 1992 年发表的作品《雪崩》描述了一个平行现实世界的虚拟空间发展到最近热炒的通过核心人机交互XR 技术Extended Reality,扩展现实)引领,并包含算力、算法、网络、内容等共同支撑的元宇宙派

web3.0 等新一代数字经济技术创新与产业机遇已经浮出水面,它将会带来以下三个方面的影响:

一是数字技术创新加速涌现,带来增长新动能。web3.0 打通数字世界与现实世界连接,需要大量的新技术支撑,人工智能、庄闲网络娱乐平台进入 、数字隐私保护、虚拟现实等技术突破。上述技术对算力的要求都非常高,需要计算、网络、存储等 IT 基础支撑能力有飞跃式的提升。

二是重塑规则,推进改革。web3.0 中,随着数字孪生相关技术的发展,人们有机会以更加宏观、全局、透明的全新视角重新理解现实,加快改革进程。在 BIM、智能制造技术帮助下,对建设、制造等传统工序工艺进行调整优化;数字货币成为重要的金融交易媒介后,全球金融秩序即将面临重新洗牌的新格局。在数字虚拟世界规则创新方面,NFT 技术的出现,线上的数字文化作品的产权规则将更新,数字产权与新的信任关系建立,虚拟世界的规则和现实世界的秩序也做出相应调整。

三是带来全面数字化升级,规则将成为竞争新高地。随着 web3.0 新技术、新硬件和软件的应用,过去在数字经济基础上快速发展的通信、社交、游戏、电商等数字经济产业将以虚实世界通道的方式继续发展,实体经济数字化程度提升,个人、组织的现实身份和虚拟身份一体化,不断融合,将更深影响科技、金融、市场、政策乃至文化艺术、法律规则的发展,产业体系和社会生活将呈现出全新的面貌。在这一背景下,标准、规则的影响力将进一步扩大。

(二)金融行业变革:庄闲网络娱乐平台进入 、NFT、数字人民币

1庄闲网络娱乐平台进入 通过多方共识记录交易结果,在技术和机制上实现了可信、共识、防篡改能力,其关键核心技术有点对点通信、共识机制、加密算法、智能合约等。随着应用场景的不断深入,高性能、强隐私、互联互通等成为庄闲网络娱乐平台进入 技术发展的重要方向和着力点,关键技术进阶朝着应用端汇集。2018 年庄闲网络娱乐平台进入 技术被首次运用到天猫双 11,包括钻石、奶粉、保健品等来自上百个国家和地区的 1.5 亿件商品采用了庄闲网络娱乐平台进入 溯源技术。伴随着庄闲网络娱乐平台进入 技术在双 11 场景下的历练而不断成熟,技术也快速在公益溯源、商品溯源、城市服务、跨境支付、司法维权和供应链金融等六大业务领域落地。庄闲网络娱乐平台进入 技术让普通人在接受各种服务时省去不必要的中间流转环节,从而提升服务的效率和质量。

2NFT 是基于庄闲网络娱乐平台进入 技术实现的具有不可替代属性的代币,它可以与特定的数字或物理资产以及将该资产用于特定目的的许可相关联,用以在数字市场上的交易和出售。NFT 的不可替代特性非常适用于表示数字商品的唯一权属性,用以数字权属凭证。NFT 真正崛起于 2017 年,主要得益于当时在以太坊热潮中推出的 CryptoKitties,其具有突破性的创新点在于用户可以在该应用中创造新的 NFT,自此 NFT 真正走入人们的视野。2018 OpenSeaSuperRare 等平台纷纷建立,不但引领 NFT 项目再次蓬勃,也标志着 NFT 生态萌芽的建立。2020 年是 NFT 发展史上的爆发点(参见图表 1),一方面由于虚拟货币市场的交易环境不断优化,另一方面受到新冠肺炎疫情的影响,传统投资行业吸引力下降,NFT 市场成为了当时部分投资人心中的蓝海。同年,数字艺术家 Beeple 耗时 14 年的作品《Everydays: The First 5000 Days》在佳士得上拍出 6934 万美元天价,将 NFT 的发展推向风口。

3央行数字货币。各国央行也注意到互联网新技术带来的机遇,全球主要经济体 65 家央行中有 56 家在研究主权数字货币1。全球首个通用数字货币项目是瑞典央行于 2020 2 月开始试点的电子克朗(e-krona)项目。中国人民银行在主权数字货币的推动方面开始发力,2020 8 月,数字人民币在深圳开始小规模试点。数字人民币集成了加密货币的思想和优点,综合使用数字加密和数字签名技术、支持交易不可篡改和不可抵赖。未来结合智能合约的跨境央行数字货币支付体系将打破现有以 SWIFT 为代表的国际支付电讯运行体系(参见图表 2)。2021 9 月,在国际清算银行香港创新中心支持下,中国人民银行数字货币研究所、香港金融管理局、泰国央行及阿联酋央行共同发布多边央行数字货币桥(mBridge)的报告2,在分布式账本结构下,实现秒级交易、更低成本的跨境数字货币支付体系。跨境央行数字货币交易未来将不再需要 SWIFT 体系的支撑,其支付即结算的便利性,智能合约的可编程性更将带来更多的业务模式创新。

(三)新一代互联网新技术、新产业发展

首先是 XR 作为连接虚拟与现实的核心技术快速发展。已形成包括 HCI,图形学,视觉,芯片以及 NLP 等专业领域。XR 产业是下一代互联网中最明确的产业之一,包含了 VR(虚拟现实)、AR(增强现实)、MR(混合现实)、HR(全息现实)等多种视频呈现和交互方式的总称,通过计算机技术和可穿戴设备探索建立人机交互的环境。

其次是人工智能技术的发展,为机器迅速、准确地理解现实世界并做出正确反馈奠定基础。在大数据、云计算等技术推动下,人工智能技术的发展也呈现出新趋势,其中人工智能大模型取代小模型成为新一代人工智能基础设施。大模型拥有成百上千倍神经元数量,通过预先学习海量知识(语言、图像、音视频等),实现多元场景的应用,更适于设计、运营、文学艺术、科学研究等需要更多智能的领域。且能够大幅降低小模型仅针对特定领域有标注的数据训练,难以轻微适应场景变化、大量依赖手工标注和调整导致的研发成本。实现了中小企业低成本使用高品质服务,有效促进人工智能技术和产业发展。目前美国 OpenAI、谷歌、微软、脸书等机构加速布局大规模智能模型,并形成了 GPT-3Switch Transformer 等千亿或万亿参数量的大模型。阿里巴巴达摩院 M6 大模型已能够实现 10 万亿级别的参数运算,同时通过模型优化,算力消耗与能耗降低 80%,效率提高 11 倍,已经完成商业化落地,可服务我国更多中小企业使用人工智能技术。

三是云计算技术与基础设施支撑下一代互联网发展。下一代互联网的发展趋势——虚拟世界的真实化、真实世界的数字化、人机交互等发展方向对算力的要求极高,需要高效、低成本、扩展性高、清洁绿色的云计算基础设施支撑。同时,由于虚拟世界和现实世界高度联动,从体验和安全的角度,下一代互联网对时延、数据灾备、数据安全的要求极高,在人群高度聚集、产业高度发达的核心城市,布局和发展面向互联网 3.0 的算力中心,并于相对偏远地区建立分层、分级的数据存储安全体系十分必要。

四是加速脑机接口等信息生物学、医学、脑科学发展。脑机接口的研究工作始于上世纪 70 年代,由加州大学洛杉矶分校 (UCLA) Jacques Vidal 在美国国家科学基金会的资助下开始3,通过在人脑与外部设备间建立的直接通讯路径来研究、映射、辅助、增强甚至修复人类认知或感觉运动功能。其中人工耳蜗已经成功用以临床;人工视网膜技术近几年也取得突破, 进入临床试用阶段;恢复瘫痪患者运动能力的脑机系统在实验室中也取得了不错的效果。2020 8 月,埃隆 · 马斯克旗下的公司 Neuralink 举行新闻发布会,向全世界展示了新研发的脑机接口芯片和自动植入手术设备。

中国发展新一代互联网所面临的机遇与挑战

对比美国,我国发展新一代互联网仍存在较大差距,主要体现在技术积累、现有产业水平、生态完善程度、创新 IP 资源等方面:

1、美国把庄闲网络娱乐平台进入 等技术确立为国家战略性技术,智能硬件处于绝对领先地位。庄闲网络娱乐平台进入 最大的应用场景是加密货币,虽然加密货币仍然面对巨大的监管不确定性(最大的挑战来自于背后缺乏主权货币或资产价值的支撑以及交易缺乏有效的金融监管、市场投机气氛浓重),基于庄闲网络娱乐平台进入 和数字加密技术的比特币还是推动了私营机构发行加密货币的热潮,据加密资产价格跟踪网站 CoinMarketCap4 跟踪的加密货币就有 18990 种,市值已经超过 1.9 万亿美元。

在智能硬件领域,根据媒体报道,2021 年第一季度,脸书旗下的 Oculus 的出货量已经占到全球 VR/AR 头显出货量的 75%。英伟达在图像处理芯片(GPU)领域具有绝对的话语权与主导权,全球主要云厂商的人工智能加速器实例均部署了英伟达 GPU

2、云计算产业发展水平高。目前全球排名前四的云计算厂商中美国企业 3 家(亚马逊、微软、谷歌)、中国 1 家(阿里巴巴),目前全球 90%以上大型游戏公司依托 Amazon 云在线托管。中国云计算厂商的世界竞争力有待提升。

3、底层架构依赖美国平台。 Unity 开发的游戏引擎、Epic Games 的虚幻引擎、英伟达的 Omniverse 硬件底层、Microsoft 把虚拟体验协作平台 Mesh 直接植入到 Teams 中、Decentraland 的经济系统等,为下一代互联网应用场景和产业发展提供了强大的产业化工具,广泛应用于游戏、影视等领域,上述基础软件平台在工业化和自动化生产领域也得到了广泛的应用。

4IP 文化软实力全球认可。美国在电影、游戏、音乐、体育比赛等领域拥有众多全球影响力 IP 产品。体育 NFT 产品 NBA Top Shot2020 10 月发行,允许用户购买和出售赛场上的精彩瞬间。在 2019 年洛杉矶湖人队和萨克拉门托国王队的一场比赛中,勒布朗 · 詹姆斯灌篮内曼尼亚的视频以 20.8 万美元的高价出售。日本动漫 IP 资源丰富,游戏产业发达。任天堂发布《动物之森》系列游戏引发全球游戏机消费潮。而国内 IP 影响力范围有限。

发展下一代互联网技术及产业的建议

1)布局下一代互联网产业基础设施和技术

一是提升算力基础设施发展水平。建模仿真、人机交互、人工智能等如果要实现应用目标,必须依赖强大的算力支撑。在人群高度聚集、产业高度发达的核心城市,布局面向互联网 3.0、绿色高效算力中心十分必要。同时考虑到多网融合等要求,6G 有望为下一代互联网提供基础网络支撑。

二是在人工智能领域加强引领性技术研发。在人工智能产业链完整、发展水平高的基础上,加速大模型的发展,尤其是加速大模型的产业化应用。

三是进一步加强硬件研发、通信网络技术升级和产业转化。自主研发的图像处理芯片、光学材料、屏幕和硬件制造等产业需要进一步加强,尤其是对 6G 等新技术加速布局。

四是充分发挥基础研发实力,政策引导探索脑机接口等前沿技术领域的产业转化。

2)在先行行业开放关键场景,带动产业发展

一是在互联网领域,持续发展游戏、社交等需求场景和商业化模式较为清晰的下一代互联网应用。二是在数字化程度高的行业如金融、通讯,加快布局落地商业场景。早在 2017 年,法国巴黎银行(BNP Paribas)推出了一款基于 VR 的零售银行应用程序,允许用户虚拟访问其账户活动和交易记录。北京的商圈 VR 应用逐渐兴起,但在直播、虚拟商业等领域的应用有待提升。三是充分发挥各地旅游、文化等 IP 资源优势,建设标杆项目,在项目中沉淀技术和标准。如 2021 12 31 日八达岭长城联合支付宝发布全国首款数字纪念门票,采用蚂蚁链的庄闲网络娱乐平台进入 技术进行 IP 版权保护及确权,让游客拥有独一无二的数字纪念票。

3)服务智能制造推动传统产业升级

XR 技术和智能制造相结合,会催生出更智能化的技术装备、协同化的产品创新体系、柔性化的生产方式、集约化的资源利用以及精准化的管理模式。一是优化生产流程设计。对生产流程进行数字孪生建模,工艺管理人员可以轻松地拖放生产设备、修改生产流程,并通过虚拟世界的仿真模拟来优化制造中的生产效率、提高生产的安全性。二是构建消费者参与的定制化产品设计模式。通过虚拟现实的方式,将产业相关方纳入到产品的设计阶段中。并支持众包式的产品设计方式,根据反馈进行设计迭代,构建协同化的产品创新体系。三是实现全供应链可视化管理。客户可以在全供应链数字孪生 3D 系统中实时看到所购买商品的交付状态,将供应链流程可视化提高到前所未有的程度。

4)多元化措施保障下一代互联网产业孵化发展

一是鼓励下一代互联网产业上下游相关人才聚集。我国数字经济产业经历了 20 年的高速,产业正在快速发展,需要硬软件研发、原画设计、仿真建模等许多领域的人才,相关产业人才也需要持续培训不断提升自身发展水平。二是在资金支持上,对相关前沿技术应用企业和拥有自主研发能力的技术企业、生态相关企业给予一定资金支持,引导产业集群形成。可通过以赛促产等方式,给产业创新企业搭建舞台。三是将下一代互联网应用充分融入各类数字经济活动,营造产业发展氛围。

参考文献:

[1]http://www.pbc.gov.cn/goutongjiaoliu/113456/113469/4293590/2021071614200022055.pdf

[2] “Inthanon-LionRock to mBridge, Building a multi CBDC platform for international payments”,https://www.bis.org/publ/othp40.pdf

[3]https://www.annualreviews.org/doi/10.1146/annurev.bb.02.060173.001105

[4] https://coinmarketcap.com/,数据截至 2022 4 20

来自: 阿里研究院

]]>
腾讯QQ大数据 :从“增长黑客”谈数据驱动的方法
//www.otias-ub.com/archives/743270.html Sun, 01 Jul 2018 00:49:47 +0000 //www.otias-ub.com/?p=743270

对于增长黑客(Growth Hacker),行业里有一个很清晰的定义就是数据驱动营销,以市场指导产品,通过技术化手段贯彻增长目标的人。所以这里有一个很核心的理念就是数据驱动营销和增长,这个也是数据团队的核心价值所在。经过多年的实战经验积累,我们沉淀了一套适用于自身业务的数据驱动方法,希望能够拿出来跟大家做个分享,欢迎大家关注。

1. 背景

近两年来,随着“增长黑客”的概念从大洋彼岸的硅谷传入国内,相关的理念和方法开始在互联网技术圈流行起来。2015年,《增长黑客》一书的出版和流行更是把“增长黑客”这个名词正式带入了大众的视野。“增长黑客”近年来兴起于美国互联网创业圈,指的是一种新型的职业或团队角色,主要是依靠技术和数据的力量来达成营销目标,而非传统意义上靠砸钱来获取用户的市场推广角色。因此,增长黑客有一个很重要的理念就是“数据驱动”,也就是通过对数据的分析挖掘来发现有价值的数据洞察,并推动线上的落地应用,再通过A/B test来不断的迭代优化,最后找到最有效的策略方案,帮助业务实现持续增长。

作为公司历史最悠久的数据团队之一,SNG数据中心早在2008年就开始建设专门的数据团队,9年来一直致力于大数据的分析和挖掘,通过数据来支持SNG业务的发展。在这个过程中,我们也积累了不少的理论方法和实战经验,希望能够拿出来跟大家做个分享。我们的分享计划分批展开,涉及的内容包括数据基础能力建设、大盘指标预测、用户增长分析、营收增长分析、产品优化分析等。后面我们会有相关系列文章陆续发出,这篇文章算是一篇开篇的综述,旨在让大家能够对我们的经验方法有个整体的了解。当然,数据涉及到的知识体系和领域太过庞大,我们的分享也只是冰山一角,希望能够给大家带来一些启发,欢迎大家关注。

2. 基础能力建设

问渠那得清如许,为有源头活水来。数据行当里面有一句老话叫做“Garbage in,garbage out(垃圾进,垃圾出)”,指的就是要从源头上确保数据的及时和准确,以保证上层的分析和挖掘能够得出正确的、有价值的结论。SNG的数据异构现象突出,业务上包含了即时通讯(QQ)、社交平台(QQ空间)、增值产品(QQ会员、黄钻等)、游戏(手Q游戏、空间页游)等庞杂的业务体系,而且个个都是海量的数据,不仅如此,随着公司组织架构的调整我们还经历过大范围的PC数据和移动端数据的整合,有大量的历史遗留问题要解决,复杂程度可想而知。这一节将为大家介绍我们为了管理和维护这么多纷繁复杂的业务数据是如何建设基础的数据能力的。

2.1 数据上报通道建设

对于大部分的数据挖掘工程师来说,对数据的理解和应用都是从数据仓库开始的,殊不知,用户在产品上的每一次操作行为要上报到数据仓库成为某个库表中的一行记录都要经过Agent部署、埋点、上报、转发、清洗、调度入库等多个步骤,每一个步骤都需要严格保证数据的一致和稳定。在数据量小、数据结构简单的情况下,这或许不是一件太难的事情,但是面对SNG海量异构的复杂数据环境,要保证好数据的一致、稳定、实时,绝不是一项容易的工作。为了更好的应对海量复杂的数据上报问题,早在2012年,我们就开始了新一代数据上报通道DataCollector(简称DC)的建设。经过4年多的持续迭代优化,DC现在每天要支持1P+大小,1万亿+记录条数的数据的稳定上报,为SNG的底层数据建设立下了汗马功劳。DC通道的架构可以参考图1:

图1:DC数据上报通道架构图

按照DC数据上报通道的架构,我们只需要六步即可完成一次新的数据上报:

第一步:安装及检查DCAgent版本

第二步:按照API文档进行数据上报埋点

第三步:创建新的数据接口

第四步:检查上报通道

第五步:查询流水数据

第六步:查看入库情况

2.2 数据体系建设

完善的数据上报通道的建设解决了数据来源的问题,但是海量的数据在上报到数据仓库的过程中以及上报之后如果没有科学有效的治理,后果将是灾难性的,就像洪水来袭时没有防洪工程,任由洪水泛滥一样恐怖。比如在日常的数据工作中,我们经常遇到这样的情况:数据库表没有说明文档,字段定义和统计逻辑不清晰,业务核心指标口径不统一,库表搜索难度大,等等。这些问题都是由于缺乏科学合理的元数据管理和数据体系导致的。SNG在多年的数据工作中也是深受这些问题的困扰。痛定思痛,我们通过规范数据上报、建立标准化接口、规范数据字典等一系列优化措施的执行,针对即时通讯、社交平台、包月增值等业务,沉淀了一套适合SNG业务特点的数据体系建设的方法。

以社交平台为例,我们总结了一套适用于社交产品用户写操作行为的数据体系如表1以及写操作维表如表2:

写操作时间 QQ号码 写操作来源 一级操作ID 二级操作ID 写操作次数
20170313 123456 1(PC) 5 822 5
20170313 123456 2(iOS) 5 823 10
20170313 123456 3(Android) 5 36 15

表1:社交平台写操作行为数据体系示例

 

一级操作ID 一级操作名 二级操作ID 二级操作名
5 UGC操作 822 原创
5 UGC操作 823 转发
5 UGC操作 36 评论回复

表2:社交平台写操作维表示例

该数据体系及维表体系建设起来之后,纵使业务变幻,万变不离其宗,有新的写操作功能特性发布之后,只需要按照约定好的数据体系进行埋点上报,同时在维表里添加新的写操作ID的映射关系,报表即可自动生成,不需要数据分析师再额外开发,可见一个科学的数据体系的重要性,可以大大减少人力成本,提升开发效率。

       2.3 指标体系建设

曾经听一个从鹅厂出去创业的同事讲过他自己亲身经历的一个创业故事。在他们的产品上线初期,公司最大的目标就是获取更多的安装用户。为了达成这个目标,他组建了一个庞大的线下团队在各个网点做地推,同时线上也在购买各种渠道和广告,进行品牌宣传。一段时间的运营下来,成效显著,安装用户数每天都在成倍甚至十几倍的增长。就在整个公司上下都在为安装用户数的大涨而欢呼雀跃的时候,他自己却陷入了极大的恐慌之中。因为他发现,在庞大的安装用户里,日均活跃用户数(DAU)非常少,也就是说公司花费了巨大的精力和成本获取来的用户,最终却没有在产品中留存下来。在接下来的时间里,他迅速调整了公司目标,开始以提升DAU为导向指导运营思路,最终成功的提高了用户的留存,DAU也随之改变了之前的颓势,开始稳步上涨。

同样的故事在硅谷也发生过。早在 Facebook 成立之前,美国社交网络的老大是MySpace。MySpace 历史久,用户多,还有东家加大金主新闻集团撑腰,从任何一个角度看都应该可以轻易碾压由几个大学辍学生创办的 Facebook,最终却输得一败涂地。其中的原因当然不只一个,但是有一个有趣的区别是:MySpace 公司运营的主要指标是注册“用户数”,而 Facebook 在 Mark 的指引下,在成立的早期就把“月活跃用户数”作为对外汇报和内部运营的主要指标。

相比之下,从“用户数”到“月活跃用户数”,看起来只是多了三个字,却确保了 Facebook 内部的任何决策都是指向真实持续的活跃用户增长。

这样的故事背后,其实考验的是一家公司或者一个产品的指标体系规划和建设能力。在“增长黑客”的理念当中,有一个“北极星指标(North Star Metric)”的概念,指的就是有一个唯一重要的的指标,像北极星一样挂在天空中,指引着全公司上上下下,向着同一个方向迈进。当然,不同的产品形态会有不同的北极星指标,平台产品关注的是活跃用户数、活跃留存率这类指标,营收产品关注的是付费用户数、付费渗透率等等。在不同的产品发展阶段,指标体系的规划也会有所不同。我们对不同的产品形态及产品发展阶段的指标体系进行多年的研究之后,针对产品从灰度上线到稳定期的各个阶段总结了一套适用于大多数产品的不同发展阶段的指标体系,如图3:

图3:产品各发展阶段的指标体系规划

3. 用户增长分析

前面介绍了我们在数据上报、数据体系、指标体系等方面做的基础建设工作。面对每天上报的1P+大小,1万亿+记录条数的海量数据,我们当然不会止步于报表开发层面,更加不会让这些有巨大价值的数据躺在仓库里面睡大觉。特别是在人口红利衰减,业务增长乏力的大环境下,如何从海量的数据中挖掘出对用户、对产品有价值的信息助力业务增长,成了我们数据团队每天都在思考的问题,这也是“增长黑客”的核心使命。在本节中,我将通过用户生命周期管理(CLM)和用户分群两个在数据精细化运营中经常用到的方法来介绍我们是如何通过数据来驱动业务增长的。

       3.1 用户生命周期管理(CLM)

任何一名产品运营人员,每天思考的无非是这三个哲学上的终极问题:用户是谁,用户从哪里来,用户要到哪里去。为了解决好这三个问题,用户生命周期管理(Customer Life-Cycle Management)方法应运而生。传统的用户生命周期管理基本上包含五个阶段:获取、提升、成熟、衰退、离网,用户在不同的生命周期阶段会有不同的诉求,产品运营上也会有不同的方案和侧重点:

图4:用户生命周期

这里有很多数据可以发挥巨大价值的地方,以新用户获取为例,通过对历史新进用户的特征进行分析和数据建模,我们能够建立一个预测用户转化概率的精准拉新模型,在推广资源有限的情况下,锁定高转化概率的潜在用户进行资源投放,大大提升投放效率。从我们实际应用的情况来看,通过模型筛选出来的潜在用户,在转化率上往往比通过人工经验判断筛选出来的用户有20%-60%的提升,比随机筛选出来的用户更是有成倍甚至几倍的提升。

我们对CLM方法的研究和应用,最早始于2012年,当时跟麦肯锡的驻场团队一起封闭开发,以新用户获取为切入点,整理了8亿用户的近千个特征字段,进行了详细的数据分析,近十轮的模型迭代,在多个渠道进行了200多次的活动投放试点,试验用户群+渠道+文案+活动形式的各种组合,期间还陆陆续续邀请了近百个QQ用户参加深度访谈调研,验证我们的数据结论,最终使得实验组的点击率比对照组的提升稳定在40%-110%以上。随后,我们又把在新用户获取项目中沉淀下来的经验和方法复用到了活跃用户流失预警以及流失用户拉回的运营活动中,效果都有了显著的提升,数据在增长分析中的价值得到了有利的验证。自此,整套的用户生命周期管理方法就此打磨成型。接下来,我们把这套方法先后在QQ会员游戏联运项目、空间页游项目、手Q游戏运营项目中进行了推广和复用,进一步放大了数据的价值。到今天,CLM的方法和理念已经渗透到了SNG的多个重要业务中,并且还在持续的探索和优化。以手Q游戏运营为例,我们每天都会通过QQ手游公众号投放数以亿计的精准拉新、拉付费、关怀等类型的CLM消息,并且能够自动采集数据进行效果监控,彻底改变了以前“产品经理提号码包需求->数据团队提包(排期)->产品经理上传号码包->投放->产品经理提效果统计监控需求->数据团队开发报表(排期)”的传统而又痛苦的模式,不仅大大提高了资源使用效率,也帮助业务大大减少了运营成本。

在推广CLM方法,拓展业务场景的同时,为了更好的服务业务,我们自身的能力建设也没有停下脚步,特征库、算法库、AB test工具等已经日趋完善和成熟,另外值得一提的是,我们近期上线的lookalike功能使得需求的响应速度又有了进一步的提升。以前业务有一个拉新的需求,需要先跟我们沟通需求,我们了解需求之后要经过数据准备、采样、模型训练/验证/部署等过程,这么一个过程下来,快则一两个星期,慢则一个月,模型才能上线使用,这个对于需求紧急、心情急迫的运营同学来说显然是不能忍的。现在,运营同学只需要上传一个种子用户号码包就可以通过lookalike功能进行人群扩散,返回跟种子用户相似的其他用户进行运营活动的投放,前后只需要一个小时左右,速度有了质的飞跃,当然这也得益于我们投入了很多精力进行基础特征库的建设。

       3.2 用户分群

CLM模型建立之后,我们可以通过模型找到更加精准的目标用户,但是为了把运营活动做的更加精细,我们还需要考虑这些问题:我们的目标用户的人群属性怎样?有什么行为特点和兴趣爱好?根据这些应该怎样设计运营活动。这就要用到用户分群了。用户分群从语义上理解就是对用户群进行细分,不同的用户群有不同的特征,好的分群能够帮助业务充分认识群体用户的差异化特征,从而找到正确的营销机会、运营方向。所以在数据分析行业里,有一句老话叫做“不细分,毋宁死”,讲的就是这个道理。既然用户分群这么重要,那我们要怎么做呢?用户分群常见的维度包括以下几个:

1.    统计指标:年龄,性别,地域

2.    付费状态:免费,试用,付费用户

3.    购买历史:未付费用户,一次付费用户,多次付费用户

4.    访问位置:用户使用产品的区域位置

5.    使用频率:用户使用产品的频率

6.    使用深度:轻度,中度,重度用户

7.    广告点击:用户点击了广告 vs 未点击广告

在维度少的情况下,用户分群是很好做的,比如年龄维度,我们经常会按照人生不同的生命阶段进行划分,再比如活跃维度,我们可以划分成低活跃、中活跃、高活跃用户群体。但是当维度增加到几十个甚至几百个维度时,人脑就完全处理不过来了,这个时候无监督聚类的方法就派上用场啦。举个例子,我们采集了以下10几个维度的数据,需要对用户进行分群。

图5:用户特征维度

就算经验再丰富的运营同学,面对这十几个复杂的数据维度,相信也很难对用户群进行准确的划分。而我们借助无监督聚类分析的方法,可以很快的把用户分成以下几类:

图6:用户无监督聚类结果

当然这里的结果都是数值信息,还不能直接指导运营方向和思路。但是结合业务理解对数据进行提炼和解读,我们很容易将数据转化成人可以理解的用户分群:

聚类1特征:年龄未知或低龄,好友少,活跃度和使用粘性都极低【低端低龄群体】

聚类2特征:年龄偏小,前台在线和消息活跃均比较高【学生活跃群体】

聚类3特征:平均27岁左右,PC端和手机端活跃度均非常高  【职场高粘性群体】

聚类4特征:平均28岁左右,前台在线和消息活跃都极低【职场低粘性群体】

聚类5特征:年龄较高,手机在线时长高,但消息沟通极少   【高龄低活跃群体】

当运营同学拿到这样一个科学、可理解的用户分群结果时,就可以针对不同用户群体的特征设计符合该群体特点和需求的文案、道具和活动形式。运营活动也必将取得事半功倍的效果。

4. 总结

正如文章开头所说,数据涉及到的知识体系和领域太过庞大,这里的介绍只是冰山一角,海量的数据中蕴含着丰富的金矿还等着我们去开采。回顾这些年的数据工作,我们在数据类型上,从结构化的用户行为数据挖到LBS轨迹数据,从关系链的图数据挖到文本数据,在系统架构上,我们也在不断完善和优化我们的数据系统及架构,为业务提供更好的数据服务。我们一直相信,通过数据驱动来帮助业务增长是数据团队最大的使命和价值,我们会在这条道路上持续探索,不忘初心,砥砺前行。

来源:腾讯QQ大数据 

]]>