社交数据 – 庄闲棋牌官网官方版 -199IT //www.otias-ub.com 发现数据的价值-199IT Sun, 27 Mar 2016 10:45:33 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.4.2 社交数据在征信领域的应用探索 //www.otias-ub.com/archives/455121.html Sun, 27 Mar 2016 10:45:33 +0000 //www.otias-ub.com/?p=455121 在WOT”互联网+”时代大数据技术峰会上,来自腾讯数据挖掘高级工程师刘黎春做了以《社交数据在征信领域的应用探索》为主题的演讲,主要内容由社交征信背景、腾讯社交网络数据、个体用户画像研究、社团圈子研究、模型建设及应用这五部分构成,下面我们就逐一为大家介绍各部分的内容。

社交征信背景

刘黎春表示,征信并不是一个简单征信评分的模型,而是由数据公司、征信公司、征信使用方三部分组成。数据公司就是采集或做一些数据的初步挖掘,这类公司可能会有特殊的数据源,例如法院、公安等这些数据都是需要深入行业背景才能拿到。征信公司是有一个产权联系,另外它也会向第三方一些数据公司去购买一些数据回来,丰富它数据的维度,并且基于这些数据去做一些征信的事情,提供一些征信级的解决方案。征信使用方就是征信的解决方案最后给到谁来用。一般来说我们的理解就是银行和P2P的贷款机构。这三部分综合起来,就形成了一个整体的征信行业的产业链。

1459075465-6869-3417eb9bbd90185ee0291c

传统征信相关机构

1459075465-5519-3417eb9bbd90185ee0531d

美国著名征信公司

1459075465-9796-3417eb9bbd90185ee0591e

国内征信发展历程

综合以上四图的数据来看,如果社交数据可以用到征信中的话,是不是可以对央行的征信系统做一个很好的补充呢?刘黎春表示,这是腾讯在做社交征信项目时最开始思考的问题。社交数据非常庞大,但并不一定都是有效数据,还要看具体应用的业务场景是不是和数据有相关性,这些数据是不是真的能够用到最后的模型或者算法中去。这样问题就接踵而来,社交数据与信用评级有关系吗? 交易数据天然具备金融属性,社交数据有吗? 社交数据非结构化程度高,怎么挖掘并有效使用?

1459075465-7297-3417eb9bbd90185ee0651f
腾讯社交网络数据

在谈腾讯社交网络数据构成之前,刘黎春先介绍了传统征信的分析维度。其一是用户的基础信息,如年龄、性别、职业、收入、婚姻状况,工作年限,工作状况等基本上和每家银行或者每个做征信的机构获得的数据都差不多。其二是信贷情况,看用户申请几张信用卡,最近一个月的征信报告被查询的次数,因为我们大家都知道征信报告被查询的次数可以直接代表最近有没有比较频繁地做贷款的申请或者信用卡申请。如果最近的次数特别多,那说明这个人最近非常缺钱,可能就会影响信用,直接影响授信额度。

1459075465-4283-3417eb9bbd90185ee07d20
上图是腾讯的数据现状,包含了很多维度的数据,覆盖的用户数相对来说更加全面一些。

1459075466-5732-3417eb9bbd90185ee08d21

腾讯社交征信SWOT分析

上图为腾讯社交征信SWOT分析,优势、劣势、机会、风险一目了然。有了这样详细的分析,做个人征信是必然的事情,但做征信之前要清楚的知道征信对象是什么样子,所以开始着手做个体用户画像的研究。

个体用户画像研究

刘黎春表示,做个体用户画像研究遇到的挑战主要有如下三方面:其一,如何充分利用腾讯各种丰富的数据资源及之间的联系?其二,如何使用户画像适应各种不同的应用场景?其三,如何高效的处理海量的用户数据(超过10亿的QQ用户, 超过千亿级别的各类日志数据) ?面对这些挑战,刘黎春给出来相应的解决方案如下:

1.针对不同的底层数据类型设计特定的挖掘算法,挖掘用户的行为特征,形成底 层标签。综合考虑不同数据来源的,形成更上层的抽象用户标签

2.建立完善的用户画像标签体系结构,从不同维度、粒度对用户进行描述。

3.搭建用户画像挖掘系统,基于大规模存储和机器学习计算平台,定期对全 量用户数据进行计算和挖掘,并提供用户标签的使用和查询服务。

1459075466-4754-3417eb9bbd90185ee0ad22

用户画像系统架构

1459075466-3291-3417eb9bbd90185ee0b323

用户画像文本挖掘系统

1459075466-1313-3417eb9bbd90185ee0b924

用户画像行业挖掘

1459075466-6772-3417eb9bbd90185ee0c025

用户画像挖掘结果

个人用户画像研究的结果就是把结构化数据,文本分类,LBS数据,社交网络传播扩散这些挖掘之后形成一个比较完整的画像,比如说人口的一些基础属性如年龄、家乡、兴趣等。同时也会对用户婚姻状况来做一个判断。有了这些数据之后,就可以基于这些用户数据去做很多社交征信工作。

社团圈子研究

这里说到的社团圈子其实就是QQ圈子,刘黎春表示,在2012年有一个社交网络的成果非常有影响力,那就是把挖掘出来的结果作用到整个前端的QQ用户。具体案例就是如用户的某个同事,你们并不是直接的好友关系,但腾讯会知道这期间的潜在关系,或自动分到同事分组并同时加上备注。这个结果在当时引起了很大争议有人觉得对于他们找到一些潜在好友提供便利,但有些人觉得触碰了他们的隐私。

QQ圈子除了它自己本身之外,也会把它作用到很多场其他景里去,比如说用它来挖掘学历的信息,基于QQ圈子好友的备注,如说很多人把这个用户备注成一个本科同学,那系统可能会判断我的学历是本科学历。这样的数据腾讯是拿一些真实的数据做过验证,数据覆盖率大概能覆盖74%,准确到90%以上。

1459075467-6858-3417eb9bbd90185ee0dc26

社交网络拓扑的应用

社交网络拓扑的应用无外乎有两种,其一是是判断拓扑的类型,其二是研究这些类型在这个关系链里的影响力。比较有标志性的拓扑类型有三角形和心型两种结构。

模型建设及应用

那么要如何把个体用户画像和社团圈子的研究,用到模型中去呢?刘黎春表示,首先要做的事情就是先建立一个社交模型,但在建模之前要做一些基本假设,如两个QQ号码是属于同一个人的话有一些比较明显的特征,第一个他会经常在同一个设备里面登陆,或者在同样的IP里面登陆,或者它有其他特征的表现等等。最后把这些特征用来建立模型,去判断说某几个QQ号码背后对应的到底是不是同样一个人,这个的准确率大概是85%,覆盖率是75%左右。

1459075467-2433-3417eb9bbd90185ee0f627

变量衍生与模型结果

1459075467-8416-3417eb9bbd90185ee0fc28

模型整体效果

1459075467-6874-3417eb9bbd90185ee10329

微粒贷应用

最后刘黎春介绍征信模型运用到微粒贷中的具体应用流程,上图为产品截图。打开QQ如果能够看到微粒贷入口,说明是在腾讯筛选出的白名单里面。只要你点击了申请开通,它会马上给你算一个额度出来,如果你要借款,这个也是非常快,只要你绑定了你的银行卡,应该在两分钟之内会把你的借款打到你的账上。其实这个相对于去传统银行借款的话,它这个效率是有一个质的飞跃。但其前台产品表现得越简单,它背后的技术可能是越复杂的技术。征信模型作为微粒贷背后技术就是为了筛选具有良好信用的用户,为这些用户提供贷款服务。

 

作者:
刘黎春,
腾讯数据挖掘高级工程师,社交网络事业群数据挖掘团队负责人,第一代QQ音乐推荐系统架构师,腾讯客户生命周期管理体系搭建者。多年致力于 数据挖掘技术与业务结合,在大数据分析和挖掘、互联网征信等领域有着丰富的实战经验和项目管理心得。目前专注于互联网征信、用户基础画像、推荐系统和文本挖掘。

]]>
2013年Q2中国互联网社交数据–数据信息图 //www.otias-ub.com/archives/140952.html Thu, 15 Aug 2013 15:56:28 +0000 //www.otias-ub.com/?p=140952 社交App端浏览时长不断增加,微博App端浏览时长比例超过40%;社交服务类应用覆盖4.4亿人,2013年5月,微信覆盖1.58亿人,叫2012年8月增速90.9%,远超其他应用。在使用时长上,微信和微博App优势明显。

 

2013q2-sns

 

]]>
帮你存储社交数据的十大对策 //www.otias-ub.com/archives/104247.html Sun, 07 Apr 2013 09:52:33 +0000 //www.otias-ub.com/?p=104247

社交数据正在以前所未有的速度猛烈袭来。Facebook已经拥有约十亿用户,而Twitter的使用群体数量也在逼近五亿大关。这样的规模在过去简直无法想象。如今的Youtube网站需要提供体积庞大的音频与视频文件,同时还得十亿用户的评论及态度信息。更不用说其它一些社交媒体站点及企业社交应用所保存的海量非结构化数据了。

那么我们就在这里一同讨论应对社交存储需求持续上温的方案。

  1. 单体体积小

要着手处理社交数据存储工作,第一步是了解其主要特征——即总容量庞大但单体体积较小。这与其它存储类型有着明显差异。

“社交媒体数据大多数体积较小——博文、推文以及图片等等都是如此。”NetApp公司大数据解决方案高级经理Bill Peterson注意到。“甚至视频资料在社交领域都保持着小巧的身材。”

  2. 根据对象制定策略

即使同样是社交媒体数据存储工作,在不同平台上的处理方式也在所不同。举例来说,像Twitter与Facebook这样的企业需要把数据集中存储以满足用户们的浏览操作。另外,为了批量取回社交媒体数据,企业用户可以尝试对数据加以分析并深入了解其内容。前者就是我们通常所说的foreground copy,而后者则被称为background copy。

“基于对象的存储策略与goreground copy可谓天作之合,因为对象存储需要通过总体体积与地理跨度两大要素来形成一定规模,借以满足应用程序‘将所有图片保存在Facebook中’或‘将所有推文保存在企业VPN中’的需求,”Peterson解释道。“对象存储系统通常拥有基于http的接口,这使得技术人员能够轻松把此类对象引用到Web页面中并加以显示。

  3. 分析友好特性

在背景(即社交媒体数据归档副本)方面,进行保存的最佳实践目的在于深入分析并掌握其宏观内容。为了让分析平台完成这项任务,我们通常需要将大量小型对象捆绑在一起形成大型文件。举例来说,如果大家想分析推文内容,必须先拥有一个包含着所有推文信息的整体文件,而非每条推文构成单独文件(或对象)。Hadoop就是处理这类分析任务的平台方案之一。

“Hadoop在处理大型文件(GB、TB乃至PB级别)方面效果拔群,但在处理大量小型文件方面则显得比较疲软,“Peterson解释道。”Hadoop还擅长处理数据流访问工作,可以说这套方案在设计上主要针对的是一次写入、多次读取的数据存储需求。“

  4. 追求速度

社交数据要的就是速度。用户通常无法容忍应用程序出错或缓慢的服务响应,遇上这类情况,他们会果断移步其它社交平台。

“打理社交数据要求存储机制能够以接近实时的方式提供信息,这一特性使固态硬盘成为首选解决方案,”SMART Storage Systems公司总裁John Scaramuzzo建议道。“不过请大家注意,采用低成本MLC闪存的固态硬盘更加耐用,这样才能确保我们在获得预期的生产能力之外避免驱动器损坏给业务造成的不良影响。”

  5. 慢速归档

我们显然不能简单把访问量稀少的社交数据直接丢弃、只保存那些更为热门的媒体资料。毕竟没人希望当法律部门的家伙来搜集证据时,自己只能无奈地告诉对方数据被删掉了。有鉴于此,我们应该根据机构的具体需要将数据划分为冷门与热门两大类。热门数据需要始终拥有快速响应能力,而其它的部分的访问速度则完全可以做出一定妥协。

“对于那些使用频率不高的数据,100毫秒左右的响应速度已经完全能够接受了,”Peterson表示。“而更冷门一些的对象则不妨采取更长的响应时间。”

  6. 至少三层结构

Peterson建议大家至少在存储体系中部署三层结构:内存内(或闪存内)层、磁盘层以及冷门数据层。由内存内向磁盘层移动的过程需要经由基础缓存。而再向冷门数据层的移动过程则涉及将大量小型对象整合为少量大型对象的操作。

“如果大家不这样做,那么旧有数据层就会因为对象数量过多而陷入瘫痪,”Peterson补充道。7. 存储配置文件

社交配置文件数据是指用户通过注册Facebook或谷歌服务进而登录站点时所产生的信息。其中包括个人喜好、兴趣、好友列表等等。这部分数据非常重要,因此需要以安全高效的方式加以存储。

“大多数配置文件数据本身被以文档索引形式加以保存,这是出于性能方面的考虑,”Janrain公司产品副总裁Vidya Shivkumar指出。“另外,在某些情况下这些数据也可能被保存在关系类数据库中以满足查询需求。”

举例来说,Janrain公司就利用了关系类、键值存储与文档索引。

  8. 总量巨大

社交数据的总量很可能极为庞大,需要企业用户为其配备同样庞大的存储阵列。在很多情况下,利用来自Amazon、谷歌、微软等企业的云存储服务可能是满足这方面的需求的最佳选择。Janrain公司就使用了Amazon的基础设施托管方案。

“企业为什么一定要亲手打理存储事务呢?”Shivkumar反问道。“很多供应商都推出了这类功能性服务,管理者没有理由不认真加以考量。”

  9. 不要对重复数据删除报太大期望

重复数据删除的效果要依工作负载的具体情况而定。例如在传统备份及虚拟机领域,重复数据删除功能可以带来优秀的空间节约比率。然而在推文及博客等往往需要经过压缩的信息面前,重复数据删除技术的效果就要大打折扣了——虽然在图片方面的收益还算不错。

“之所以重复数据删除发挥获得良好作用,主要是因为很多用户会上传同样的图片,”Peterson解释道。

  10. 无需备份

Peterson指出,社交数据一般不会采取通常意义上的备份手段。相反,由于基础设施分布在各地,信息副本也会同时保存在每套设施当中。举例来说,NetApp公司推出的StorageGrid就允许用户通过元数据查询创建数据类。

“我们可以数据类添加一些规则,例如要求至少在两个不同的数据中心处保存两套副本,”Peterson指出。“整个过程跟备份无关;这只是一款引擎,用于确保无论发生何种情况、我们的数据都在两个不同的物理地点拥有两套副本。”

]]>
Econsultancy:社交数据是网站个性化的王者 //www.otias-ub.com/archives/100811.html //www.otias-ub.com/archives/100811.html#comments Wed, 20 Mar 2013 02:00:35 +0000 //www.otias-ub.com/?p=100811 如果网站能实时感知用户所需并提供服务,网站体验将非常的完美。今天有很多技术可以让这一切逼近现实,个性化网站对于营销者而言不是什么难题。现在核心的问题是个性化的最好方式是什么?

回到数据源

2012年6月,Econsultancy 和Adobe发布了Personalisation, Trust and Return on Investment’, 这个报告,内容有:

  • 超过52%的受访者同意提供个性化内容是对他们的网络策略很关键
  • 41%的受访者决心提供个性化网络体验
  • 只有很少一部分公司能够实时提供个性化内容

分析品牌所使用的个性化数据发现,只有6%的品牌使用了社交数据,但有认为社交数据带来了高ROI的比例高于其他数据类型

Graph

数据对互动程度的影响也是如此,使用社交数据的人中有88%表示带来了较好的用户互动,而购买记录数据和网站行为数据则分别为74%和72%

Econsultancy & Adobe Personalisation Report - Figure 6

社交数据兴趣

社交数据有何不同?

首先,社交数据是我们真实生活的最好反映,也是更广泛和更精准的意图表达。社交网络满是用户创造内容,用户发表这些内容时并不图回报。

如果你发现了用户对折扣和特惠的Likes,你就大概了解了用户的意图,社交数据还包括关系,兴趣,角色和趋势

购买数据隐含的意思是我以前买了啥,而行为数据反映的无非是通过你的点击发现你的模式,这些数据只能告诉我们用户过去的特定购买行为,却很难获知用户是谁,他喜好什么,他下次想做什么这些信息

这只是一时一刻的数据,对于忠诚客户,你可以及时刻画这个用户,但你没法做到实时,也未必拥有很高的质量和准确性。将行为数据和购买数据相结合,会更了解用户。

但如果你真想了解用户的意图和真正的兴趣,你需要找到那些对他们真正重要的东西,而非短暂的行为。

个性化的一个重要元素是新颖性,重定向广告基于这个原则引导你回到你最近离开的网站。但如果做得不好,这会让人很烦;做好了,这会是一个非常有效的手段。使用社交数据是一个非常好的方法,通过提供跟用户时下相关的产品或服务,比如紧随在他们在Facebook或Twitter上面的分享之后。

营销者一直在寻找合适的定向用户的时机,这个单凭行为或购买数据无法解决,这需要有社交数据。

社交数据法则

社交数据也是有一些需要注意的,比如这跟场景有关,好友的场景(Facebook),工作圈子(Linkedin),家庭圈子(私密网络)

用户在这些社交网络中的重合度不会特别高,在用哪个社交网络进行个性化网络体验时,取决于什么对你的商业最有效

使用社交数据来个性化网络体验是新的法则,这是行为心理学和数据的交叉点。因为这是新生事物,但非常诱人,而且正如数据所显示,效果还非常诱人。

via:http://www.datatmt.com/archives/39374.html

]]>
//www.otias-ub.com/archives/100811.html/feed 1
eMarketer:社交分析证明实时营销占据越来越重要的地位 //www.otias-ub.com/archives/97826.html Mon, 04 Mar 2013 03:11:08 +0000 //www.otias-ub.com/?p=97826 营销人员深知社交数据的重要价值,但尚未能获得良好的产出回报。

根据eMarketer的报告显示,实时营销的时代几乎已经到来。

营销人员已经精通于分析社交情感倾向来判断品牌的健康程度,并且大多数都有能力在社交媒体上回应评论和投诉。

目前更普遍的是,社交数据分析公司,数据代理和公关公司也正使用社交数据来拓展海外市场。eMarketer指出:“在高速发展的大环境下,社交数据如何来支持实时营销?”

一个现实的例子是当一起断电事故破坏了超级碗,类似奥利奥或Tide或CK等品牌便针对这一突发事件,在社交媒体上传递引人注意的评论信息。

然而,这种形式的营销远不只是发布一条即时的微博或是状态那么简单。报告显示,思科,戴尔,探索通信,H&R Block,麦当劳,SAP,斯普林特和其他的公司都分享了他们是怎么尽可能发挥社交数据的作用的。他们迅速的创作能够带来更多回应和评论的内容,围绕社交媒体上的热门话题,实时的改变营销策略,发展营销方案。一些营销人员还利用实时的社交媒体数据来辅助企业战略决策,例如产品开发方面。

2012年由Infogroup Targeting Solutions 和 Yesmail Interactive共同发起的一项调研指出,全球53%的营销者说他们计划在2013年更好的来利用实时数据。

 

而且,80%的被访者说他们计划将社交媒体数据运用于海外市场的拓展。

Salesforce.com产品营销部的副总说道:“愿意吸收实时信息并且很好地利用的品牌主,能够及时调整营销活动或是及时响应消费者对于服务的评论。这些品牌在社交这一部分是相对成功的。”

然后,尽管社交数据十分有效,仍有一系列的因素会阻碍营销者有效的运用社交数据于企业营销,包括缺乏追踪能力和组织性。

营销者评估社交数据的价值与他们真正应用数据的能力之间存在着巨大的分歧。

营销者必须一步一个脚印,虽然他们对于探索实时营销活动有着巨大热情,但他们需要先适当的掌握一套坚实的社交数据分析架构。

199it编译:@唯懿Yvonne (微博) Via:eMarketer

]]>
社交数据分析公司DataSift融资1500万美元 //www.otias-ub.com/archives/79325.html Thu, 15 Nov 2012 17:02:18 +0000 //www.otias-ub.com/?p=79325 DataSift是一家专门帮助开发者和第三方获取Twitter、Facebook和其他社交数据源的公司,他们刚刚在Scale Venture Partners领投的B轮融资中获得1525万美元投资,跟投的还包括Northgate Capital和Daher Capital。这使得DataSift融资总额达到3000万美元。

开发者、企业、媒体公司和组织都可以使用DataSift来挖掘Twitter的Fire Hose社交网络数据,以及Facebook、YouTube、博客、论坛等平台的数据。但DataSift最独特的地方在于,该公司可以整理数十亿条社交信息,然后根据人口统计学、网络影响力和情绪来过滤这些信息。

DataSift并未将搜索功能局限于关键词,还使用了自然语言处理技术,将非结构化的数据转变成可消化的结构化信息。该公司的产品使得任何规模的企业都可以定义极其复杂的过滤条件,包括地点、性别、情绪、语言,甚至是根据Klout的得分得出的影响力,从而尽快地展开详细分析。

DataSift CEO罗布·拜里(Rob Bailey)表示,该公司的资金已经非常充足,但仍有很多投资者有意入股。他补充道,DataSift的数据一直在呈现爆炸式增长,而且业绩增速也非常惊人。

“我们拥有全球最优秀的基础设施,既能实时处理社交数据,也可以分析历史数据。通过B轮融资,我们现在有能力将这一基础设施推进到下一个阶段。”DataSift创始人兼CTO尼克·哈斯泰德(Nick Halstead)说,“DataSift平台可以帮助我们的客户将私有和公开数据汇总到一起,并借助我们强大的处理能力来过滤这些非结构化数据。大数据的最终目标是通过提取公共和私有数据来展开分析。”

该公司目前约有300家企业客户,较一个季度前的200家有所提升,既包括财富500强企业,也包括社交技术公司、新闻机构、咨询公司和政府机构。

DataSift最近还发布了多款新服务,方便企业将社交数据分析与自己的商业数据进行整合。这项服务可以与商务智能应用、数据库、数据仓储平台和其他云计算服务相互配合,包括亚马逊DynamoDB、亚马逊S3、MongoDB、CouchDB、FTP/SFTP、ElasticSearch和WebHooks。

该公司每天从2万多条数据流中提取7亿多条数据,目前每天的数据处理量达到2TB至3TB,过去一年间已经增长了两倍。

DataSift将利用这笔新资金扩充基础设施,从而管理数据源,同时还将推出新的数据源。拜里表示,由于越来越多的公司希望使用新颖而复杂的数据监控功能,因此DataSift将努力打造自己的平台。该公司还准备展开国际化扩张,并将销售、营销和客户服务团队扩充一倍。

]]>
社交数据的意义:废话也能完成大买卖 //www.otias-ub.com/archives/71432.html //www.otias-ub.com/archives/71432.html#comments Thu, 04 Oct 2012 14:03:40 +0000 //www.otias-ub.com/?p=71432

敢问现在还有事情不能被电脑记录,不能数字化吗?值得提到的是,社交网站每天都可以产生数以万亿字节的社交数据。与此同时,紧跟着社交数据而来的是无数想跟其擦上边的商业想法。但大都是关注在海量的数据、数据的扩散、可怕的数据入侵等方面,人们却很少讨论社交数据的特殊性。社交数据不同于其他的数据,社交数据没有具体的衡量标准,绝大多数社交数据很模糊,传统的数据分析工具只能肤浅地分析,很难深入到人们的真正想法中去。

提到Facebook,你会想到它能产生什么样的社交数据?消费者对产品Like(赞)的数量?不不不还有更多,可以将社交数据的能力拓展到消费者市场营销上,甚至扩展到更远。网络上无限量、免费的社交数据中包含着人们对企业和个人生活的看法,可以为企业提供一些新的商业途径和看法,甚至创造出新的商业模式。

问题的关键是,如何从社交数据中获取或挖掘出对企业和个人有用的数据?如何将有用的数据用于提高商业决策水平?

社交数据揭示“我们是谁”

许多社交数据反映出了用户的兴趣、专场、社会展望、技能、精力,这些数据可以直接从用户的个人资料中获取,或者从人们在社交网络上探讨的内容中间接获得。企业员工和经理可以在企业社交媒体网页上看到这些以前不可见的隐藏信息,这些数据和信息可以用于解决问题,提高决策水平,并让企业参与到企业决策过程中来。

当一个员工遇到一个技术问题时,他一般会思考“这个问题别人碰到过没有”。在亚美亚(Avaya)公司,员工都会使用一种社交软件,它可以帮助员工在企业内部找到在特定领域有专长的技术人员,可以更快速地解决消费者在通讯方面的问题,从而降低了消费者帮助成本,提高消费者满意率。当然,LinkedIn可以提供相似的功能,只不过处理速度会下降一点,但是起到的作用几乎一样,这足以看出社交数据可以加速问题的解决,还能引领创新。

项目经理招聘新员工的时候会想:“团队中哪些员工有这个能力,谁对产品开发感兴趣?他们之前给谁工作过,他们适合这个团队吗?”这时,Facebook就可以帮到企业,应聘者的个人信息、长处、工作经历都在Facebook上放着,企业都可以看到。这帮助企业更好地作出用人决策。

社交数据揭露消费者对产品和企业的真实想法

对于那些能够理解社交媒体不仅仅是获取关注者和打广告的企业来说,社交数据还能帮助他们改善产品开发。英国移动通讯公司Giffgaff通过社交媒体与消费者沟通,让消费者来设计自己喜欢的手机,研制合适的资费套餐。

经理想知道员工在讨论什么?领导想知道新闻对品牌的影响力?这些都可以通过社交媒体来获取。目前已经有像Prosodic这样的公司可以实时抓取消费者在社交媒体上的情绪信息,及时提供一些符合消费者情绪的广告,抓住消费者的兴趣,大幅度提高广告投放效果。

社交数据也揭示了“我们干什么”

无处不在的摄像头、传感器和其他数字跟踪方法无时无刻不在收集数据并储存在电脑中,将社交数据从网上扩展到了线下,扩展到了人们的正常生活、互动之中,如此,提供给企业更多人们的互动内容。以后人们在互动的时候可能也会收到非常精准的广告,完全符合谈话内容的情况也有可能发生。

各种行业的各企业都希望拥有一支高绩效团队,尤其是服务业。四大之一德勒通过研究自己公司的高绩效团队得出数据显示,虽然公司非常看重团队合作,但是高绩效团队依赖外部关系比内部关系要多得多。MIT媒体实验室通过对呼叫中心的高绩效团队的研究发现,一只高绩效团队之所以拥有极高的效率,与学历、技能关系不大,与正式会议谈话不大,更重要的是私下的交谈和沟通。这就可以利用社交媒体的数据来探究这样的高绩效团队是如何沟通的,从而对打造更多高绩效团队起到借鉴意义。

如何将社交数据变成社会展望

在处理社交数据时最具挑战性的要数如何将其与社会展望结合在一起,如何将社交展望变成高绩效的人类行为。如果企业想与数据挖掘公司合作,一定要明白他们如何使用社交数据,因为大多数数据企业不涉足社交数据。

回答一下问题或许可以帮助企业从社交数据中得到提高企业业绩表现的方法:

  •    想通过社交数据解决什么问题?首先肯定要解决和企业相关的问题,也许可以在数据挖掘过程中发现更多新问题。
  •    数据意味着什么,它们代表什么类型的关系?不同的数据类型需要不同的工具和不同的挖掘方式。LinkedIn挖出的数据代表用户的专业社会关系,Facebook则挖出代表用户个人社交关系的数据。
  • 挖掘出来的数据能帮助企业做什么?各种类型的社交数据都有他们特殊的用途,利用实时社交数据就跟做实验一样,可以用来测试商业活动的可行性。
  •       如果社交数据挖掘出的方法与传统方法不同,企业是否会采纳?社交数据与传统的媒体广告不同,挖据数据可以获得更多商业机会。

文章来源:Allthinsd

]]>
//www.otias-ub.com/archives/71432.html/feed 1
Gartner:2014年将有15%的社交评论数据作弊 //www.otias-ub.com/archives/69588.html Thu, 20 Sep 2012 01:30:29 +0000 //www.otias-ub.com/?p=69588 披头士曾经唱过,你需要的只是爱。不仅人类需要爱,品牌和公司也是如此,而在社交网络环境中,似乎正在帮助品牌和用户之间建立长期的关系。

如果成千上万的赞或粉丝是某种指标,社交网络看起来是品牌和粉丝们快乐的天堂,但在这华丽的表面背后,这个关系并不是那么牢固可靠。

根据Gartner,越来越的品牌开始花钱买正面的评论,赞和粉丝的数量,到2014年估计超过有10%-15的这些数据都是假的。

Gartner还预测说在未来两年,美国FTC将会采取行动,财富500强中将有至少2家面临社交作弊的调查

Gartner认为品牌必须在长期利益和声誉和短期利益之间权衡。

买卖粉丝比Google搜索还容易,于是就毫不奇怪不少品牌采用这些行动了。

何不呢?这些粉丝和赞并不容易达到,而且高的数量让你看起来也光鲜,面上有光,给老板也好交代,也能蒙混不明真相的群众。但显然你作弊越多,越可能面临法律的惩罚。

当然我们很多人都知道粉丝和赞并不说明什么,他就相当于点击的关系,而不是转化。那么造假的原因何在呢?下面是几个原因:

量化参与和影响力确实很难
这些指标主要取决于社交网络的平台
这些指标总在变化
也就是说品牌都依赖于Facebook和Twitter提供的数据,而不是做自己的分析,建立自己的KPIs,他们通常采用受限和不完美的指标。

当然品牌需要记住一点,作假不靠谱,只有获得用户的信任,尊重和满意才是最重要的。

]]>
Forrester Research:如何更加有效地利用社交数据 //www.otias-ub.com/archives/47953.html Sun, 03 Jun 2012 11:55:30 +0000 //www.otias-ub.com/?p=47953

Nate Elliot 是Forrester Research的副主席及主要分析员。主要帮助世界各地的交互广告人提高他们的战略以达到成功,并评估成效。

2011年,据本公司收集到的数据,美国消费者在网上发布的关于产品和服务意见的帖子数量超过了10亿。因为同伴影响相当程度上左右了消费者的购物选择,所以很多互动营销人员正通过病毒式营销方案和影响者来利用同伴影响力。

但是,大部分营销者都忽略了同伴影响力所产生社交数据的惊人数量。而且人们研究社交数据通常为了一个错误的理由:测量营销方案的品牌影响力。

社交数据的样本数量通常很小

因为发布的意见总量如此之多,你或许会认为,要对数据取样来研究出可靠的品牌影响力很简单。但是即使对很有名的牌子来说,要找到可分析的社交数据也是非常困难的。

举例来说,我最近回顾了一个听讲报告,是关于一个全球著名的运动品牌,它的赞助商,领导团队和运动员在世界范围都很有知名度。但惊奇的是,这样一个牌子在美国的社交媒体中每周也只被提到几百次, 而在其他主要市场每周被提到的次数则少于100次。

让情况更糟的是,社交情感分析工具的不完善进一步降低了样本数量。当分析工具不能决定一个评论是正面或者负面的时候,总是给它贴上“没有情绪”的标签。提及这牌子的3/4谈论都被这样处理了,所以某些市场最后留下来可以研究的帖子数量甚至少于两打。

 

如果你让你的市场研发团队或者调查机构来研究25份问卷回复,它们一定会告诉你这是不可能的。因为,如此小的样本数量无法找出统计学意义。同样,对社交数据来说也是如此。

社交数据的创造者并不一定代表你的客户群

虽然现在大多数在线用户的确会使用社交媒体,但这并不意味着发表评论的客户群能成为有代表性的客户取样。实际上,20出头的年轻人与40岁左右的中年人相比,更加符合本公司所谓的“健谈者”,才是会在facebook和twitter上发布消息状态的人, 也更大程度上被称为“创造者”,所谓会发表博客和上传视频的人。

如果你的产品主要面向年轻人群,你会觉得在社交媒体上活跃的人群正是你的目标客户。但对许多营销商来说,他们的目标人群并非只是年轻人。

 

社交数据通常只测量了极值

有没有发现大多数网上的评论不是很正面就是很负面?这并非杜撰。我们的数据显示大多数网上有影响力的发言都具有极端的本质。有两个原因可以解释。

第一,只有意见的情感很强烈时,客户才可能会想去发布。如果我没有一个鲜明的观点,我可能不会浪费时间发表。所以才会造成亚马逊上十佳畅销书的3/4的评分不是1星就是5星,而中间的评分则很少。

第二,很多关于产品服务的评论贴都是分享个人经历,而这些经历本身就很两极化。如果我在银行排队等了20分钟,我可能利用这时间在推特上发牢骚说自己有多恨这银行。相反地,如果我机票免费升舱了,我可能会发表自己有多喜欢这航空公司。这些可能是很有用的客户服务数据(它们的确影响其他客户的选择),但它们不能真实地测量出对你的品牌的总体观点。

几种对营销者来说有效的处理社交数据的方法

所以如果说你不能用社交数据来测量品牌影响力,这些数据又有什么用呢?

有许多用途。你或你的公司不管是否直接处理社交数据,你都应该用他们来:

  • 提升你的消息传送 如果你想创造能和受众产生共鸣的信息,你就要知道他们关心什么。比如,公司用私人倾听社区来包装广告信息。公司也在逐渐用更多来自公共社会媒体的数据来当做营销的额外指引。
  • 作为创意的来源 我们知道相对比其他信息来源,客户更相信来自其他用户的意见。所以为什么不利用倾听平台来找出正面的内容放在广告创意里呢?我曾看过英格兰银行在一次户外广告中利用社会情绪数据。
  • 提升你的媒体计划 你可能在网上已经有一些主要产品的宣传计划——持续替你宣传的网站,网络。但是社交数据可以帮你找到新的网站来增加购买者。比如,当微软发现人们在钓鱼和汽车论坛上讨论它的电脑时,他们很快就把这些网站加入媒体计划。
  • 识别你的关键影响者 根据我们的研究,美国的消费者创造超过5000亿对品牌产品的同伴影响。社交数据可以帮助你识别(然后接触)那些发言最多、影响最强的消费者们,他们可能是个人或者是某些有影响力的论坛。
  • 对你的客户做出反应 你不能助长对你产品的正面谈论(或介入负面谈论),除非你可以先找出那些谈论。 倾听平台可以帮你快速找到正面和负面的谈论,然后你就可以对那些评论做出反应。

关键是将社交数据成功地融入到营销方案里——并非像多数公司那样使用它们来检测方案。

via:yeeyan

]]>
分析:如何更加有效地利用社交数据 //www.otias-ub.com/archives/47826.html Sun, 03 Jun 2012 05:45:28 +0000 //www.otias-ub.com/?p=47826 Nate Elliot 是Forrester Research的副主席及主要分析员。主要帮助世界各地的交互广告人提高他们的战略以达到成功,并评估成效。他的推特账号 @nate_elliott。

去年,据本公司收集到的数据,美国消费者在网上发布的关于产品和服务意见的帖子数量超过了10亿。因为同伴影响相当程度上左右了消费者的购物选择,所以很多互动营销人员正通过病毒式营销方案和影响者来利用同伴影响力。

但是,大部分营销者都忽略了同伴影响力所产生社交数据的惊人数量。而且人们研究社交数据通常为了一个错误的理由:测量营销方案的品牌影响力。

社交数据的样本数量通常很小

因为发布的意见总量如此之多,你或许会认为,要对数据取样来研究出可靠的品牌影响力很简单。但是即使对很有名的牌子来说,要找到可分析的社交数据也是非常困难的。

举例来说,我最近回顾了一个听讲报告,是关于一个全球著名的运动品牌,它的赞助商,领导团队和运动员在世界范围都很有知名度。但惊奇的是,这样一个牌子在美国的社交媒体中每周也只被提到几百次, 而在其他主要市场每周被提到的次数则少于100次。

让情况更糟的是,社交情感分析工具的不完善进一步降低了样本数量。当分析工具不能决定一个评论是正面或者负面的时候,总是给它贴上“没有情绪”的标签。提及这牌子的3/4谈论都被这样处理了,所以某些市场最后留下来可以研究的帖子数量甚至少于两打。

如果你让你的市场研发团队或者调查机构来研究25份问卷回复,它们一定会告诉你这是不可能的。因为,如此小的样本数量无法找出统计学意义。同样,对社交数据来说也是如此。

社交数据的创造者并不一定代表你的客户群

虽然现在大多数在线用户的确会使用社交媒体,但这并不意味着发表评论的客户群能成为有代表性的客户取样。实际上,20出头的年轻人与40岁左右的中年人相比,更加符合本公司所谓的“健谈者”,才是会在facebook和twitter上发布消息状态的人, 也更大程度上被称为“创造者”,所谓会发表博客和上传视频的人。

如果你的产品主要面向年轻人群,你会觉得在社交媒体上活跃的人群正是你的目标客户。但对许多营销商来说,他们的目标人群并非只是年轻人。

社交数据通常只测量了极值

有没有发现大多数网上的评论不是很正面就是很负面?这并非杜撰。我们的数据显示大多数网上有影响力的发言都具有极端的本质。有两个原因可以解释。

第一,只有意见的情感很强烈时,客户才可能会想去发布。如果我没有一个鲜明的观点,我可能不会浪费时间发表。所以才会造成亚马逊上十佳畅销书的3/4的评分不是1星就是5星,而中间的评分则很少。

第二,很多关于产品服务的评论贴都是分享个人经历,而这些经历本身就很两极化。如果我在银行排队等了20分钟,我可能利用这时间在推特上发牢骚说自己有多恨这银行。相反地,如果我机票免费升舱了,我可能会发表自己有多喜欢这航空公司。这些可能是很有用的客户服务数据(它们的确影响其他客户的选择),但它们不能真实地测量出对你的品牌的总体观点。

几种对营销者来说有效的处理社交数据的方法

所以如果说你不能用社交数据来测量品牌影响力,这些数据又有什么用呢?

有许多用途。你或你的公司不管是否直接处理社交数据,你都应该用他们来:

提升你的消息传送 如果你想创造能和受众产生共鸣的信息,你就要知道他们关心什么。比如,公司用私人倾听社区来包装广告信息。公司也在逐渐用更多来自公共社会媒体的数据来当做营销的额外指引。

作为创意的来源 我们知道相对比其他信息来源,客户更相信来自其他用户的意见。所以为什么不利用倾听平台来找出正面的内容放在广告创意里呢?我曾看过英格兰银行在一次户外广告中利用社会情绪数据。

提升你的媒体计划 你可能在网上已经有一些主要产品的宣传计划——持续替你宣传的网站,网络。但是社交数据可以帮你找到新的网站来增加购买者。比如,当微软发现人们在钓鱼和汽车论坛上讨论它的电脑时,他们很快就把这些网站加入媒体计划。

识别你的关键影响者 根据我们的研究,美国的消费者创造超过5000亿对品牌产品的同伴影响。社交数据可以帮助你识别(然后接触)那些发言最多、影响最强的消费者们,他们可能是个人或者是某些有影响力的论坛。

对你的客户做出反应 你不能助长对你产品的正面谈论(或介入负面谈论),除非你可以先找出那些谈论。 倾听平台可以帮你快速找到正面和负面的谈论,然后你就可以对那些评论做出反应。

关键是将社交数据成功地融入到营销方案里——并非像多数公司那样使用它们来检测方案

via:http://article.yeeyan.org/view/180237/291551

]]>