分析工具 – 庄闲棋牌官网官方版 -199IT //www.otias-ub.com 发现数据的价值-199IT Tue, 22 May 2018 10:22:59 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.4.2 2018年最棒的8款Twitter分析工具 //www.otias-ub.com/archives/727110.html Tue, 22 May 2018 10:22:59 +0000 //www.otias-ub.com/?p=727110 Twitter的热度可能比不上Facebook, instagram, Snapchat, YouTube, 但是Twitter的流量不容置疑,也是非常适合跨境电商小伙伴推广的渠道之一,今天Stephen给大家推荐8款2018年最棒的分析Twitter账号的小工具。事实上经常分析账号,无论是facebook还是instagram,无疑都是对运营账号发展的重要关键因素,因此,重要性不言而喻。

以下8种工具来分析您的Twitter帐户。其中一些特定于网络,而另一些则包含在整个社交媒体管理平台中。其中一些专注于实时监控活动,另一些则查看历史Twitter数据。

说实话,由你决定哪个最适合你的帐户。你可能会发现你需要多个工具组合在一起使用。如果你刚刚开始研究分析你的Twitter账号,那么请参考一下本文当中的实用工具。事实上,其中许多提供免费部分和免费试用。

1. Simply Measured

首先通过社交媒体创建一个你的公司,Simply Measured为你的下一个营销活动提供跟踪结果。社交分析服务让可以让你了解你的推文如何为你的营销渠道做出贡献。

竞争对手相关报告可以为你击败对方提供哪些策略,以及你需要观看哪些竞争对手。为了帮助扩大你的品牌,与你的网站流量,包括twitter是如何直接把流量导入网站并达成转化的详细信息。

Twitter只是Simply Measured Social Analytics工具的一小部分。该服务包括多个社交渠道,并轻松了解他们如何将所有活动联系在一起。 对于管理多个渠道的多个营销活动的企业品牌来说,这是一个特别有用的工具。

价格:咨询客服人员,英文的

适合人群:希望使用数据推动其广告系列和渠道的企业

2. Keyhole

Keyhole是一项仅用于分析的服务,非常适合实时跟踪推文。 除了标准账户增长指标之外,Keyhole还为你的账户提供最佳发布时间。

即使没有注册试用版,你也可以利用免费的Twitter分析工具。 这包括一个用于标签,帐户,关键字甚至URL的实时跟踪器。Keyhole的服务非常适合跟踪市场营销活动。

价格:每月179美元起,可免费试用3天

适合人群:想要实时跟踪Twitter广告系列的商家

3. Mentionmapp

Mentionmapp与这个列表上的其他工具有点不同,因为它更实时的反应出效果。 反射出它可能是最值得关注的帐户,主题标签和推文。

Map本身只提供过滤器,转发和具有彩色情绪的转推云。 无论你是记者还是公司都会发现这个工具可用于识别热门话题和账户之间的连接。

免费帐户的访问权限有限,但你可以在试用时了解该工具提供的服务。 要详细了解每个细节,你就需要升级计划。

价格:有限访问的是免费账户,付费账户起价为9美元/月

适合人群:希望发现新的内容和帐户的各企业和个人

4. Union Metrics

Union Metrics是另一种社交分析服务,利用社交数据并通过丰富多彩的图形呈现。 它的Twitter分析是其较大的社交分析产品的一部分。

该工具只专注于分析,这意味你只需要花费时间集中在改进产品当中。 其Twitter分析产品包括对活动的实时监控,标签追踪和即将到来的趋势以及红人。

Union Metrics还提供了一些免费工具。 Twitter快照报告使用他们的一些付费功能来生成报告。你会收到有关你的品牌在Twitter上的做法概述,可用于审核。

Twitter助手为你提供了针对你帐户的个性化推荐,并注明了什么时候发布最佳推文以及哪些主题标签最吸引人。如果你使用的是本地网络或免费发布服务且分析有限,则Union Metrics可以作为你的社交媒体营销的补充选择。

价格:每月23美元起

适合人群:需要基本分析解决方案与公司出版软件配对的公司

5. Native Twitter Analytics

如果你还没有准备好投资较为高级的分析方案,那么Native Twitter Analytics 是一个不错的选择。

它可以让你看到有用的Twitter指标,如你的热门推文,提及,参与等等。 Twitter分析的最大好处之一是人口统计数据。您可以通过兴趣,职业,收入,购买风格和其他人口统计信息来查看受众群体的细分情况,这对于投放广告系列或规划出您的Twitter日历非常重要。

价格:免费

适合人群:尚未准备好投资高级Twitter分析解决方案的企业,但仍需要数据去分析twitter账号的群体

6. Quintly

Quintly是一个分析专用工具,连接到七个社交网络并集中数据以便于查看。

它的Twitter报告提供了关于宏观和Tweet层次的信息。 使用此工具对你的Twitter个人资料进行基准测试,并同时关注您的竞争对手。另一个有用的方面是能够跟踪您的响应时间。 支持问题的回答速度如何以及他们最常发布的时间。

小计划允许你连接最多五个社交配置文件和七个网络可供选择。 您的仪表板可以根据最重要的指标定制。

价格:$ 129 /月,14天免费试用

适合人群:需要针对多个网络提供一体化分析解决方案的公司

7. Klear

Klear在这份名单中脱颖而出,因为它是为影响力是专门营销而打造的工具。其核心产品帮助你在Twitter,Instagram和Facebook上查找,管理和红人。

它的免费红人工具可以让你预览公司能够提供什么。 这有助于你在每个市场找到最具影响力的红人,并为你提供任何帐户的即时研究。通过付费计划,可以了解帐户的人口统计信息和对话。

价格:免费计划; 付费计划起价为249美元/月

适合人群:有兴趣管理影响力营销活动的公司。 如果你刚刚开始,首先要利用免费工具。

8. Tweet Binder

Tweet Binder与Twitter和Instagram合作为你的业务创建自定义分析报告。他们还提供活动服务,例如为你的下一个大型营销活动创建社交媒体墙和自定义项目。

用于识别你需要参与的红人账户,大型活动策划和以及公司。对于实时捕捉,Binder功能通过标记内容和添加过滤器来实现或Web小部件。例如,可以为活动的社交媒体墙贴上最积极的推文。

价格:免费计划,限七天;付费计划从150欧元(184美元)/月开始;单一付费报告也可用

适合人群:需要实时跟踪广告系列效果的公司。也适合举办活动和发布商。

以上8款工具,是2018年最热门的工具,如果大家有需要,可以自行了解,但是工具只有英文界面,因此难度会稍大,但是使用并不复杂,希望对大家运营Twitter有所帮助。

]]>
营销大数据分析工具 Qubit 获 4000 万美元 C 轮融资 //www.otias-ub.com/archives/441166.html Tue, 23 Feb 2016 11:49:37 +0000 //www.otias-ub.com/?p=441166
Streamline-Multi-Channel-Marketing-with-Big-Data-big.pngheading
针对营销的大数据分析工具 Qubit 刚刚获得了 4000 万美元的 C 轮融资。

Qubit 是一家为营销人员提供大数据分析工具的初创企业,由 4 位前 Google 员工创建成立于 2010年,总部位于英国伦敦,其目标是帮助客户理解公司网站访客,并通过个性化展示来实时提高转化率。

在 CEO 兼创始人 Graham Cooke 看来,以前的电子商务模式赚的是容易钱,即电子商务网站只需要把商品陈列上去或者在客户最容易看到的地方打广告(如 Google 搜索侧栏广告)就能把访客转化为客户了,也就是所谓的转化率很高的 “预期经济”。但是现在随着客户设备以及旋转的多样化,客户购买决策过程变得更加冗长和复杂了,这增加了营销的难度。必须更加了解客户,提供个性化展示和优化才能提高转化率。

而 Qubit 的 Visitor Cloud 平台正是这样一套工具,它可以提供细分客户实时展示,将客户跨平台(解决客户使用设备多的问题)的产品浏览路径分析出来,同时 Qubit 还利用机器学习和大数据分析对不同业务流量数据进行分析,找出不同的客户类型模式,进而为营销人员提供不同的销售策略建议,从而引导客户销售漏斗的实现。

Qubit 目前拥有大概 300 家客户,其中包括 Topshop、希尔顿酒店、沃尔玛旗下的 ASDA 超市连锁等。且声称自 2012年 以来的年增长率均超过了 100%,目前 Qubit 处理的日均在线客户交互次数达 25 亿次,年销售额很快将达到 1 亿美元,预期在 18月 内实现收支平衡。

此轮融资由高盛领投,原有投资者 Accel 以及新投资者 Sapphire Ventures 与 Salesforce Ventures 跟投(值得注意的是后两家都是 CRM SaaS 巨头的投资机构)。此轮融资过后,其总融资已达 7485 万美元。此轮融资所得将用于电子商务以外其他垂直领域(如旅游、金融、电子游戏等)的扩张,以及 Visitor Cloud 平台的功能增强与完善,同时 Qubit 还将招聘更多人员,准备在硅谷开设分支机构。

来自:36kr

]]>
盘点最实用56个大数据可视化分析工具 //www.otias-ub.com/archives/439967.html Thu, 18 Feb 2016 13:05:33 +0000 //www.otias-ub.com/?p=439967 image

俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性;我们还需要跨学科的团队,而不是单个数据科学家、设计师或数据分析员;我们更需要重新思考我们所知道的数据可视化,图表和图形还只能在一个或两个维度上传递信息, 那么他们怎样才能与其他维度融合到一起深入挖掘大数据呢?此时就需要倚仗大数据可视化(BDV)工具,因此,笔者收集了适合各个平台各种行业的多个图表和报表工具,这些工具中不乏有适用于NET、Java、Flash、HTML5、Flex等平台的,也不乏有适用于常规图表报表、甘特图、流程图、金融图表、工控图表、数据透视表、OLAP多维分析等图表报表开发的。为了进一步让大家了解如何选择适合的数据可视化产品,本文将围绕这一话题展开,希望能对正在选型中的企业有所帮助。下面就来看看全球备受欢迎的的可视化工具都有哪些吧!

一、Excel
Excel作为一个入门级工具,是快速分析数据的理想工具,也能创建供内部使用的数据图,但是Excel在颜色、线条和样式上课选择的范围有限,这也意味着用Excel很难制作出能符合专业出版物和网站需要的数据图。

二、Google Chart API
Google Chart提供了一种非常完美的方式来可视化数据,提供了大量现成的图标类型,从简单的线图表到复杂的分层树地图等。它还内置了动画和用户交互控制。

三、D3
D3(Data Driven Documents)是支持SVG渲染的另一种JavaScript库。但是D3能够提供大量线性图和条形图之外的复杂图表样式,例如Voronoi图、树形图、圆形集群和单词云等。

四、R
R语言是主要用于统计分析、绘图的语言和操作环境。虽然R主要用于统计分析或者开发统计相关的软件,但也有用作矩阵计算。其分析速度可比美GNUOctave甚至商业软件MATLAB。

五、Visual.ly
如果你需要制作信息图而不仅仅是数据可视化,Visual.ly是最流行的一个选择。

六、Processing
Processing是数据可视化的招牌工具。你只需要编写一些简单的代码,然后编译成Java。Processing可以在几乎所有平台上运行。

七、Leaflet

Leaflet是一个开源的JavaScript库,用来开发移动友好地交互地图。

八、Openlayers
Openlayers可能是所有地图库中可靠性最高的一个。虽然文档注释并不完善。且学习曲线非常陡峭,但是对于特定的任务来说,Openlayers能够提供一些其他地图库都没有的特殊工具。

九、PolyMaps
PolyMaps是一个地图库,主要面向数据可视化用户。PolyMaps在地图风格化方面有独到之处,类似CSS样式表的选择器。

十、Charting Fonts
Charting Fonts是将符号字体与字体整合(把符号变成字体),创建出漂亮的矢量化图标。

十一、Gephi
Gephi是进行社会图谱数据可视化分析的工具,不但能处理大规模数据集并且Gephi是一个可视化的网络探索平台,用于构建动态的、分层的数据图表。

十二、CartoDB
CartoDB是一个不可错过的网站,你可以用CartoDB很轻易就把表格数据和地图关联起来,这方面CartoDB是最优秀的选择。

十三、Weka
Weka是一个能根据属性分类和集群大量数据的优秀工具,Weka不但是数据分析的强大工具,还能生成一些简单的图表。

十四、NodeBox
NodeBox是OS X上创建二维图形和可视化的应用程序,你需要了解Python程序,NodeBox与Processing类似,但没有Processing的互动功能。https://www.nodebox.net/code/index.php/Home

十五、Kartograph
Kartograph不需要任何地图提供者像Google Maps,用来建立互动式地图,由两个libraries组成,从空间数据开放格式,利用向量投影的Python library以及post GIS,并将两者结合到SVG和JavaScript library,并把这些SVG资料转变成互动性地图。

十六、Modest Maps
Modest Maps是一个很小的地图库,在一些扩展库的配合下,例如Wax、Modest Maps立刻会变成一个强大的地图工具。

十七、Tangle
Tangle是一个用来探索,Play和可以立即查看文档更新的交互工具。

十八、Crossfilter
Crossfilter既是图表,又是互动图形用户界面的小程序,当你调整一个图表中的输入范围时,其他关联图表的数据也会随之改变

十九、Raphael
Raphael是创建图表和图形的JavaScript库,与其他库最大的不同是输出格式仅限SVG和VML. http://raphaeljs.com/

二十、jsDraw2DX
jsDraw2DX是一个标准的JavaScript库,用来创建任意类型的SVG交互式图形,可生成包括线、矩形、多边形、椭圆、弧线等图形。http://jsdraw2dx.jsfiction.com/

二十一、Pizza Pie Charts
Pizza Pie Charts是个响应式饼图图表,基于Adobe Snap SVG框架,通过HTML标记和CSS来替代JavaScript对象,更容易集成各种先进的技术。

二十二、Fusion Charts Suit XT
Fusion Charts Suit XT是一款跨平台、跨浏览器的JavaScript图表组件,为你提供令人愉悦的JavaScript图表体验。它是最全面的图表解决方案,包含90+图表类型和众多交互功能,包括3D、各种仪表、工具提示、向下钻取、缩放和滚动等。它拥有完整的文档以及现成的演示,可以帮助你快速创建图表。

二十三、iCharts
iCharts提供可一个用于创建并呈现引人注目图表的托管解决方案。有许多不同种类的图表可供选择,每种类型都完全可定制,以适合网站的主题。iCharts有交互元素,可以从Google Doc、Excel表单和其他来源中获取数据。

二十四、Modest Maps
Modest Maps是一个轻量级、可扩展的、可定制的和免费的地图显示类库,这个类库能帮助开发人员在他们自己的项目里能够与地图进行交互。

二十五、Raw
Raw局域非常流行的D3.js库开发,支持很多图表类型,例如泡泡图、映射图、环图等。它可以使数据集在途、复制、粘贴、拖曳、删除于一体,并且允许我们定制化试图和层次。

二十六、Springy
Springy设计清凉并且简答。它提供了一个抽象的图形处理和计算的布局,支持Canvas、SVG、WebGL、HTML元素。

二十七、Bonsai
Bonsai使用SVG作为输出方式来生成图形和动画效果,拥有非常完整的图形处理API,可以使得你更加方便的处理图形效果。它还支持渐变和过滤器(灰度、模糊、不透明度)等效果。

二十八、Cube
Cube是一个开源的系统,用来可视化时间系列数据。它是基于MongoDB、NodeJS和D3.js开发。用户可以使用它为内部仪表板构建实时可视化的仪表板指标。

二十九、Gantti
Gantti是一个开源的PHP类,帮助用户即时生成Gantti图表。使用Gantti创建图表无需使用JavaScript,纯HTML-CSS3实现。图表默认输出非常漂亮,但用户可以自定义样式进行输出(SASS样式表)。

三十、Smoothie Charts
Smoothie Charts是一个十分小的动态流数据图表路。通过推送一个webSocket来显示实时数据流。Smoothie Charts只支持Chorme和Safari浏览器,并且不支持刻印文字或饼图,它很擅长显示流媒体数据。

三十一、Flot
Flot是一个优秀的线框图表库,支持所有支持canvas的浏览器(目前主流的浏览器如火狐、IE、Chrome等都支持)。

三十二、Tableau Public
Tableau Public是一款桌面可视化工具,用户可以创建自己的数据可视化,并将交互性数据可视化发布到网页上。

三十三、Many Eyes
Many Eyes是一个Web应用程序,用来创建、分享和讨论用户上传图形数据。

三十四、Anychart
Anychart是一个灵活的基于Flash/JavaScript(HTML5)的图表解决方案、跨浏览器、跨平台。除了图表功能外,它还有一款收费的交互式图表和仪表。

三十五、Dundas Chart
Dundas Chart处于行业领先地位的NET图表处理控件,于2009年被微软收购,并将图表产品的一部分功能集成到Visual Studio中。

三十六、TimeFlow
TimeFlow Analytical Timeline是为了暂时性资料的视觉化工具,现在有alpha版本因此有机会可以发现差错,提供以下不同的呈现方式:时间轴、日历、柱状图、表格等。

三十七、Protovis
Protovis是一个可视化JavaScript图表生成工具。

三十八、Choosel
Choosel是可扩展的模块化Google网络工具框架,可用来创建基于网络的整合了数据工作台和信息图表的可视化平台。

三十九、Zoho Reports
Zoho Reports支持丰富的功能帮助不同的用户解决各种个性化需求,支持SQL查询、类四暗自表格界面等。

四十、Quantum GIS(QDIS)
Quantum GIS(QDIS)是一个用户界面友好、开源代码的GIS客户端程序,支持数据的可视化、管理、编辑与分析和印刷地图的制作。

四十一、NodeXL
NodeXLDE 主要功能是社交网络可视化。

四十二、OpenStreetMap
OpenStreetMap是一个世界地图,由像您一样的人们所构筑,可依据开放协议自由使用。

四十三、OpenHeatMap
OpenHeatMap简单易用,用户可以用它上传数据、创建地图、交流信息。它可以把数据(如Google Spreadsheet的表单)转化为交互式的地图应用,并在网上分享。

四十四、Circos
Circos最初主要用于基因组序列相关数据的可视化,目前已应用于多个领域,例如:影视作品中的人物关系分析,物流公司的订单来源和流向分析等,大多数关系型数据都可以尝试用Circos来可视化。

四十五、Impure
Impure是一个可视化编程语言,旨在收集、处理可视化信息。

四十六、Polymaps
Polymaps是一个基于矢量和tile创建动态、交互式的动态地图。

四十七、Rickshaw
Rickshaw是一个基于D3.JS来创建序交互式的时间序列图表库。

四十八、Sigma.js
Sigma.js是一个开源的轻量级库,用来显示交互式的静态和动态图表。

四十九、Timeline
Timeline即时间轴,用户通过这个工具可以一目了然的知道自己在何时做了什么。

五十、BirdEye
BirdEye是Decearative Visual Analytics,它属于一个群体专案,为了要提升设计和广泛的开源资料视觉化发展,并且为了Adobe Flex建视觉分析图库,这个动作以叙述性的资料库为主,让使用者能够建立多元资料视觉化界面来分析以及呈现资讯。

五十一、Arbor.Js
Arbor.Js提供有效率、以力导向的版面配置演算法,抽象画图表组织以及筛选更新的处理。

五十二、Highchart.js
Highchart.js是单纯由JavaScript所写的图表资料库,提供简单的方法来增加互动性图表来表达你的网站或网站应用程式。目前它能支援线图、样条函数图。

五十三、Paper.js
Paper.js是一个开源向量图表叙述架构,能够在HTML5 Canvas 运作,对于初学者来说它是很容易学习的,其中也有很多专业面向可以提供中阶及高阶使用者。

五十四、Visualize Free
Visualize Free是一个建立在高阶商业后台集游InetScoft开发的视觉化软体免费的视觉分析工具,可从多元变量资料筛选并看其趋势,或是利用简单地点及方法来切割资料或是小范围的资料。

五十五、GeoCommons
GeoCommons可以使用户构建富交互可视化应用来解决问题,即使他们没有任何传统地图使用经验。你可以将实社会化数据或者GeoCommons保存的超5万份开源数据在地图上可视化,创造带交互的可视化分析作品,并将作品嵌入网站、博客或分享到社交网络上。

五十六:Echarts

提起ECharts,经常使用开源软件的朋友应该很熟悉,当然,如果你不知道也没关系。但是你肯定知道去年春节以及近期央视大规划报道的百度大数据产品,如百度迁徙、百度司南、百度大数据预测等等,这些产品的数据可视化均是通过ECharts来实现的。

在国外大数据可视化企业Tableau、Datawatch、Platfora强势入华的情况下,国人推出了ECharts,并且进行了开源,从这一点来说,中国的大数据行业并不落后于北美国家。ECharts也让我们看到了中国大数据可视化的未来,感谢ECharts以及ECharts团队。

传统的数据可视化工具仅仅将数据加以组合,通过不同的展现方式提供给用户,用于发现数据之间的关联信息。近年来,随着云和大数据时代的来临,数据可 视化产品已经不再满足于使用传统的数据可视化工具来对数据仓库中的数据抽取、归纳并简单的展现。新型的数据可视化产品必须满足互联网爆发的大数据需求,必须快速的收集、筛选、分析、归纳、展现决策者所需要的信息,并根据新增的数据进行实时更新。因此,在大数据时代,数据可视化工具必须具有以下特性:

(1)实时性:数据可视化工具必须适应大数据时代数据量的爆炸式增长需求,必须快速的收集分析数据、并对数据信息进行实时更新;

(2)简单操作:数据可视化工具满足快速开发、易于操作的特性,能满足互联网时代信息多变的特点;

(3)更丰富的展现:数据可视化工具需具有更丰富的展现方式,能充分满足数据展现的多维度要求;

(4)多种数据集成支持方式:数据的来源不仅仅局限于数据库,数据可视化工具将支持团队协作数据、数据仓库、文本等多种方式,并能够通过互联网进行展现。

数据可视化技术在现今是一个新兴领域,有越来越多的发展、研究等数据可视化分析,在诸如美国这些国家不断被需求。企业获取数据可视化功能主要通过编程和非编程两类工具实现。主流编程工具包括以下三种类型:从艺术的角度创作的数据可视化,比较典型的工具是 Processing.js,它是为艺术家提供的编程语言。从统计和数据处理的角度,R语言是一款典型的工具,它本身既可以做数据分析,又可以做图形 理。介于两者之间的工具,既要兼顾数据处理,又要兼顾展现效果,D3.js是一个不错的选择。像D3.js这种基于Javascript的数据可视化工具更适合在互联网上互动的展示数据。

大数据导航(http://hao.199it.com/)今日新增医疗数据工具,欢迎访问收藏~

]]>
谷歌子公司发布计算机固件分析工具 //www.otias-ub.com/archives/436979.html Tue, 02 Feb 2016 13:34:12 +0000 //www.otias-ub.com/?p=436979 Google-Virus-Total

如果计算机中毒太深,最好的杀毒软件可能也查不出其中的恶意代码。而随着恶意软件入侵能力不断提高,计算机固件已变成它们的首选目标。据国际数据集团新闻社日前报道,谷歌子公司VirusTotal发布了一种分析固件的新工具,能帮用户防止恶意软件入侵计算机固件。

固件是计算机启动时,连接硬件和操作系统的低层代码。通过攻击固件,加入的恶意代码无法从计算机中删除。

VirusTotal是一个免费分析文件和Url地址的在线服务网站,能帮助用户找出恶意内容。新增的固件分析工具旨在详细描述固件映像,检测其是合法的还是恶意的。它能扫描固件和BIOS文件,检查其中是否有恶意代码,用多种方法检查固件是否安全。该工具会执行一些任务,如苹果Mac BIOS检测与报告、BIOS可移植可执行文件的提取、识别映像中潜在的Windows可执行文件、PCI类代码明细、允许设备类型等。

研究人员指出,即使重启、OS扫除、重装,针对固件的恶意软件仍会留在计算机里。因为大部分杀毒软件不能扫描计算机固件,留下了敞开的安全漏洞。现在VirusTotal让人们能上传固件映像,利用多种技术全面扫描系统,包括启发式检测和认证提取,查找其中有无非计算机制造商官方发布的额外文件。VirusTotal博客中还推荐了几款用于Mac和PC的抓取固件映像的工具,并建议用户在上传之前删除所有私人信息。

Softpedia网站的卡特琳·辛帕努说:“对那些怀疑感染了恶意软件的用户来说,VirusTotal的新功能迟早会有用。”

]]>
互联网周刊:2015年Q1中国大数据分析工具TOP30排行榜 //www.otias-ub.com/archives/399872.html Mon, 02 Nov 2015 11:47:22 +0000 //www.otias-ub.com/?p=399872 以下是互联网周刊发布的《2015 Q1中国大数据分析工具TOP30排行榜》。其中整理的是中国境内在大数据分析领域最具话语权的企业,以及该企业在大数据分析领域的代表性产品,它们有的是计算机或者互联网领域的巨头,有的则是刚刚创办不久的初创企业。但它们有一个共同点,那就是它们都看到了大数据分析技术带来的大机会,于是毫不犹豫地挺进了数据分析领域。

20151031112931473147

目前,大数据分析工具在金融服务、零售、医疗卫生/生命科学、执法、电信、能源与公共事业、数字媒体/精准营销、交通运输等行业都有着广泛的应用。

但纵观国内企业,不论是国企还是民企,真正在业务决策中以数据分析结果为依据的,主要还是集中在银行,保险,电信和电商等几个行业。以IT预算最充沛,人员能力最强的银行为例,目前主要是大型银行在导入数据分析。中小银行尚在观望与学习阶段,人员与能力建设正在起步阶段。数据分析的应用范围主要集中在信用风险、流程优化、市场营销、成本与预算等几个方面,深度尚可,但广度一般,尚未扩充到运营管理的所有领域。

以前只有IBM、Google、微软这样的公司能做大数据的深挖,现在已经有越来越多的创业公司进入,不同公司在不同维度的数据分析和服务正创造出新的商业模式。

以下是国内大数据分析领域的典型应用场景,也是用户驾驭大数据分析工具,实现业务发展的成功案例:

民生银行借IBM InfoSphereBigInsights应对金融业的大数据挑战

IBM InfoSphereBigInsights大数据解决方案和企业级NoSQL数据库SequoiaDB合作,为民生银行搭建低成本、高性能、高可靠且水平扩张的数据平台,帮助民生银行通过大数据分析应对金融业的大数据挑战,完善交易流水查询分析系统,产业链金融管理系统,以及私人银行产品货架管理系统。

微软助力京沪高铁打造可持续扩展的信息化服务平台

在京沪高铁的信息化建设项目中,其关键旅客服务系统,如显示系统、广播系统、时钟系统、闸机检票系统全部由微软的SQL Server 企业版数据平台来支撑,与传统的信息化架构相比,微软的解决方案所需要的投入更低,管理也更加方便,在实际运营中具有非常好的效率,并且可以根据未来业务需求的变化进行不断地扩展。此外,高铁运营方还可以通过数据分析来预测业务趋势,为旅客提供更加个性化的服务。

农夫山泉运用SAPHANA实时处理海量数据

农夫山泉自成功实施SAP HANA后,大大提升了农夫山泉的商务智能系统,实现了数据展现速度上质的飞跃、实时的数据同步以及高效逻辑计算,为企业带来可观的商业价值。

中信银行信用卡实施EMC Greenplum数据仓库解决方案

中信银行信用卡中心选择实施EMC Greenplum数据仓库解决方案。Greenplum数据仓库解决方案为中信银行信用卡中心提供了统一的客户视图,借助客户统一视图,中信银行信用卡中心可以更清楚地了解其客户价值体系,从而能够为客户提供更有针对性和相关性的营销活动。基于数据仓库,中信银行信用卡中心现在可以从交易、服务、风险、权益等多个层面分析数据。通过提供全面的客户数据,营销团队可以对客户按照低、中、高价值来进行分类,根据银行整体经营策略积极地提供相应的个性化服务。

华为FusionInsight:招行数据生产力的“挖掘机”

招商银行部署华为FusionInsight之后,构建起基于云计算平台的大数据应用和分析平台,实现7年内海量交易历史明细信息的实时查询、实时征信、实时事件营销,以及针对准确客户群的精准营销。信用卡征信时间将由2周左右降到10分钟以内。理财产品短信营销更加智慧,根据招商银行某重要分行客户为样本测算,招商银行只要发送原来数量19.6%的短信,就可以覆盖95%最终购买的客户。对数据进行分析以后,系统有选择性地根据相关理财产品的特征去匹配用户财务状况及理财产品持有情况,再对客户进行推荐,短信发送数量大幅下降,但命中率大幅提高。

用友UAP成功案例大大提高波司登竞争力

波司登基于用友UAP统一应用平台的ERP系统,打通从客户下订单到生产、仓储、发运、财务等环节,构建企业的完整的内部管理信息系统,提高企业的内部协同能力,从而提高企业竞争力。并且将财务、销售、订单等大集中,订单数据能实时统计到集团总部,为采购业务提供精确支撑,实现按订单采购,保证采购原辅料能够满足生产需要,避免大量库存积压,也避免缺货等风险。

农行携手曙光构建大数据系统推动业务创新

农行采用曙光XData大数据一体机系统,满足系统对于并发用户数和性能的要求,能够支撑农业银行历史数据查询和分析业务,为推动农行业务持续不断创新奠定基础。

九次方企业征信大数据平台令金融交易更加简单便携

九次方企业征信大数据平台利用互联网大数据挖掘技术采集互联网全部与企业相关的信用指标,比如企业违法违规信息、行政处罚信息、客户投诉信息等等。同时九次方还联合20多个省市政府,协助政府搭建当地的企业征信大数据平台获取地方政府的数据授权,通过脱敏处理之后,向银行、小贷公司、担保公司等客户提供企业信用分析服务。

集奥聚合非Cookie数据提升精准广告

如今,集奥聚合已成功为花旗银行、百事、标致、强生、联合利华、苏宁易购、奔驰、夏普等各行业领先客户提供行业洞察和广告调度管理服务,有效地提升了广告投放效果和投资回报率。

王府井百货与百分点合作搭建王府井大数据平台

在王府井百货与百分点合作搭建的王府井大数据平台将用来分析商品、用户和业务数据,以打通用户和后端运营的关系,构建用户画像,以及分析商品的全渠道经营状况。其中,百分点帮助王府井针对线上用户的浏览和购买行为,进行数据分析,从而形成实时的商品个性化推荐和消息推送。

宜信金融云打造大数据变现超级伙伴

宜信旗下的宜人贷,是利用宜信金融云平台,其极速模式将对用户的授信时长从原来的十多分钟压缩到了一分钟之内,极大提高了用户体验和放款效率。宜信商通贷是基于宜信金融云推出的面向电商的一个实时授信产品。这种电商贷款模式通过高效整合交易数据、第三方数据以及社交网络行为数据,为用户提供个性化的融资产品。

传统的资源比如土地,几乎瓜分殆尽,而数据资产却在跑马圈地的阶段,任何一个企业,无论大小,都可以通过新颖的服务获取不同的数据资产,大数据分析平台固然重要,唯有善工利器,大数据分析才能真正发挥威力。

]]>
美国的VC们在使用什么数据分析工具? //www.otias-ub.com/archives/348113.html Mon, 18 May 2015 03:10:23 +0000 //www.otias-ub.com/?p=348113 长期以来,创业投资的方法被当做一门艺术在一个相对小的圈子内流传。富有经验的 VC 往往喜欢将自己的成功归因于这门艺术的历久弥新,而识人术又是这门艺术的重中之重。一个初创公司的团队 (team),还是产品 (product),抑或是市场 / 产品吸引力 (traction),都会被作为重要指标而影响每一个 VC 的投资决策。

 

对于一个初创公司而言 (尤其是尚处早期的团队 early-stage startup),除了有可能实际存在的产品外 (算上半成品及开发原型),剩下的指标都可以说是虚无缥缈。人们早已习惯了如此的筛选机制:投资人在乎的是感觉,看顺眼或许比产品概念更为受用。至于这套机制是否成功,则需另当别论:美国风投协会(National Venture Capital Association) 的一组数据显示,在 21 世纪的第一个十年内,美国创投业的总体回报率为负数。在这个大数据概念横行的时代,像创投业这样长期位于科技行业风口浪尖并且耳濡目染各种新科技的行业,要把数据分析结合进传统做法中的尝试也已是老调新弹。

 

数据分析被广泛地应用于各行各业,尤其在金融业中。资产管理公司 (asset management) 和基金公司们早在数十年前便已大规模地应用数学理论来衡量公司投资产品的质量以及预测未来的市场表现。而与之一墙之隔、同属金融行业的 VC 公司们,使用数据分析来量化评估投资看起来也应该是一件理所应当的事。

 

我们之前也数次讨论过数据分析对风投领域可能产生的影响和价值。以 Google Ventures 为代表,包括我们耳熟能详的 KPCB 和红杉资本 (Sequoia Capital) 在内的一众创投对数据分析投资的兴趣已经持续了好几年,而像 IronStone 这样的业界新人和 YC 这样的孵化器大佬也已投身其中,即使业界至今对于“计算机算法是否能够发现下一个乔布斯”这样的问题还未达成共识。纵使像 Google Ventures 这样背后有“数据公司”谷歌的全球最大数据库和云计算做靠山的高富帅,也尚未得到能够放之四海而皆准的标准公式,而如何更准确地量化团队的化学反应及产品的市场吸引力等等因素还是一个亟待解决的行业性问题。

 

不过 Google Ventures 声称他们已经在数据分析上获取了相当的进展。他们拒绝公开成果,不过综合各方面信息看来,Google Ventures 的公式或许并没有想象得那么高深:他们通过分析运用诸如创业城市、团队平均年龄、过往创业经历这样的因素来考量每一个潜在的投资机会。不过 Mark Zuckerberg 在成立 Facebook 前只卖过产品原型而无创业经历,甚至 Google Ventures 的俩老板,Larry Page 和 Sergey Brin,如果要用这么一个算法来评测,估计也难以过关。Google Ventures 也颇有自知之明,看感觉 (intuition) 和看顺眼 (chemistry) 仍是他们在投资决策中颇为重要的考量因素。

 

KPCB 和红杉这样的高级玩家也尝试过通过分析创业公司在 Twitter 上被提及次数,或者创业公司产品 App Store 排名这样的数据来分析一家创业公司的价值。而 IronStone,这家由William Hambrecht创立的被视为异类的创投,在数据分析上走得比同行们更远更快。根据一些已经公布的信息,他们声称一个创业公司的团队因素只会在他们的整个考量过程中占到 12%,即使团队和人员长期以来被传统创投视为最为重要的一项影响因素;而另外 20% 被分给了创业公司的其他各项指标,余下的 68% 则全部被市场因素占用:将要进入的市场的环境、公司的调整周期、市场的变化是否可被预期等等。

 

目前已知的或公开声称正在或将要使用数量分析来投初创公司的主要机构包括上文提及的 Google Ventures、KPCB、Sequoia Capital、IronStone、Y Combinator,以及 500Startups、August Capital、Accel Partners、Andreessen Horowitz、Floodgate Fund、Greylock Partners、SVAngel 等等。其中,Accel Partners 专门拨出 1 亿美元作为大数据基金 (Big Data Fund),而 Greylock 已在使用其内部数据团队制作的专有数据分析工具。Google+、Facebook 和 Twitter 等社交网络是目前被作为数据采集的主要源头。

传统的 VC 决策流程,可以大致划分为 5 个阶段:

 

  1. 潜在的市场有多大?
  2. 潜在的市场机会有多少?能从竞争对手处抢到多少市场份额?
  3. 潜在的商业模型是什么?营收和利润能达到什么水平?
  4. 保守估计,潜在的运营/产品成本有多少?通过这轮融资能够满足团队运营的周期?
  5. 5至10年内是否会有潜在的退出机会或IPO机会?

 

最重要的是大部分 VC 在拍板前,还会自问:我是否喜欢这个团队 / 这个团队是否值得投资?

 

而在引入了数据分析之后,这个流程会受到什么样的影响?下图是我根据经验以及整理各个 VC 大佬们的文章后制作的一张图表,反映了美国的主流 VC 在不同投资阶段主要用到的有关数据分析的工具。

 

10324350S-0

 

举例来说,一家提倡数据分析投资并专注于早期投资 (early stage/seed stage) 的 VC 会在初期寻找投资目标时通过AngelList和Seedsummit这样的初创公司数据库进行海选,之后利用CapLinked之类的流程管理平台建立联系关系网并设定一定的筛选投资流程。目前针对早期公司的量化评估还未出现什么靠谱的工具,不过有些 VC 会用一个叫YouNoodle的来搜集一个初创公司的竞争对手的信息,以此评估该团队的市场竞争力。

 

OwnYourVenture则提供了一个平台,VC 和创业者可以在输入相关数据后得出几轮投资后的股权价值分配情况。而在某轮融资结束后,VC 可以自建数据库以跟踪所投公司的运营,也可以通过Startup Genome这样的平台来跟踪公司信息或当地创业市场。

在此不得不重点介绍下CB Insights和PitchBook。CB Insights 作为一家有着金融行业背景的纽约初创数据公司,在集成行业数据和数据分析上做得相当出色,他们定期的行业数据分析报告为 VC 和其他相关媒体机构广为应用,而他们推出的不少可视化数据分析工具也颇有价值。PitchBook 也有着出色的可视化数据平台,但是他们的产品则针对各初创公司提供了更为具体的信息,丰富的 VC 数据库也为创业者和投资者们提供了检视各家 VC 具体信息的平台。当然,36Kr+数据库对于国内的 VC 和创业者们来说是一个很好的工具,我们也会不断改进完善我们的数据库、添加新的功能,以更好地服务国内的创业者和投资人们。

1032434G9-1CB Insights的可视化数据库

 

1032433L8-2

PitchBook所提供的VC信息界面

 

凭心而论,目前这种规模的数据分析或许无从谈及大数据,但是倘若将待分析的数据库规模扩大 10 倍,甚至 100 倍,大数据这样的技术就足以让极大地提高创投的反应速度,而至于结果的质量,或许需要一个相对长的时间来给我们答案。

 

移动技术快速发展产生的大量数据则是一个很好的案例。都说移动技术的发展正在极大地改变每一个行业、甚至每一个人的生活,这一样可以用在创投界。大数据的时代才刚刚来临,而移动互联网和移动设备产生数据的能力和潜力是难以预估的,最好的例子便是在刚过去的双十一里,淘宝有15%的交易额来自移动端。对于想要掌握用户需求和习惯的创业者,以及希望发现有成长潜力的产品和创业者的 VC 们来说,这个时代或许会是一个前所未有的黄金时期。

 

对 VC 来说,手头有了数据之后,问题就在于如何有效地分析数据并量化评估标准。举例来说,一个房地产投资人可以用Case Shiller房价指数这样的量化指标来衡量当前的市场环境,用公开数据和政府文件来评估某家具体开发公司的运营状况;而专注于投资上市公司的投资者,简单的标普 500 指数和某家公司的市盈率就能勾画出一个投资机会的轮廓。对于 VC 和天使投资人来说,这样的画面在投初创公司的时候是难以想象的。VC 的尽职调查 (Due Diligence) 很多时候只能通过投资者的人际网交流和主观感受来完成,而不是像投行们那样甩出成摞的 Excel 和精美的尽职调查报告。纵使诸如 CB Insights、Crunchbase、AngelList 这样的数据平台的大量出现能够改变 VC 们以往那种缺乏数据的生活,但是如何选择数据、如何将数据转换成有用的信息,则是 VC 们的下一个难题。

199IT大数据工具导航,目前覆盖1000多款工具,投资人的必选。

]]>
10个针对企业的免费大数据分析工具 //www.otias-ub.com/archives/345221.html Tue, 05 May 2015 10:10:34 +0000 //www.otias-ub.com/?p=345221 虽然收集和分析“大数据”存在一些分析和技术方面的挑战,但事实上大部分公司已经能够应对这种挑战。这是因为有一些非常强大的分析工具都是免费、开源的,可以充分利用这些工具来提升自己的能力。

Alex Jones推荐了10个针对企业的大数据分析工具,这些工具不仅免费、使用方便,而且具有强大的功能和良好的资源。

1、Tableau Public

这是一个简单直观的可视化工具。它在商业活动中表现的很强大,因为它通过可视化来表达。它有足够的空间和免费使用时长让你体验,在分析的过程中,Tableau的图片呈现可以让你快速的调查一个假设、验证你的直觉,做更好的商业决策。

640.webp_

2、OpenRefine

它是以前的GoogleRefine,OpenRefine是一款数据清理软件,可以对准备好的一切数据进行分析。例如最近我清理了一个含有化学名称的数据库,并且各行有不同的拼写、大小写、空格等,用计算机来处理非常困难,幸运的是, OpenRefine包含许多聚类算法,对这个问题可以快速解决。

640.webp-1

Tip:可以用 IncreaseJava Heap Space 处理文件。

3、KNIME

KNIME可以通过可视化编程的方式来操作、分析和建模。不仅可以写代码。你还可以在操作中建立联系节点。基本上你只需要将功能模块拖拽到工作区,并将模块按照运行流程连接起来,就可以实现以往编程才能实现的工作。更重要的是,KNIME可以扩展到运行R, python, text mining,chemistry data等等,这可以让你选择用更先进的编码来分析。

Tip:读取CSV文件时需要用“File Reader”代替CSV阅读器。

640.webp-2

4、RapidMiner

和KNIME类似, RapidMiner通过可视化编程操作,建模和分析数据。最近,RapidMiner赢得kdnuggets的软件调查。

640.webp-3

5、GoogleFusion Tables

这是针对数据分析、大数据集的可视化和映射的一个非常强大的工具,谷歌的地图软件在其中起着重要作用。拿下面这张图来说,这是一张墨西哥湾石油生产平台的图,我只需要上传数据,Google Fusion Tables确认维度和经度的数据之后就开始工作了。

640.webp-4

6、NodeXL

NodeXL是针对网络和关系的可视化分析软件。想想科技巨头地图上代表LinkedIn或Facebook的连接,NodeXL提供了进一步精确的计算。如果你在不需要那么先进的东西,你可以看看Google Fusion Tables,或者尝试用Gephi。

640.webp-5

7、import.io

从网上抓取网页和信息曾经是技术人员的专利,现在用import.io,每个人都可以从网站和论坛获取数据。简单提出你想要的数据,几分钟之后import.io就可以通过你的搜索知道你在找什么,从而会挖掘、提供数据用于你的分析或输出。

640.webp-6

8、Google Search Operators

不可否认谷歌最初是一个强大的资源和搜索公司,运营商可以让你快速过滤掉谷歌的结果得到的最有用的和相关的信息。比如说,你正想从ABC咨询里寻找一个今年的数据科学报告。如果我们认为该报告可能是PDF格式的,可以搜索

“数据科学报告”网站::ABCConsulting.com Filetype:PDF

然后在下面的搜索栏,使用“搜索工具”来屏蔽去年的结果。这在发现新的信息或市场研究方面非常有用。

640.webp-7

9、Solver

Solver是一个在excel中做优化和线性规划的工具,允许你设置一些约束条件(例如不超过什么价格,要在哪天之前完成之类)。虽然更有效的优化可能会需要另一个程序(例如R的优化包),但是Solver应用范围比较广。

10、WolframAlpha

Wolfram Alpha的搜索引擎是一个隐藏的宝石,可以媲美苹果的Siri。WolframAlpha类似于不那么智能的Google,对科技搜索提供详细的回复,对微积分作用也能快速的搜索。对企业用户来说,它提供了信息图表,对历史价格、商品信息、主题概述。

640.webp-8

虽然这些工具使得分析更简单,但他们只是把信息放进去然后进行分析,这些你自己也可以做到。所以用一点时间来学习新的技巧,用这些工具来提高自己完成工作。

]]>
明天的数字营销分析工具(2) //www.otias-ub.com/archives/231753.html Tue, 27 May 2014 04:16:50 +0000 //www.otias-ub.com/?p=231753
Baidu
或者前面还好点,但如果我们要实现哪怕一点点高级的功能,基本都需要对代码动或大或小的“手术”。]]>
     工具三:HeapAnalytics

  HeapAnalytics是另外一个很具有前瞻性的解决方案。这个工具非常符合我在上集中说的“去技术化”特征。

  我们都知道,做网站分析,有两个大部分的事情要做,一个是做Tracking(监测),另外一个是做(Analysis)分析。Tracking这块,如果只是把一个工具提供的基本代码原封不动的丢到</body>或者</head>前面还好点,但如果我们要实现哪怕一点点高级的功能,基本都需要对代码动或大或小的“手术”。对于Google Analytics而言,做event tracking(事件追踪)或者是自定义变量(custom viarables)对于不懂前端技术的朋友来说,就不怎么简单了。而更复杂的监测则更望尘莫及。

  HeapAnalytics的一大特异之处是,让我们任何完全不懂技术的“普通人”,也能够轻而易举的监测到任何我们想监测的东西。

  HeapAnalytics的方法是,它提供了一个所见即所得的追踪方式——HeapAnalytics在它的监测配置页面中,直接引用了你的页面,然后,你的鼠标移动到页面的任何可交互位置,都会有一个红框把该交互元素框取下来。这时,如果你点击,就等于告诉了HeapAnalytics说,“我想监测这里”,于是HeapAnalytics让你把这个想监测的地方起一个名字,然后它就会开始帮你监测这个地方。是不是追踪设置非常简单?下图中所示的,就是当我把鼠标停留在搜索框的位置时,HeapAnalytics的监测确认红框也框下了这个互动元素。一旦我确定这个地方需要监测,并且提交给HeapAnalytics,它就会忠实记录这个搜索框被激活的次数加上搜索发生的次数。如果你想单独记录搜索框被激活的次数,或者点击放大镜图标的次数,只需要把鼠标移动到相应位置即可。

Heap

  不过,不仅如此。这个工具另一个让人印象深刻的地方是,即使你自己没有定义页面上的任何元素,当你鼠标在它的监测设置页面上点击下去的时候,它会立即告诉你这个地方曾经被点击的次数。如下图所示:

heap2

  既然抓图抓到了这个网站的页面,我就顺便做一下介绍。这个网站是我和好多个对大数据有特别爱好的朋友一起做的,我们的宗旨是翻译一些觉得有趣的海外的关于大数据的信息,然后完全完整原汁原味的呈现给大家。其中有很多不错的内容,所以,如果大家对大数据感兴趣,又想知道国外的counterparts是怎么看待大数据的,不妨支持这个网站,谢谢!链接是:世界大数据观察。

  关于HeapAnalytics我就说到这里,因为是完全免费的,大家自己去尝试就好了。它并不是一个全面的工具,但它确实是一个很好的event tracking的解决方案。

工具四:Ensighten

  这些工具统一属于一个大的范畴,即tag manager工具。这一类工具要解决的问题很明确,即降低各种加之在页面上的追踪代码和互联网营销工具代码的管理复杂度。一个简单的场景可以让大家理解它们的用途。如果我们的一个网站上,放置了Google Analytics(GA)的代码,大家都知道它的代码是可以根据需要进行定制的,如果某一天,你觉得必须要对页面上GA的代码进行修改了,你会怎么做?通常的流程是,你需要拿着新的代码,告诉你的前端工程师,请他们帮忙放上代码,并且测试代码的可靠性,然后才能正式上线启用。这个流程对于一个稍微复杂一点的企业,就不是那么简单了,至少分析师需要向前端工程师求情,然后再等待执行排期。或许,等你刚刚改好了这个代码,新的代码修改需要又出现了,你不得不又找工程师帮忙——我相信你已经不得不请他吃饭以确保他能心平气和的帮你的忙了。

  问题是,我们要应付的还不只是一个GA的代码,还有很多其他监测的代码,比如我们在第一集提到的那些工具,比如Miapex的代码,或者流行的Adobe Analytics工具神马的。而且,我们还不只是会在页面上放置监测代码,我们还会放上很多营销工具的代码,例如做targeting,retarting,还有RTB的代码——页面上塞满了各种代码,我们每次要做修改,都要让技术同事忙活一番,而且还存在着各种可能没能事先预知的危险。所以,这绝对不是可以轻视的事情。

  Ensighten、TrackingFirst以及Google Tag Manager是解决这类问题的工具。原理很简单,把所有的代码都不要再直接放到页面上了,而是统一集中到第三方的服务器上的一个.js文件中,页面上只放一段代码,用于调用这个外部的.js文件。一旦调用发生,这个文件中的所有的代码就能在页面中发挥功能,就如同这些代码直接被写在了页面中一样。关于调用外部.js文件,对于前端技术同事来说就跟1+1=2一样直白。如果你对此不是很了解,直接问问技术同事即可。利用这个方式,当你需要对任何第三方代码进行修改时,就完全不必要再麻烦技术同事折腾页面了,你只需要修改这个外部的.js文件即可,而且修改之后,立即生效。

  我特别提及了Ensighten的原因是,它确实是我认为的目前业界最好的tag manager,而且风头正劲。收购了它的竞争对手TagMan之后,它在这个领域的市场占有率可能也是最大的。这个公司不仅仅提供面向web的代码管理方案,它也做event tagging的管理(对用于做事件追踪的代码进行管理),以及对mobile app tracking的代码(相当程度上我认为是sdk的library)进行管理等。完整的解决方案让这个供应商显得更有竞争力。

  Google的Tag Manager怎么样呢?没问题,免费而且稳定。它与Ensighten的竞争关系类似于Google Analytics和Omniture的竞争关系,各有各的市场吧。

tagmgr_before

图:没有Tag Management的情况下管理页面的各种监测代码真是非常麻烦的事情(图片来自于工具:TraceAd)

tagmgr_after

图:有了Tag Management,代码管理简简单单!(图片来自于工具:TraceAd)

  另一个值得关注的地方是tag manager向app监测领域的延伸,即监测sdk管理工具。原理与上面一样,各种sdk不再直接添加到app中,而是统一放到一个云端,这个云端生成一个“总的”sdk包,包含各种供应商的sdk,然后把这个总的sdk发给各个app。这样app中的sdk需要做修改或升级,同样不需要再对app本身进行迭代。这个领域同样具有很大的前景。

  Ensighten这一类工具的生意机会在哪里?我觉得太大了。它们真的很聪明,自己并不需要做一个特别的分析工具,或者不需要做一个营销工具什么的,就能通过其他的分析工具或营销工具服务商,迅速铺满各种终端。如果它们在自己的.js文件或者sdk中加上一点点实现自己功能的东西——比如监测点什么——理论上会比任何一家营销工具能够覆盖的终端都要多。所以,他们实际上可以控制最多的数据源。当然,数据源就是钱,你懂的。

  当然,我会说,帮助人们减少tagging的难度和成本,也是一种典型的去技术化。我期待在不远的未来,所有的tracking和tagging都能不依赖于网站的前后端技术人员,这一定是迟早的事情。

工具五:Dundas和Sweetspot Intelligence

  我一直在强调去技术化。数据不能被好好利用的原因,是人人都知道它是一个极为深奥且需要累积大量知识和技术才能被利用的东西。如同一个坚果,我们需要打碎它外部坚硬的果壳才能品尝到鲜美的果实,但单这果壳就让人望而却步。所以数据的未来一定在去技术化,要让普通人像浏览网页一样轻松地浏览数据,像操作手机一样便利地操作数据。

  数据如何才能更简单的被人们浏览和操作?业界一般有两种方法,这些方法都在数据的呈现层,也就是人机界面这个层次来体现。一种方法,是通过infographics的方式(就是我们看到的那些图配数的狂拽炫酷屌炸天的数据图),另一种方法,则是通过dashboard。两种方法当然都是当今最热门的领域之一——数据可视化(Data Visualization)的最重要组成部分。而数据可视化的目的和价值,当然就是去技术化。在日常工作中,在对商业活动的指导频率和强度上,dashboard都要比infographics重要的多。所以,在这个部分工具五中,我提到的两个工具:Dundas和Sweetspot都是在dashboard领域有专门作为的。

  在e-Summit的这次会议中,有好几场专门关于dashboard的演讲,其中一场甚至是key note speech,说明美国人对这个领域的重视。这不奇怪,因为几乎所有利用数据的企业和部门,大家都更乐意于浏览更加友好的dashboard,而不是直接跳到细节报告本身。所以用户友好是dashboard的第一个重要的特征。Dashboard的第二个特征,则是它必须能够被定制化,毕竟不同企业和部分的业务不同,关心的事情肯定不一样。Dashboard的最后一个特征,是绝对尽量简明扼要的展现关键信息和细节。展现关键信息好办,展现细节就不容易了,因为一旦有了细节,就会跟简明扼要这个宗旨相矛盾。因此如何把握二者的平衡,是做dashboard中非常艺术的领域。

  Dundas和Sweetspot这两个工具都是dashboard的专业供应商。他们的商业模式都很明确:你给我原材料,我帮你来料加工,然后出了成品你付给我钱。原材料包括两个:企业的业务目标和关键环节,以及与这些目标和环节相关的全部数据。这两家公司,包括其他的RJMetrics等公司,并没有特别大的不同。他们提供的服务包括:给你dashboard的生成工具(云端的或者local host的)你自己利用自己的数据制作dashboard,或是由这些服务商提供更为傻瓜的“去技术化”的服务直接利用客户的数据,按照客户的业务需求,把dashboards做出来,给客户使用。有一些,例如Sweetspot,还可以做一些数据的挖掘,将挖掘的结果也呈现在dashbaords中。而Dundas则有较好的dashboard的互动能力,例如,在dashboard的某一个reportlet(子报告)中点击一个柱状图中的柱子或是趋势图中的一根线,就会展现出这根柱子或者这根线的更细节的数据图表。另外,大家也都提供针对不同行业的标准dashboard解决方案。

dundas

  有朋友会问,Dashboards和网站分析工具中一个一个具体的报告谁更有价值?我认为它们都极为重要,体现了不同价值。Dashboards的核心在于以最“美妙”的方式展示所有的关键指标(KPI),而具体的reports则给你所有的过程和细节。你在dashboards上能够快速发现让你快乐的和让你担心的,但如果需要刨根问底,则需要具体的看reports。

  不过,我也相信,随着我们去技术化的深入,我们如何展示数据,一定会发生革命性的变化,dashboards最终能够取代所有的reports,或者用更符合真实的说法,是reports本身,也会dashboard化。Dashboards不再仅仅只是展示KPI,在它的主界面上一定可以通过快速交互的方式,让你直接在dashboards展示报告的细节,如同Dundas的网站视频中给我们演示的那样。更酷的工具才有未来。

工具六:Lytics

  这个系列的最后一个工具,是Lytics。

lytics

  Lytics这个工具做什么,用他们自己的话说,是“a customer data platform for customer-centric digital marketing”,就是帮助广告主(用户)实现以顾客为中心的数字化营销的顾客数据平台。理论上,这个工具帮助用户解决几个方面的问题:

1. 收集理论上与每个顾客相关的数据:Mobile上的用户行为数据、互联网上的浏览数据、在线购物数据、客服支持或CRM数据、社交媒体上的数据等等等等。

2. 把这些数据附着在具体的一个一个的顾客身上。当然,前提是能够识别唯一顾客。

3. 整合这些数据,然后形成每一个顾客的画像(profile),然后让营销部门和顾客关系部门利用顾客的画像信息进行有针对性的营销或服务。

  这个工具目前仍然在内测和小圈子beta阶段,这一解决方案的背后,顺应了广告主对于管理自己顾客(customer)和潜在顾客(target audience)的强烈需求。的确,我们一方面希望能够迅速了解他们的方方面面,另一方面则希望在了解他们的基础上分析他们的需求,并立即着手与他们发生互动。这意味着我们不再盲目、被动,而是瞅准机会为合适的对象传达合意的消息。

  与传统的CRM工具的差异在哪里?我认为是能够获取和整合的用户数据大大扩展了。传统的CRM只能记录已经成为自己客户的有限的数据(购物和与你直接发生互动的那些数据),但Lytics之类的方案,则不仅仅只是盯着已经成为你的客户的那些,还有你希望通过各种营销手段“打击”到的目标受众(潜在顾客),并且,数据的内容拓展到了整个互联网中他们的行为和静态信息(如社会属性),而不要求一定与你发生直接的交互。

  Lytics做的如何?我尚未试用。不过这类工具其实已经不鲜见,DMP(Data Management Platform)要做的事情是完全类似的,只不过它们更偏向外部营销,以及输出给DSP或者Ad Exchange,而较少人为进行分析和挖掘。Lytics则提供reporting,分析以及人工的数据挖掘和数据可视化(利用Tableau之类的工具)。

  这些工具,其实已经不是明天的工具了,它们已经在支配今天。

  介绍到这个工具,关于明天的数字营销分析工具也就差不多写完了。可能还有很多我没有写到的。比如,NetConcepts的胡力同学邀请我写一些ClickTale的,但是因为其实跟Miapex的解决方案比较类似,我就不重复写了。感兴趣的同学可以看胡力同学亲自搭建的介绍Clicktale的网站:http://cro.netconcepts.cn/clicktale。最后,如果大家有觉得很棒很酷的工具,也可以告诉我,我也很乐意学习之后,跟大家做介绍。

via:http://www.chinawebanalytics.cn/emetrics-summit-review-2/

]]>
明天的数字营销分析工具 //www.otias-ub.com/archives/231698.html //www.otias-ub.com/archives/231698.html#comments Tue, 27 May 2014 03:45:15 +0000 //www.otias-ub.com/?p=231698    3月17,3月18日两天,很有幸的参加了在美国旧金山举办的eMetrics Summit会议,会议很多收获。本来,因为过去在犹他州工作的关系,也眼见了Omniture和业界的很多与国内不同之处,但这一次旧金山会议的所见所闻仍颇多震撼。

  首先的感受是,美国一定比中国领先十年吗?一言以蔽之,这么说太绝对,在技术上,美国未必真的比我们领先那么多,世界是平的,中国研究技术的开发者和大牛也不少,因此这个领域美国人或许确实领先,但领先十年的代际差距,倒还不至于。

  但是,大环境的领先,却可能不是十年那么简单,甚至用时间去衡量都不恰当,因为美国的市场环境和专业环境迥异,所以美国能玩的,中国恐怕永远玩不了,也不会去玩;反之,中国也会创造出一些适应国内环境的玩法。

  先不说中国怎样,单说美国有一个环境即与我们这里不同,数字营销分析工具方面,无论什么样的创新,只要能够解决某一领域的问题,满足某些方面的需求,那么一定会有客户愿意掏钱购买。因此,美国人更乐意于不断创新,发现解决问题的办法,不断改善现有技术,然后在市场上贩卖,获得收益。新东西不怕被人抄袭?美国也有抄袭别人的,就算是别人的专利,其实还是可以绕道实现同样的效果,但程度就要小多了,原因很简单,文化不容,被人瞧不起。这就好像在美国道路上开车,你要是真的不让行人先行,可能也不能把你怎么样,但路上一定有人对你竖中指,你不愿受这个鄙视,所以乖乖停着让人。但在中国,停止线前停一下等一下斑马线上的行人,后面的车就一定要猛按喇叭催了,文化不同。这种文化的不同,使美国市场上的数字营销分析工具远远多于中国,而且创新性强,远甚中国。

  这篇文章,我想写写他们在工具方面的进展,名字叫明天的工具,我想,这方面美国的今天,是中国的明天。

明天的工具关注什么

  现在讨论最多的新问题新现象,肯定会成为工具的趋势,美国人在会上关注些什么呢?

1. 以用户(客户)为中心的监测和分析

  这是一个大家都已经看到的趋势,Google Analytics更新成Universal Analytics之后的一个最显著的点,就是把过去以visit为核心的监测,进化为以visitor为核心的监测。我们已经不可能满足于只是知道一个访问session过程中发生了什么,我们想要知道在访问者(用户)的生命周期内发生了什么,并且用更大的尺度观察、分析以及优化。这拓宽了我们的视野,我们可以做微观的调整(利用既有的visit的方法论),也可以进一步知道做宏观的分析(利用新的以用户为中心的方法论)。这对优化我们的策略具有决定性的意义。

  当然,以用户为中心的监测和分析不是仅仅从visit进化到了visitor这么简单,它还包括其他的要素,这些要素是:唯一访问者(唯一用户)的识别,多样化的数据源,统一平台基础上的数据整合。我们接着看这些。

2. 唯一访问者的识别

  老美对这一块的关注主要在于跨设备的追踪上,我在上一篇文章中也有专门讲到。所以讲到跨设备追踪的分会场演讲中,人满为患。不过令我相当失望的是,在这个演讲中使用的跨设备追踪方法不是我期望的高大上的大数据方法,或者是fingerprint方法,而是老老实实用了UID的方法。但它至少说明了一个问题,在美国,UID方法解决跨设备追踪是完全可以使用的,一方面用户确实在几乎所有自己的设备中都登录了自己的Google账号,另外一方面,大多数的网络或者服务,也都要求用户注册登录之后才能享用。这样UID方法反而成了广覆盖。我们现在在中国也很关心这个领域,只是没看到真正经得起检验的解决方案。

3. 多样化的数据源

  Google Analytics更新成Universal Analytics的另外一个原因,是它开始兼容各种数据来源的数据,因此,分析不一定只是onsite(自己的网站),也不只是online(互联网),它也可以包容其他系统的数据,例如CRM,ERP;甚至可以包容offline的数据,它希望做到如它名字所说的“统一”(universal的一个意思即是统一)。

  既然我们要真正了解用户,以用户为中心,那么我们当然要尽可能获取与用户相关的所有数据。

  线上数据,各种IT系统的数据就不说了,有趣的是,老美们想尽办法想把offline(传统世界)的东西也数据化,然后搬进Universal Analytics或者相类似的工具中。就像下面这张图所示,各种传感器的数据(哈哈,有没有朋友知道Raspberry Pi或者Arduino?现在老火了)都可以输入到Universal Analytics中。还有人把商店里面布满传感器,捕捉客户的行为,这些传感器的数据,又全部传送给了线上工具,例如传给了Universal Analytics。再考虑到优惠券,二维码什么的,统统都可以输入到这个平台中,想象空间一下子大起来,O2O实际上很容易就打通了。不少老美们天天都在琢磨这个,有意思。

sensors

  多样化的数据源,对用户的理解当然会深透很多,不过组织数据然后加以分析就成为一个问题了,所以自然而然,新的需求又提出来,即一个能够整合各种数据的统一的监测和分析平台。其实Universal Analytics就是这样的平台,但它不是唯一的,而且也不是走得最远的。

4. 统一平台基础上的数据整合

  这样一个平台并非是Google Analytics最先想到的,也不是它最先做的。在听这个会议的一个分会场,Intuit(一个业界巨牛的会计税务软件公司,quickbooks和turbotax就是他们的产品)的数字营销经理分享了他们的案例,即使用Omniture和CRM作为数据源,然后将数据输入到他们自己的BI中做整合,并且通过这个方法实现两个系统的打通,将CRM对用户的管理,延伸到网站上。可见,就算业界没有解决方案,企业自己已经搭建解决方案了,毕竟满足业务需要是第一位的。

  不过,现在这样的工具也多了起来,在这个会议上,有一些工具上就提供这样的服务,后面我也会讲到。

5. 去技术化

  去技术化的核心是牛逼的技术。什么意思呢,就是让不懂技术的人也能轻松驾驭技术,让懂技术的人能够更好地管理技术。使用方式傻瓜,功能极为强大的意思。美国人在usability(使用体验)上的追求还是很到位的,很多工具都尽可能考虑如何让技术以人为本。有不少“明天的”工具,已经开始在这样做了。我们后面会介绍。

  这五点,美国的新数字营销分析工具都有cover。

明天的工具介绍

  好了,前面打了那么多伏笔,就是想让大家了解一下为什么这些工具在美国是趋势,因为有需求嘛。那么我们来看一下这些工具都在做什么,它们为什么反映了明天。

工具一:Miapex

  我要把这个工具作为第一个介绍的原因,是因为这是第一款从中国走向美国的工具!大家可能没有听过它的名字,事实上,创业团队在中国,但市场几乎全部在海外。这个工具满足我前面所讲的两条:去技术化,以及以用户为中心的监测与分析

  说它是去技术化的,体现在两方面:更傻瓜智能化的使用体验,以及更准确强悍的热图功能。

  使用体验方面,相对于Google Analytics,细分和过滤功能设计的相对更加简单,在所有的报告和度量旁,都可以直接做数据过滤;内容编组方面,非常傻瓜,既有高级的利用RegEx的方式,也有为了毫无技术素养的朋友设计的“一点技术含量都没有的”手动输入一个一个页面名称的方法,当然还有介于这些最傻瓜和最高级功能之间的各种方法。目的是为了让每一个人都能上手用。用他们CEO Robin的说法,“这个工具要让普通的市场人员都能够非常轻松自如的使用,如果工具只能让技术同事使用,那么它的价值就必然大打折扣。”

  这个工具更加令人印象深刻的是热图功能,事实上它的热图功能拥有与实际上最好工具抗衡的能力。例如,它的热图能够表现出那些复杂的互动关系,比如JavaScript,多层级的菜单系统,或是激活输入框的点击——页面上所有元素的互动,都可以被追踪到,并且以合适的方式表示出来,例如我的博客的搜索框,还有右侧的“订阅到鲜果”都是特殊元素互动,前者是输入框,后者是我的网站利用JavaScript的外部引用,这个工具仍然能够记录相应的点击数量。

home_screen

  不过,这个只是Miapex热图强悍功能的一部分。另外一个让我非常有感的功能是,这个工具带有非常容易实现的热图细分对比功能。这个功能很有作用,例如,我想比较不同流量来源的用户在页面上的互动情况,立即就可以在同一个报告页面上展示出来。在下图中,默认状态下,报告页面显示的是点击热图和注意力热图。

homepage_2

图:默认热图:点击图和注意力图

  但如果你要作上面我所说的比较,点击“比较”按钮之后,两个图随即变成你要比较的细分之后的热图。下图左图是直接流量的点击热图,而右边则是搜索引擎流量的点击热图。

heatmap_compare

图:不同流量来源的热图对比

  另一方面,这个工具也为移动设备做了优化。移动设备的竖屏热图和横屏热图被分别捕捉下来。

portrait_landscape

图:mobile横向阅读和纵向阅读时候的热图也能够自动区分开来

  热图的另外一些功能——例如一个页面上不同链接用了一个URL的情况,也是可以自动区分开的。另外据说热图的点击还原报告采用了自动校准系统,以充分消除不同浏览器分辨率造成的点击定位不准确的问题。

  该工具还体现了非常多的用心的细节,包括帮助同一个页面不同尾参的情况下,选择保留尾参或者去掉尾参进行合并的功能等,这些都是为了尽最大可能,让不熟悉技术配置的市场人员能够轻松驾驭。

  在以用户为中心的分析上这个工具也不遗余力,下图展示了一些细节——不同用户的生命周期内的行为以及各种类别人群(VIP客户,活跃顾客,一般顾客及潜在顾客)的典型特征,以及这些类别人群的典型行为及来源。在这个功能中,流量多少不再是核心,相反,用户的行为、特征以及生命周期表现成为核心度量,供广告主判断它的用户(客户)的属性。

usercenter

  尽管这个工具没有在国内推广,但在美国已经有相当不错的口碑,而在日本则以PTEngine这个品牌攻城略地,据说已经是日本市场上最大的移动web监测工具提供商。完全可以称得上是中国人的骄傲。

工具二:Ghostery

  Ghostery跟我上面讲的Miapex并不是一类工具,它的商业模式和功能不是分析工具,而是服务于监测实施。它属于我前面说的去技术化的工具。

  Ghostery的功能很简单,他们自己是这样介绍的:

  “当今的网站,没有几家不放几个第三方监测代码在其上做各种事情的。这些代码有的做监测,有的帮助做广告,有的做营销(例如实现retargetting),有的做widgets……,有些网站有放了超过十种甚至几十种别人的监测代码,这些代码偷偷记录我们的行为数据,而普通网站访问者根本无从得知。”

  看看下面的梅西百货的网站,就用了十多种各种第三方监测。

macy's

  “我们要改变这个状况,让你自己拥有决定哪些第三方监测可以‘监视’你,哪些不能‘监视’你的权力。”

  “Ghostery”实际上是一个插件,用了它之后,你可以自己决定让网站中的哪些第三方监测生效,哪些失效。方法很简单,在Ghostery帮你列出来的所有第三方监测中,关闭你不喜欢的即可。他声称帮助用户管理和控制自己的隐私。这个提法深受欢迎。

ghostery

  Ghostery的另外一个作用,是帮网站主了解自己的网站到底被多少监测软件占领了,并且可以迅速排查哪些有用,哪些早已不应该存在在页面上。

  不过,Ghostery并不仅仅只是这点功能,它实际上想要做的商业模式是2B的。由于超过数十万用户使用这个工具,他们成功的让自己成为了一个安装广泛的toolbar。现在,浏览器上有了它的toolbar,于是这个公司开始为企业提供这些公司网站在客户端的表现情况,而且还能够捕捉到很多的用户的数据。这个想法真是有够绝的。看起来跟我们国家的360杀毒一脉相承,杀毒不是目的,搞到数据和流量才是目的。

  记住这家企业:Ghostery,国内完全可以快速翻版。

via:http://www.chinawebanalytics.cn/emetrics-summit-review/

]]>
//www.otias-ub.com/archives/231698.html/feed 1
苹果收购移动应用分析工具开发商Burstly //www.otias-ub.com/archives/196989.html Sat, 22 Feb 2014 15:18:09 +0000 //www.otias-ub.com/?p=196989
苹果收购移动应用分析工具开发商Burstly

 

苹果周五证实,该公司已收购了为应用开发者提供分析工具的创新公司Burstly。

Burstly拥有一个名为TestFlight的智能应用测试平台,颇受iOS开发者的欢迎。TestFlight允许开发者在将新应用在苹果App Store正式发布前,面向少数几批用户进行测试。这家总部位于加利福尼亚州圣塔莫尼卡的创新公司,还推出了一款帮助开发者能够从广告中赚钱的工具。科技博客TechCrunch最先报道了苹果收购Burstly的消息,随后苹果发言人克里斯丁·休格特(Kristin Huguet)对此消息予以证实。

苹果目前仍在坚持其收购小型创新企业的战略,从创办至今,这家公司一直倾向于收购拥有强势工程背景的小型公司。苹果还没有完成一笔总金额超过10亿美元的交易。苹果进行收购,目的是为了增强现有服务或未来的产品。2012年,苹果收购了指纹安全公司AuthenTec,后者的技术随后被加入到了iPhone 5S当中。苹果此前收购了数家导航公司,目的是为了改进自己的地图服务。

苹果首席执行官蒂姆·库克(Tim Cook)此前已表示,该公司并不会忌惮完成一笔大型收购交易,之前也曾审视过一些大型公司,但交易必须符合苹果的战略。

不过与苹果的做法不同,谷歌、Facebook等互联网巨头当前却在进行数十亿、甚至上百亿美元的并购交易。Facebook在本周就宣布,将斥资190亿美元收购移动应用公司WhatsApp。上月,谷歌斥资32亿美元收购了智能家居公司Nest Labs。

苹果股价周五在纳斯达克证券市场常规交易中下跌5.90美元,跌幅为1.11%,报收于525.25美元。在随后的盘后交易中,苹果股价再跌0.26美元,跌幅为0.05%,报收于524.99美元。过去52周,苹果最低股价为385.10美元,最高股价为575.14美元。

]]>
Immersion:麻省理工的邮件元数据挖掘分析工具 //www.otias-ub.com/archives/130353.html Mon, 08 Jul 2013 10:55:37 +0000 //www.otias-ub.com/?p=130353

Immersion只分析邮件的发件人/收件人(包括抄送人)和时间戳,避开了”主题”栏和邮件正文。

不过,Immersion挖掘出的最终结果依然令人印象深刻。你所联络过的任意人员名单,实际上都有着逻辑方面的联系。

作为Immersion的幕后创作者之一,César Hidalgo向《波士顿环球报》表示:”所有数据都是有关’人’的。撇开了人际关系,数据基本上就失去了任何意义”。

需要重申的是,若想体验一回Immersion的分析结果,你需要授权MIT访问你的Google账户。

[编译自:TheVerge , 来源:Immersion]

]]>
法国计算与自由委员会:研究显示手机应用获取超量隐私数据 //www.otias-ub.com/archives/105040.html Wed, 10 Apr 2013 11:53:47 +0000 //www.otias-ub.com/?p=105040

2013年4月10日午间消息,法国计算与自由委员会(以下简称“CNIL”)的最新研究报告发现,手机应用并未严格遵守规定,即使是在没有必要的情况下,也经常获取用户的隐私数据,并将其传送到远程服务器中,而用户却缺乏足够的工具来监控这一过程。

  收集数据

CNIL在6部iPhone上安装了法国计算机科学研究和控制学会(以下简称“INRIA”)开发的监控软件和分析工具,对189款应用的行为进行了研究。CNIL主席伊莎贝尔·法尔奎-佩隆迪(Isabelle Falque-Pierrotin)周二表示,此次研究的目标是更好地理解应用究竟会以何种方式使用隐私数据,并不针对任何特定的开发者。

CNIL并未在实验室环境中测试应用,而是在实际使用过程中展开研究:他们要求6名志愿者在手机中插入自己的SIM卡,然后在去年10月中旬至今年1月中旬间按照自己的意愿使用手机。其中一名志愿者下载了将近100款应用,另外一名只下载了5款。

这些应用中,有1/12会访问用户的通讯录,大约有1/3会获取用户的定位信息。此次研究过程中,用户平均每天会被追踪76次地理位置。签到应用Foursquare和苹果自己的地图应用对地理信息的追踪最为频繁。但考虑到这两款应用的目的,这一结果完全可以理解。位居其次的则是本地搜索应用AroundMe和苹果的摄像头应用。

还有1/6的应用访问过iPhone的名称。此举令研究人员大为不解,因为这类信息几乎没有任何意义,而且也无法当做设备的唯一标示符使用。不过,这类内容中通常会包含用户的名字,因此同样被视为个人身份信息。

Facebook应用很少访问这类隐私信息。不过,研究人员表示,这主要是因为Facebook没有必要获取这类信息,因为用户此前已经将各种信息都登记在该服务中。

此次研究中被应用访问次数最多的是iPhone的UDID,也就是与手机永久关联的串号。大约有半数应用访问过这一数据,其中有1/3会以未加密的方式通过互联网发送该信息。有一款报纸应用在研究期间访问过UDID 1989次,向起发行商发送过614次。

  应对措施

CNIL发言人展示了一款设置工具,可以限制应用对各类信息的访问权限。苹果尚未收到这款工具,但INRIA表示,如果该公司感兴趣,他们可以为其提供代码。

iPhone用户几乎无法了解他们的应用会访问哪些信息或系统功能,而Google Play商店虽然可以展示这类数据,但只能选择接受或不接受,无法进行调整。旧版黑莓操作系统允许用户自由选择允许一款应用使用的API(应用编程接口),但却有可能导致应用崩溃。在黑莓10中,只能针对原生应用进行细致调整,如果是从Android平台移植来的应用,同样只能选择接受或不接受。

苹果已经采取了一些措施,为用户提供更大的控制权。在iOS 5中,用户可以单独阻止特定应用获取自己的地理位置。iOS 6又新增了一个选项,禁止开发者使用UDID确定用户身份并发送定向广告。

苹果在iOS 6中为开发者提供了广告标识符(Advertising Identifier)帮助其投放广告。但这种标识符不会与手机或个人永久关联,用户可以自行更改设置。

不过,本次研究中并未使用这一选项,出于技术原因,他们本次使用的系统为iOS 5。下一阶段的研究则会使用iOS 6。INRIA已经升级了监控工具,以适应这款新的操作系统。

为了监控应用对隐私信息的访问情况,INRIA对iPhone进行了越狱,并安装了特殊的应用来拦截应用获取隐私信息时使用的API。研究人员此次之所以选择iPhone,是因为他们对iOS的开发已经非常熟悉,但目前也在为Android手机开发类似的功能。

INRIA和CNIL刚刚对此次研究中的数据展开了初步研究:他们此间共收集到9GB的数据,涵盖700万次隐私事件。

不过,某些隐私数据获取行为只是意外。例如,有一款应用在寻找附近的游泳池时获取了超出必要水平的数据。但CNIL的研究人员表示,这一问题显然源于程序故障。

]]>
Hiptype:让出版商更懂读者的大数据分析工具 //www.otias-ub.com/archives/61748.html Tue, 07 Aug 2012 09:12:33 +0000 //www.otias-ub.com/?p=61748 Hiptype:让出版商更懂读者的大数据分析工具

Hiptype:让出版商更懂读者的大数据分析工具

  电子书以其便捷、廉价、跨平台的特性,正越来越受到各方青睐。目前,几乎所有的收费电子书都会提供部分章节让读者试读,然后决定是否购买。这样一来,出版商需要弄清楚人们读到了哪里,读完后有没有购买,以及其他各种体验,才能卖出更多电子书。美国创业公司Hiptype开发了一套电子书阅读分析工具,试图解决这一难题。

Hiptype自称“面向电子书的Google Analytics”,能够提供与电子书有关的丰富数据。它不仅能统计电子书的试读和购买次数,还能绘制出“读者图谱”,包括用户的年龄、收入和地理位置等。此外,它还能告诉出版商读者在看完免费章节后是否进行了购买,有多少读者看完了整本书,以及读者平均看了多少页,读者最喜欢从哪个章节开始看,又在哪个章节半途而废,等等。

Hiptype能够部署在支持HTML5技术的任何设备上,但不支持亚马逊(微博)Kindle等电子书阅读器。它的两位创始人,CEO詹姆斯·列维(James Levy)和CTO苏海尔·帕拉萨德(Sohail Prasad)表示,传统的电子书商店只能提供销量等最基本的数据,出版商如果想要了解更多信息,只能选择那些提供分析服务的特定商店。相比之下,Hiptype能够与电子书整合在一起,出版商无论选择哪种渠道,总是能够获得用户数据。

那么,这样做会不会侵犯用户隐私?列维表示,Hiptype收集的所有数据都是匿名的。用户在下载了内置Hiptype服务的电子书时,会得到一个提示,可以选择将其屏蔽。

列维认为,电子书出版商需要向热门网站学习,利用大数据变得更加灵巧。例如,出版商可以先把电子书发放给一小群读者,收集他们的阅读数据,据此调整出版策略。这些数据还可以被用于精准广告营销,就像Facebook所做的那样。

据他透露,Hiptype已经在与大型出版商、作家以及一家“杰出的自助出版服务”合作。他说:“我们相信,数据将拯救书籍出版业”。

]]>
KDNuggets:数据挖掘/分析工具”的调查:R以30.7%的得票率荣登榜首 //www.otias-ub.com/archives/51586.html //www.otias-ub.com/archives/51586.html#comments Sun, 17 Jun 2012 06:59:40 +0000 //www.otias-ub.com/?p=51586 Rlogo

自从60年代主机进入学术界和企业界,统计分析就是人们熟知的应用之一。而统计领域广泛使用的R语言是诞生于 1980年左右的 S 语言的一个分支。 R是S语言的一种实现。S语言是由 AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。

最初S语言的实现版本主要是S-PLUS。但S-PLUS是一个商业软件,相比之下开源的R语言更受欢迎,被人们誉为“统计界的Red Hat”。

今天,随着信息系统正面临大数据的爆炸式增长,大数据分析需求随之水涨船高,在这股大数据热潮中,开源软件取代商业软件成为舞台的明星,受到人们追捧。2012年,R语言在数据挖掘/分析和可视化应用领域的快速崛起标志着R已经为大数据做好准备。

在KDNuggets2012年做的“过去与十二个月你在实际项目中使用的数据挖掘/分析工具”的调查中,R以30.7%的得票率荣登榜首,超过微软Excel(29.8%)和Rapidminer(2010和2011年排名第一)。值得注意的是,今年排名前五名的数据挖掘工具中有四个是开源软件。此外R还在击败SQL和Java,在最受欢迎的数据挖掘应用编程语言排行榜中排名第一。

大数据分析工具排行榜

今天每个人都喜欢R,尤其是那些销售数据仓库和Hadoop大数据产品的厂商。无疑,开源是R语言大获成功的一个重要原因,R语言的开发得到了来自统计师和量化分析师社区的大力支持。

字母家谱

R与诞生于主机时代的SAS和SPSS的专有工具不同,类似Linux被称为Unix的开源版本,R语言大量借用了S语言的方法。

1976年John Chambers在贝尔实验室开发的S语言是为了替代昂贵的SPSS和SAS工具。如果说S是VAX和Unix小型机时代的产物,那么R则是PC和Linux时代的产物。

1996年新西兰奥克兰大学的两位统计学教授——Ross Ihaka和Robert Gentleman发明了R语言,这两位教授也是R开发团队的核心成员,值得注意的是S语言的发明者John Cambers也是R开发团队的成员,因为不难理解R语言的一些数据处理路径与S语言相同。

R可以看做是S的一种实现,Insightful公司开发的S-PLUS也是S的实现版本,2004年Insightful把S-PLUS授权给了朗讯科技,后来又被Tibco软件于2008年收购。

革命来临

与S和S-PLUS不同的是,R并不是象牙塔里炮制出的代码,而是一个由分析师和程序员构成的社区的产物,这个社区为处理各种数据集创建了超过2500个插件。

今天,根据Revolution Analytics的统计,R被全球超过200万个量化分析师采用。Revolution Analytics成立于2007年,并开发出了R的并行实现,该公司采用了开放内核的方式开发R,为开源软件包退工商业支持,同时扩展R环境,提升其在计算机集群上的表现,并将其与Hadoop集群对接。

迄今还没有公司将SPSS(2009年被IBM收购)的开源替代品PSPP商业化,但等PSPP进一步成熟,商业化是迟早的事。

2008年,在拿到英特尔资本的种子投资后,Revolution Analytics开始在R企业版中加入闭源扩展,该做法遭到了R社区的反对。从那以后,Revolution Analytics并行开发了R统计引擎,使之能更好地支持多核多线程处理器和服务器集群;增加了一个类NoSQL的格式——XDF,并增加了对原生SAS文件格式(以及向XDF格式的转换)的支持。

最近,Revolution Analytics进一步改良R的实现,使每个Hadoop集群的节点都能在本地运行R分析功能处理HDFS系统中的数据,并将计算结果汇总,这有些类似MapReduce对非结构化数据的操作。

平行宇宙

为了在与数据仓库领域竞争对手的角逐中占据上风,Netezza于2010年2月开源了Netezza软件栈。

Netezza是数据仓库一体机的制造商,基于高度定制化和并行化的PostgreSQL数据库。使用FPGA来提升其在x86集群上的性能表现。

Netezza开放了其软件开发环境,通过一组API允许SAS和R算法并行运行于其数据仓库一体机上。同时还为Java、C++、Fortan和Python等程序提供访问其数据仓库的接口。此外,Netezza通过FPGA,而不是SQL数据查询语言来提取数据仓库中的数据。

在Netezza开源7个月后,随着大数据商机的逐渐显现,IBM以17亿美元的高价收购了Netezza。

2010年10月,数据仓库厂商Teradata在其数据仓库产品中增加了数据库内分析组件——TeradataR。这相当于把Teradata的数据仓库挖掘工具变成了R控制台的一个插件,这意味着通过R程序能够调用Teradata数据库里的44种不同的分析功能。

Teradata拥抱R的方式是保留R控制台,在数据库中并行运行分析,而不是将数据提取到一个工作站然后在本地运行R。

Oracle加入

在R化的热潮中,连Oracle都不能免俗。今年二月,Oracle发布了高级分析(Advanced Analytics),为Oracle数据库和R分析引擎之间架起了桥梁。

Advanced Analytics是Oracle 11g R2 数据库的数据挖掘附件。当R程序员准备运行一个统计路径,他们可以在数据挖掘工具箱中调用与SQL等同的功能命令,来使用Oracle数据库。

如果没有对应的SQL功能,植入在各数据库节点的R引擎将运行R路径,汇总分析数据并作为答案返回到R控制台。

Oracle还为其大数据一体机发布了R Connector for Hadoop,是Cloudera CDH3 Hadoop环境的一个版本,运行在Oracle的Exa系列的x86集群中。该连接器允许R控制台与Oracle大数据一体机上的Hadoop的HDFS文件系统和NoSQL数据库对话。

 文章来自IT经理网

]]>
//www.otias-ub.com/archives/51586.html/feed 2