可视化 – 庄闲棋牌官网官方版 -199IT //www.otias-ub.com 发现数据的价值-199IT Sat, 11 Mar 2023 11:53:54 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.4.2 埃森哲报告:可视化范围3排放之供应链 //www.otias-ub.com/archives/1543651.html Sat, 11 Mar 2023 20:00:26 +0000 //www.otias-ub.com/?p=1543651 埃森哲发布了新报告“可视化范围3排放之供应链”。为了在 2050 年之前实现净零排放目标,公司需要对其供应商群体进行全面了解。但是,由于供应链中近2/3的范围 3排放来自供应商,因此这种可见性受到了挑战。

范围1碳排放(Scope 1)是指企业直接产生的碳排放;范围2碳排放(Scope 2)指企业见解产生的碳排放;范围3碳排放(Scope 3)要将看似与企业本身无关的碳排放都必须计入在内,包括其价值链的上游和下游。

随着对核心业务中嵌入的上游范围 3 排放和碳情报的可见性的提高,公司可以就如何以及在何处分配资源做出更明智的决策; 确保整个企业负责任的采购,以推动有意义的减排。通过创建更高效、更有弹性、更具成本效益和以客户为中心的供应链网络,发掘更广泛的企业价值。该报告建议所有公司现在可以采取五项关键行动来实现这一点:

1、进行真正的多层次排放热点分析以设定目标并推动正确的行动。此类分析的见解为解决影响最重大领域的行动计划奠定了基础。

2、将可持续性纳入品类规划和供应商选择。根据确定的热点区域,公司可以定制类别计划,包括减排策略,以酌情解决热点问题。

3、将排放纳入供应链控制塔并实施数字孪生。集中可见性和决策制定并指导行动的控制塔与供应链的数字双胞胎相结合,可产生优化服务、成本、质量和服务的供应链网络所需的端到端可见性。

4、支持供应商正在进行的脱碳工作。细分供应商群可以帮助公司适当地定制参与计划,提高供应商数据质量。

5、跨部门合作,与同行、供应商和生态系统合作伙伴合作,以加速大规模脱碳。聚合来自多方的数据并就最有效的脱碳步骤提出建议的智能平台解决方案至关重要。


]]>
图像识别的可视化解释史 //www.otias-ub.com/archives/1220239.html Sun, 21 Mar 2021 16:22:24 +0000 //www.otias-ub.com/?p=1220239 过去11年中用于解释神经网络的最新方法是如何发展的呢?
本文在 Inception 网络图像分类器上尝试使用引导反向传播进行解释演示。
        
   为什么「解释」很重要?
使用机器学习(ML)算法(尤其是现代深度学习)进行图像识别的最大挑战之一,是难以理解为什么一个特定的输入图像会产生它所预测的结果。
 
ML模型的用户通常想了解图像的哪些部分是预测中的重要因素。这些说明或“解释”之所以有价值,有很多原因:
 
  • 机器学习开发人员可以分析调试模型的解释,识别偏差,并预测模型是否可能推广到新的图像
 
  • 如果提供了为何做出特定预测的解释,则机器学习模型的用户可能会更信任模型
 
  • 像 GDPR 这样围绕机器学习的规则要求一些算法决策能够用人类的术语来解释
 
因此,至少从2009年开始,研究人员就开发了许多不同的方法来打开深度学习的“黑匣子”,从而使基础模型更容易解释。
 
下面,我们为过去十年中最先进的图像解释技术整合了视觉界面,并对每种技术进行了简要描述。
 
我们使用了许多很棒的库,但是特别依赖 Gradio 来创建你在下面的 gif 文件和 PAIR-code 的 TensorFlow 实现中看到的接口。
 
用于所有接口的模型是Inception Net图像分类器,可以在此jupyter笔记本和Colab上找到复制此博客文章的完整代码。
 
在我们深入研究论文之前,让我们先从一个非常基本的算法开始。
   七种不同的解释方法
Leave-one-out (LOO) 
              
Leave-one-out (LOO) 是最容易理解的方法之一。如果你想了解图像的哪个部分负责预测,这可能会是你想到的第一个算法。
 
其思想是首先将输入图像分割成一组较小的区域,然后,运行多个预测,每次都屏蔽一个区域。根据每个区域的「被屏蔽」对输出的影响程度,为每个区域分配一个重要性分数。这些分数是对哪个区域最负责预测的量化。
 
这种方法很慢,因为它依赖于运行模型的许多迭代,但是它可以生成非常准确和有用的结果。上面是杜宾狗的图片示例。
 
LOO是Gradio库中的默认解释技术,完全不需要访问模型的内部——这是一个很大的优点。
 
Vanilla Gradient Ascent [2009 and 2013]
       
Paper: Visualizing Higher-Layer Features of a Deep Network [2009]
Paper: Visualizing Image Classification Models and Saliency Maps [2013]
 
这两篇论文的相似之处在于,它们都通过使用梯度上升来探索神经网络的内部。换句话说,它们认为对输入或激活的微小更改将增加预测类别的可能性。
 
第一篇论文将其应用于激活,作者报告说,「有可能找到对高级特征的良好定性解释, 我们证明,也许是违反直觉的,但这种解释在单位水平上是可能的,它很容易实现,并且各种技术的结果是一致的。」
 
第二种方法也采用梯度上升,但是直接对输入图像的像素点进行探测,而不是激活。
 
作者的方法「计算特定于给定图像和类的类显着性图,这样的地图可以使用分类ConvNets用于弱监督的对象分割。」
 
Guided Back-Propogation [2014]
       
Paper: Striving for Simplicity: The All Convolutional Net [2014]
 
本文提出了一种新的完全由卷积层构成的神经网络。由于以前的解释方法不适用于他们的网络,因此他们引入了引导式反向传播。
 
该反向传播可在进行标准梯度上升时过滤掉传播时产生的负激活。作者称,他们的方法「可以应用于更广泛的网络结构。」
 
Grad-CAM [2016]
        
Paper: Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization [2016]
 
接下来是梯度加权类激活映射(gradient-weighted class activation mapping,Grad-CAM) 。它利用「任何目标概念的梯度,流入最后的卷积层,生成一个粗糙的定位映射,突出图像中的重要区域,以预测概念。」
 
该方法的主要优点是进一步推广了可以解释的神经网络类(如分类网络、字幕和可视化问答(VQA)模型) ,以及一个很好的后处理步骤,围绕图像中的关键对象对解释进行集中和定位。
 
SmoothGrad [2017]
       
Paper: SmoothGrad: removing noise by adding noise [2017]
 
像前面的论文一样,此方法从计算类评分函数相对于输入图像的梯度开始。
 
但是,SmoothGrad通过在输入图像中添加噪声,然后针对图像的这些扰动版本中的每一个来计算梯度,从而在视觉上锐化这些基于梯度的灵敏度图。将灵敏度图平均在一起可以得到更清晰的结果。
 
Integrated Gradients [2017]
       
Paper: Axiomatic Attribution for Deep Networks [2017]
 
不同于以往的论文,本文的作者从解释的理论基础入手。它们「确定了归因方法应该满足的两个基本公理——敏感性和实现不变性」。
 
他们用这些原理来指导设计一种新的归属方法(称为综合梯度),该方法可以产生高质量的解释,同时仍然只需要访问模型的梯度; 但是它添加了一个「基线」超参数,这可能影响结果的质量。
 
Blur Integrated Gradients [2020]
        
Paper: Attribution in Scale and Space [2020]
 
论文研究了一个最新技术—- 这种方法被提出来用于解决具体的问题,包括消除「基线」参数,移除某些在解释中倾向于出现的视觉伪影。
 
此外,它还「在尺度/频率维度上产生分数」,本质上提供了图像中重要物体的尺度感。
 
下面这张图比较了所有这些方法:
        
]]>
ICML:2019论文接收结果可视化 //www.otias-ub.com/archives/874555.html Sun, 12 May 2019 14:16:39 +0000 //www.otias-ub.com/?p=874555
ICML 2019(国际机器学习)大会将于6月9日至15日在美国加州举办。大会共收到3424篇论文投稿,其中774篇被接收(接收率为22.6%)。近日,博世的分析人员根据接收论文列表做出了一份可视化图表,从中可以看出各机构和作者的论文贡献情况。

接收论文列表:https://icml.cc/Conferences/2019/AcceptedPapersInitial

排名前50的论文贡献机构

下图显示了ICML 2019接收论文贡献排名前50的机构。排名以机构贡献的论文总数为准,至少有一名作者隶属于该机构,因此一篇论文可能出现在多个机构中。红色和绿色分别表示每个机构的一作论文和最后作者论文数量。

从属于同一个机构的作者已自动合并。如Google Inc.、Google AI、Google UK都归为Google。

ICML 2019接收论文贡献数排名前50的机构(学界机构和业界机构)

由上图可以看出,在排名前十的机构中,学界和业界机构几乎平分秋色,但谷歌的论文贡献量遥遥领先于第二名MIT,被接收论文数达到了80余篇

如果将业界和学术界分开来看,我们可以得到另外两张图。

ICML 2019接收论文贡献数排名前50的学界机构。

上图显示,在众多高校和科研院所中,MIT的论文贡献量最大,达到40余篇,其次是加州大学伯克利分校和斯坦福。国内上榜的院校包括清华大学、北京大学、南京大学、香港中文大学。

ICML 2019接收论文贡献数排名前50的业界机构。

上图显示,谷歌、微软、Facebook等机构在本届ICML大会中表现最为强势。国内上榜的机构包括腾讯、阿里巴巴、华为、百度等。

尽管谷歌、微软、IBM等业界巨头贡献了很大一部分论文,但ICML 2019仍然是一场学术会议。统计后可以发现:

  • 纯学术研究论文有452篇(58.4%);
  • 仅有60篇论文纯粹是由业界研究机构完成的;
  • 既包含业界也包含学界作者的论文有262篇(33.9%)。

计算相对贡献(即每篇论文的业界/学界附属机构数量除以总附属机构数量)也可以得到类似的数字。总结学界和业界对所有论文的相对贡献可以得到:

  • 学界机构的贡献占77%;
  • 业界机构的贡献占23%。

ICML 2019大神作者

那么哪些作者发ICML 2019大会Paper最多呢?果然,UC Berkley的机器学习泰斗Michael Jordan获得了第一。其中Jordan署名最多的还是最后一位,因此作为一位成功的「老板」,Jordan也是桃李满天下了,北大张志华、斯坦福吴恩达教授、Petuum 创始人邢波等大牛都出自其门下。

下图展示了ICML 2019论文总数排名前100的大神作者,统计会区分独立作者、一作和最后作者等。Michael Jordan因为有7篇ICML 2019接收论文而位列第一,EPFL的Volkan Cevher和UC Berkley的Sergey Levine紧随其后,他们每人都有6篇接收论文。

国内也有很多研究者取得了很好的成果,例如清华大学的朱军、微软亚研的刘铁岩、清华大学龙明盛等研究者都在ICML 2019发表了4篇论文。

令人印象深刻的是,很多研究者拥有两篇或两篇以上的一作(或单个作者)论文。例如谷歌的Ashok Cutkosky的三篇研究分别为独立作者、一作和一般作者,而CMU的Simon Du更是有3篇一作。下图展示了作为一作或独立作者的大神们:

因为最后的作者基本上都是「老板」,所以根据最后作者进行排序可以看出来该领域的一些资深研究者。他们一般都在非常优秀的实验室或研究团队,因此能做出更多的研究成果。

ICML 2019论文贡献哪家强

最后,我们可以按照相对共享对这些顶级科研机构排序,即一篇论文中到底有多少作者是该研究机构的。具体而言,项目作者用署名该机构的作者数除以总的作者数,从而计算该机构的相对贡献。

从下图可以看出来,谷歌、斯坦福、UC Berkley等都名列前茅,而清华、北大和南大也都榜上有名。

最后,作者表示,清理网站数据,尤其是附属机构的一些数据是一个冗长的手动过程。因为中间会有很多不同的、不明确的机构表示方法,也会有很多缩写表示方法,所以只能手动完成。项目作者已经尽可能合并从属关系的机构,但是中间还是可能有一些误差,因此单篇论文有可能没有统计到研究机构。

所以,如果读者发现中间的统计信息有什么误差,欢迎在下面留言指出。

参考链接:https://www.reddit.com/r/MachineLearning/comments/bn82ze/n_icml_2019_accepted_paper_stats/

本文为机器之心

]]>
顶尖调查记者的数据处理与可视化利器推荐 //www.otias-ub.com/archives/523890.html Sat, 08 Oct 2016 06:38:05 +0000 //www.otias-ub.com/?p=523890 如今,各式各样的网络工具能够帮助记者更高效地制作有影响力的数据新闻。在上周刚结束的第二届亚洲深度报道大会上,全球顶尖调查记者与调查报道专家分享了他们在工作中用到的工具和技巧,从数据挖掘、数据清洗到可视化呈现一应俱全。以下由深度君为你整理。


电子表单

虽然现在市场上有很多优秀的数据处理工具,但是Excel依然是公认最适合初学者的数据处理利器。Excel 软件中的电子表单能够有效地对数据进行结构化整理和分析。OpenNewsSandhya Kambhampati 与大家分享了她在使用Excel时的一些经验和心得,点击查看她的展示,并开始属于你自己的数据探索之旅吧。(OpenNews 是由Knight基金会Mozilla联合支持的一个项目,旨在建立一个包括开发者、设计师,以及数据记者的社群,在开放的网络环境中帮助新闻事业的发展。)

数据抓取

1475908567-8927-import.io-如果在做选题时,遇到网页上有大量非电子表格形式的数据信息,又该如何处理呢?来自丹麦的记者 Nils Mulvad 说,这时你就需要 Import.io 工具来帮你抓取数据。它能够节省你的时间,把你从重复的劳动中解放出来。

数据清洗

有时你遇到的数据可能是非常杂乱的,不过不用担心, OpenRefine 能够有效帮助你清洗、结构化数据,完善数据集。更重要的是,它还是开源的哦。点击查看 Nils Mulvad 的展示,手把手教你使用这款工具。

数据库管理

你准备好和大数据打交道了么?如何处理GB、TB规模的数据集?如何进行更快捷、更综合的数据分析?来自 Vox 的开发人员 Kavya Sukumar 告诉你,这就需要数据库管理的技能了。点击查看她分享的内容吧。

网络搜索

互联网上有大量良莠不齐的信息,我们如今需要更可靠的方法去检索验证,才能避免被信息误导。路透社记者 Irene Liu 与大家分享了网络报道所需的信息核实工具和方法,包括逆向图片搜索,地理位置核实、社交网络检测等等。点击查看关于网络搜索的更多精彩内容吧。

绘制地图

1475908575-6066-ArcGIS间分析能够帮助记者发掘出数据中潜藏的故事线索,地图绘制则能有效地呈现数据。纽约时报记者 Andy Lehren就经常使用美国环境系统研究所公司(ESRI)开发的工具ArcGIS 进行空间分析和地图绘制。点击查看他在大会上的展示,循序渐进地教你地图绘制。

数据可视化

如果你想用酷炫的设计图表来展示你的数据,但是团队中又缺乏一位工程师或设计师,怎么办呢?没关系,印度最大的财经类门户网站MoneyControl 的数据与社交媒体编辑 Sanjit Oberai ,整理了一份数据可视化工具表单,这些工具操作简单,效果拔群。点击查看他的分享吧。

来自:全球深度报道网

编译/程一祥

编辑/Ivan Zhai,梁思然

]]>
Marketsandmarkets:预计2020年全球可视化和3D渲染软件市场规模达16亿美元 //www.otias-ub.com/archives/485497.html Sat, 18 Jun 2016 15:04:44 +0000 //www.otias-ub.com/?p=485497 市场研究咨询公司Marketsandmarkets2016年3月发布《可视化和3D渲染软件市场调研报告》,报告指出,2015年全球可视化和3D渲染软件市场规模为43110万美元,预计2020年市场规模将达160230万美元,复合年增长率为30.03%。市场的主要增长动力来自于较低的成本、恰到时机的营销以及3D技术和显示设备较短的研发时间。 从区域市场来看,未来五年,北美地区的可视化和3D渲染软件市场规模预计将继续独占鳌头,紧随其后的为欧洲。而加拿大和美国则专注于研发创新和技术。亚太地区预计将成为可视化和3D渲染软件市场中增速最快的地区,这主要得益于企业日益增强的意识。许多亚太地区国家,如中国、印度、日本、新加坡和韩国正大力投资于具有成本效益的3D渲染软件解决方案和服务。

1466262239-2581-7fc000248cbfb52981a

]]>
城市相似性的可视化:美国和冰岛竟如此相似 //www.otias-ub.com/archives/443976.html Thu, 03 Mar 2016 14:57:36 +0000 //www.otias-ub.com/?p=443976 作者:Karim Heredia

这篇博文揭示了如何找到城市相似性的另一种方法。认真阅读之后,你就会明白为什么我会觉得麦迪逊(美国城市)和雷克雅未克(冰岛首都)竟会是两个非常相似的城市了。

1457016979-2838-ntro-sammon-voronoi-1024x673

Teleport Cities这个应用让你能够对世界上任何一个有趣的城市进行研究,并且你可以使用它所提供的一个复杂而又精细的评分系统来对这些城市进行比较和对比。

举个栗子,当想要研究圣地亚哥(智利首都)时,以下就是你将会在Teleport Cities应用中看到的页面:

1457016981-2636-Shot-2016-02-23-at-01.01.04

圣地亚哥的Teleport评分

 

每一项评分的都是由数据科学家们经过周详考虑而得出的结论,这些细致全面的评分能够帮助我们对Teleport Cities应用中所包含的134个城市进行排名。而且,这些评分并不是绝对的,而是相对于应用中其他的城市。

那么这个时候问题就来了,我们怎么来比较完全不同的两个城市呢?在Teleport Cities中,我们主要用两种办法解决这个问题。第一,摆在一起,让你逐项对比两个城市。举例说明,如果想要对比圣地亚哥和奥斯陆(挪威首都),就会像这样:

1457016981-2212-6-02-24-at-15.44.38-1024x403

圣地亚哥和奥斯陆的各项对比

另一种方法则是在登录,修改个人设置后对所有城市进行评分和排名。我们能够对每个城市进行评分,并且以排名先后的顺序进行展示。这些就是你眼中能够看到的世界:

1457016979-5911-16-02-24-at-15.07.44-288x300

Teleport Cities中城市排行榜(部分)

但是,有个小小的问题,就是各项评分总和的对比。如果两个城市的总评分都为75分,就能够表示它们很相似吗?我可以举一个很简单的反例来说明,单纯的一个评分是不足以完整的表现各城市的相似性的。假如我们只对两个项目进行评分:通勤和安全。A城市通勤方面得50分而安全方面的25分,B城市通勤方面得25分而安全方面的50分。总分都是75,但很明显两个城市并不那么相似。根据我所给出的例子,你可以一举一反三到我们实际所有的评分项中来(对所有公共用户,我们提供15个评分项目,注册用户则提供20项)。

相似性的度量

我们很幸运的拥有很多数学计算方法能够预估两个数据集之间的距离。其中最知名的一种方法就是欧式距离(Euclidean Distance)。你很有可能就使用过这种方法,因为它最简单的变形式被用来计算三角形的斜边长度(还记得勾股定理吗?)。

两点间的欧式距离能够在任何维度下进行计算。我们可以将Teleport Cities中每一个评分项目当做一个维度。在公共用户的视角下,我们可以有15个单一维度。公式非常简单:计算任意两个维度的差的平方,然后在每一个项目上重复这一步骤,把所有的结果相加,最后取总和的平方根。

这样仅仅只给出了一个距离,一个表示两个不同城市之间关系的数字:他们之间是近还是远。最重要的是,现在你能够很清楚的看到,在集合中,任意一个城市与其他城市之间的距离,哪个离它最近,哪个最远。

在二维图表测绘距离

人类能够很轻易地在任意平面上表现二维(或者三维,如果能运用一点点想象力)。但是能够理解、领会三个维度以上,对大多数人来说几乎不可能。这意味着,如果我们想要将任意两城市之间的关系可视化,最好是运用二维的表现形式。

其实有多种减少维度的方法(被称为多维尺度变换或者MDS),让我们可以将15个城市的维度用二维的形式来表现。其中我个人最喜欢的,也在长期应用中经受住了时间的考验的方法被称为Sammon’s Mapping。这种方法是1969年由John W. Sammon发明的。

总的来说,这个算法的作用是:首先取一组随机或预设值的二维数据点,然后在所有的数据点(也就是我们的所有城市)上进行迭代处理。每一次这个算法作出处理(,原本十五维的数据集合中数据点之间的距离和二维数据集合中数据点之间的距离的误差就会减少。当条件满足时,算法运算停止,所得到的结果就能够很轻易地在任意平面上表现出来。数轴的X和Y轴在这些图表中并没有什么意义,但是数据点之间的距离却意义非凡。

以下是我们运用该算法将原本134个城市,15维度的数据以二维图表的形式表现出来的结果。你可以将图表放大,在高分辨率下查看。两个在图表中距离很近的城市,在他们各项目的评分中很有可能非常相似,反之亦然。

                                                                       

下面的部分图表是交互性的。你可以通过点击图像左下角的放大镜图标来放大图像,十字图标来移动图像或者小房子图标来重置图像。

                                                                    

1457016977-9801-1E688AAE59BBE-20160302145712

将Sammon的测绘方法运用到所有134个城市上 

现在,让我们放大图像,用两个图片上距离很近,但是却感觉相差很大的城市作为例子,对结果进行验证:

Sammon测绘图中的麦迪逊与雷克雅末克

1457016979-3312-Shot-2016-02-23-at-19.01.38

如果没错,麦迪逊和雷克雅末克的项目评分应该很相似。我们把Teleport Cities中的对比图拿出来验证一下:

1457016981-9657-6-02-23-at-01.59.19-1024x369

麦迪逊与雷克雅末克的对比

虽然项目评分不尽相同,但是两个城市的高分项目都基本一致。当然,结果不尽相同也很自然,不然Sammon的测绘图会将两个城市放在同一个位置上。但谁能够想到威斯康辛和冰岛竟会有相似的地方呢?

用沃罗诺伊镶嵌法来完善Sammon的测绘图

如上所示,Sammon的测绘图很好的将城市的相似性在二维图像中表现了出来。但是每个城市的得分却很难从图中直接看出来。我尝试将城市的得分用点的大小来表现出来,但是我很确定并没有多少人在意这件事情。

沃罗诺伊图是以George Voronoy的名字来命名的。19世纪末,20世纪初,George Voronoy对该镶嵌法的数学基础部分进行研究。然而,这些图像甚至比他自己的研究更古老,甚至还被笛卡尔在1644年运用过。这种方法的原理就是用多边形(或称为cell)围绕着数据点,然后使用用基于距离的启发式运算。

每一个多边形(cell)的颜色都是根据这个城市的分数来拟定的。红色表示低分而绿色就表示高分。为了跟明显的区分每个cell的不同,评分都经过标准化处理来让绿色代表最高分,而红色代表最低。

结论图的构造和之前的图像是一样的:

1457016980-3733-QQE688AAE59BBE20160302145934

Teleport City运用Sammon测绘图和沃罗诺伊图来表现相似度

从上图你可以看出,相似的城市也有明显的分数差异。同样,我们一麦迪逊和雷克雅末克为例,差距是显而易见的。麦迪逊似乎比雷克雅末克略高一筹,但它们俩都比密尔沃基的分数高:

1457016981-6940-Shot-2016-02-23-at-19.02.39

用Sammon测绘图和沃罗诺伊图来表现麦迪逊和雷克雅末克

 

 

城市相似性的自定义可视化

 

上图中的分数都是由Teleport Cities以默认的设置打出的。即使我们经常更新我们的数据,默认分数基本上是稳定不变的。举个栗子来讲,生活成本很高的城市是不会在几天内就能够降低花费的。

但是很有意思的地方在于,当用户根据自己的喜好更改个人设置后,就会得到一个属于自己的个性化的城市评分。任何人都能够通过注册登录个人账户来设置自己的偏好,就像下图这样:

1457016983-1310-6-02-24-at-16.14.10-1024x558

Teleport Cities中个人偏好设置的例子

改变几个偏好的设置,系统所给出的分数就完全按照这个人所设置的偏好来决定了。并且,城市的评分分数也可能因为个人偏好设置的不同而变化。这样的话,所给出的相似性地图就变成真正的个人定制版了。下面,我收集了三个例图,都是由偏好不同的模拟用户通过设置不同的偏好设定而得出的。

偏好设置一(例一):

  • 气候:与丹佛(美国城市)相似
  • 因特网接入:非常重要
  • 文娱:电影院,喜剧俱乐部,音乐会

例一(略)

个人偏好设置二(例二):

  • 低犯罪率:非常重要
  • 医疗健康:尽可能优质
  • 教育:孩子需入学

例二(略)

个人偏好设置三(例三):

  • 创业的氛围:非常重要
  • 风投的生态圈:比较重要
  • 旅游的连通性:中等
  • 创业简易:非常重要
  • 低企业税:非常重要
  • 高速网络:非常重要

例三(略)

注:文中省略了部分交互图片,大家可以点击原文链接http://teleport.org/2016/02/visualizing-city-similarity/查看。

来自:数盟社区

]]>
盘点最实用56个大数据可视化分析工具 //www.otias-ub.com/archives/439967.html Thu, 18 Feb 2016 13:05:33 +0000 //www.otias-ub.com/?p=439967 image

俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性;我们还需要跨学科的团队,而不是单个数据科学家、设计师或数据分析员;我们更需要重新思考我们所知道的数据可视化,图表和图形还只能在一个或两个维度上传递信息, 那么他们怎样才能与其他维度融合到一起深入挖掘大数据呢?此时就需要倚仗大数据可视化(BDV)工具,因此,笔者收集了适合各个平台各种行业的多个图表和报表工具,这些工具中不乏有适用于NET、Java、Flash、HTML5、Flex等平台的,也不乏有适用于常规图表报表、甘特图、流程图、金融图表、工控图表、数据透视表、OLAP多维分析等图表报表开发的。为了进一步让大家了解如何选择适合的数据可视化产品,本文将围绕这一话题展开,希望能对正在选型中的企业有所帮助。下面就来看看全球备受欢迎的的可视化工具都有哪些吧!

一、Excel
Excel作为一个入门级工具,是快速分析数据的理想工具,也能创建供内部使用的数据图,但是Excel在颜色、线条和样式上课选择的范围有限,这也意味着用Excel很难制作出能符合专业出版物和网站需要的数据图。

二、Google Chart API
Google Chart提供了一种非常完美的方式来可视化数据,提供了大量现成的图标类型,从简单的线图表到复杂的分层树地图等。它还内置了动画和用户交互控制。

三、D3
D3(Data Driven Documents)是支持SVG渲染的另一种JavaScript库。但是D3能够提供大量线性图和条形图之外的复杂图表样式,例如Voronoi图、树形图、圆形集群和单词云等。

四、R
R语言是主要用于统计分析、绘图的语言和操作环境。虽然R主要用于统计分析或者开发统计相关的软件,但也有用作矩阵计算。其分析速度可比美GNUOctave甚至商业软件MATLAB。

五、Visual.ly
如果你需要制作信息图而不仅仅是数据可视化,Visual.ly是最流行的一个选择。

六、Processing
Processing是数据可视化的招牌工具。你只需要编写一些简单的代码,然后编译成Java。Processing可以在几乎所有平台上运行。

七、Leaflet

Leaflet是一个开源的JavaScript库,用来开发移动友好地交互地图。

八、Openlayers
Openlayers可能是所有地图库中可靠性最高的一个。虽然文档注释并不完善。且学习曲线非常陡峭,但是对于特定的任务来说,Openlayers能够提供一些其他地图库都没有的特殊工具。

九、PolyMaps
PolyMaps是一个地图库,主要面向数据可视化用户。PolyMaps在地图风格化方面有独到之处,类似CSS样式表的选择器。

十、Charting Fonts
Charting Fonts是将符号字体与字体整合(把符号变成字体),创建出漂亮的矢量化图标。

十一、Gephi
Gephi是进行社会图谱数据可视化分析的工具,不但能处理大规模数据集并且Gephi是一个可视化的网络探索平台,用于构建动态的、分层的数据图表。

十二、CartoDB
CartoDB是一个不可错过的网站,你可以用CartoDB很轻易就把表格数据和地图关联起来,这方面CartoDB是最优秀的选择。

十三、Weka
Weka是一个能根据属性分类和集群大量数据的优秀工具,Weka不但是数据分析的强大工具,还能生成一些简单的图表。

十四、NodeBox
NodeBox是OS X上创建二维图形和可视化的应用程序,你需要了解Python程序,NodeBox与Processing类似,但没有Processing的互动功能。https://www.nodebox.net/code/index.php/Home

十五、Kartograph
Kartograph不需要任何地图提供者像Google Maps,用来建立互动式地图,由两个libraries组成,从空间数据开放格式,利用向量投影的Python library以及post GIS,并将两者结合到SVG和JavaScript library,并把这些SVG资料转变成互动性地图。

十六、Modest Maps
Modest Maps是一个很小的地图库,在一些扩展库的配合下,例如Wax、Modest Maps立刻会变成一个强大的地图工具。

十七、Tangle
Tangle是一个用来探索,Play和可以立即查看文档更新的交互工具。

十八、Crossfilter
Crossfilter既是图表,又是互动图形用户界面的小程序,当你调整一个图表中的输入范围时,其他关联图表的数据也会随之改变

十九、Raphael
Raphael是创建图表和图形的JavaScript库,与其他库最大的不同是输出格式仅限SVG和VML. http://raphaeljs.com/

二十、jsDraw2DX
jsDraw2DX是一个标准的JavaScript库,用来创建任意类型的SVG交互式图形,可生成包括线、矩形、多边形、椭圆、弧线等图形。http://jsdraw2dx.jsfiction.com/

二十一、Pizza Pie Charts
Pizza Pie Charts是个响应式饼图图表,基于Adobe Snap SVG框架,通过HTML标记和CSS来替代JavaScript对象,更容易集成各种先进的技术。

二十二、Fusion Charts Suit XT
Fusion Charts Suit XT是一款跨平台、跨浏览器的JavaScript图表组件,为你提供令人愉悦的JavaScript图表体验。它是最全面的图表解决方案,包含90+图表类型和众多交互功能,包括3D、各种仪表、工具提示、向下钻取、缩放和滚动等。它拥有完整的文档以及现成的演示,可以帮助你快速创建图表。

二十三、iCharts
iCharts提供可一个用于创建并呈现引人注目图表的托管解决方案。有许多不同种类的图表可供选择,每种类型都完全可定制,以适合网站的主题。iCharts有交互元素,可以从Google Doc、Excel表单和其他来源中获取数据。

二十四、Modest Maps
Modest Maps是一个轻量级、可扩展的、可定制的和免费的地图显示类库,这个类库能帮助开发人员在他们自己的项目里能够与地图进行交互。

二十五、Raw
Raw局域非常流行的D3.js库开发,支持很多图表类型,例如泡泡图、映射图、环图等。它可以使数据集在途、复制、粘贴、拖曳、删除于一体,并且允许我们定制化试图和层次。

二十六、Springy
Springy设计清凉并且简答。它提供了一个抽象的图形处理和计算的布局,支持Canvas、SVG、WebGL、HTML元素。

二十七、Bonsai
Bonsai使用SVG作为输出方式来生成图形和动画效果,拥有非常完整的图形处理API,可以使得你更加方便的处理图形效果。它还支持渐变和过滤器(灰度、模糊、不透明度)等效果。

二十八、Cube
Cube是一个开源的系统,用来可视化时间系列数据。它是基于MongoDB、NodeJS和D3.js开发。用户可以使用它为内部仪表板构建实时可视化的仪表板指标。

二十九、Gantti
Gantti是一个开源的PHP类,帮助用户即时生成Gantti图表。使用Gantti创建图表无需使用JavaScript,纯HTML-CSS3实现。图表默认输出非常漂亮,但用户可以自定义样式进行输出(SASS样式表)。

三十、Smoothie Charts
Smoothie Charts是一个十分小的动态流数据图表路。通过推送一个webSocket来显示实时数据流。Smoothie Charts只支持Chorme和Safari浏览器,并且不支持刻印文字或饼图,它很擅长显示流媒体数据。

三十一、Flot
Flot是一个优秀的线框图表库,支持所有支持canvas的浏览器(目前主流的浏览器如火狐、IE、Chrome等都支持)。

三十二、Tableau Public
Tableau Public是一款桌面可视化工具,用户可以创建自己的数据可视化,并将交互性数据可视化发布到网页上。

三十三、Many Eyes
Many Eyes是一个Web应用程序,用来创建、分享和讨论用户上传图形数据。

三十四、Anychart
Anychart是一个灵活的基于Flash/JavaScript(HTML5)的图表解决方案、跨浏览器、跨平台。除了图表功能外,它还有一款收费的交互式图表和仪表。

三十五、Dundas Chart
Dundas Chart处于行业领先地位的NET图表处理控件,于2009年被微软收购,并将图表产品的一部分功能集成到Visual Studio中。

三十六、TimeFlow
TimeFlow Analytical Timeline是为了暂时性资料的视觉化工具,现在有alpha版本因此有机会可以发现差错,提供以下不同的呈现方式:时间轴、日历、柱状图、表格等。

三十七、Protovis
Protovis是一个可视化JavaScript图表生成工具。

三十八、Choosel
Choosel是可扩展的模块化Google网络工具框架,可用来创建基于网络的整合了数据工作台和信息图表的可视化平台。

三十九、Zoho Reports
Zoho Reports支持丰富的功能帮助不同的用户解决各种个性化需求,支持SQL查询、类四暗自表格界面等。

四十、Quantum GIS(QDIS)
Quantum GIS(QDIS)是一个用户界面友好、开源代码的GIS客户端程序,支持数据的可视化、管理、编辑与分析和印刷地图的制作。

四十一、NodeXL
NodeXLDE 主要功能是社交网络可视化。

四十二、OpenStreetMap
OpenStreetMap是一个世界地图,由像您一样的人们所构筑,可依据开放协议自由使用。

四十三、OpenHeatMap
OpenHeatMap简单易用,用户可以用它上传数据、创建地图、交流信息。它可以把数据(如Google Spreadsheet的表单)转化为交互式的地图应用,并在网上分享。

四十四、Circos
Circos最初主要用于基因组序列相关数据的可视化,目前已应用于多个领域,例如:影视作品中的人物关系分析,物流公司的订单来源和流向分析等,大多数关系型数据都可以尝试用Circos来可视化。

四十五、Impure
Impure是一个可视化编程语言,旨在收集、处理可视化信息。

四十六、Polymaps
Polymaps是一个基于矢量和tile创建动态、交互式的动态地图。

四十七、Rickshaw
Rickshaw是一个基于D3.JS来创建序交互式的时间序列图表库。

四十八、Sigma.js
Sigma.js是一个开源的轻量级库,用来显示交互式的静态和动态图表。

四十九、Timeline
Timeline即时间轴,用户通过这个工具可以一目了然的知道自己在何时做了什么。

五十、BirdEye
BirdEye是Decearative Visual Analytics,它属于一个群体专案,为了要提升设计和广泛的开源资料视觉化发展,并且为了Adobe Flex建视觉分析图库,这个动作以叙述性的资料库为主,让使用者能够建立多元资料视觉化界面来分析以及呈现资讯。

五十一、Arbor.Js
Arbor.Js提供有效率、以力导向的版面配置演算法,抽象画图表组织以及筛选更新的处理。

五十二、Highchart.js
Highchart.js是单纯由JavaScript所写的图表资料库,提供简单的方法来增加互动性图表来表达你的网站或网站应用程式。目前它能支援线图、样条函数图。

五十三、Paper.js
Paper.js是一个开源向量图表叙述架构,能够在HTML5 Canvas 运作,对于初学者来说它是很容易学习的,其中也有很多专业面向可以提供中阶及高阶使用者。

五十四、Visualize Free
Visualize Free是一个建立在高阶商业后台集游InetScoft开发的视觉化软体免费的视觉分析工具,可从多元变量资料筛选并看其趋势,或是利用简单地点及方法来切割资料或是小范围的资料。

五十五、GeoCommons
GeoCommons可以使用户构建富交互可视化应用来解决问题,即使他们没有任何传统地图使用经验。你可以将实社会化数据或者GeoCommons保存的超5万份开源数据在地图上可视化,创造带交互的可视化分析作品,并将作品嵌入网站、博客或分享到社交网络上。

五十六:Echarts

提起ECharts,经常使用开源软件的朋友应该很熟悉,当然,如果你不知道也没关系。但是你肯定知道去年春节以及近期央视大规划报道的百度大数据产品,如百度迁徙、百度司南、百度大数据预测等等,这些产品的数据可视化均是通过ECharts来实现的。

在国外大数据可视化企业Tableau、Datawatch、Platfora强势入华的情况下,国人推出了ECharts,并且进行了开源,从这一点来说,中国的大数据行业并不落后于北美国家。ECharts也让我们看到了中国大数据可视化的未来,感谢ECharts以及ECharts团队。

传统的数据可视化工具仅仅将数据加以组合,通过不同的展现方式提供给用户,用于发现数据之间的关联信息。近年来,随着云和大数据时代的来临,数据可 视化产品已经不再满足于使用传统的数据可视化工具来对数据仓库中的数据抽取、归纳并简单的展现。新型的数据可视化产品必须满足互联网爆发的大数据需求,必须快速的收集、筛选、分析、归纳、展现决策者所需要的信息,并根据新增的数据进行实时更新。因此,在大数据时代,数据可视化工具必须具有以下特性:

(1)实时性:数据可视化工具必须适应大数据时代数据量的爆炸式增长需求,必须快速的收集分析数据、并对数据信息进行实时更新;

(2)简单操作:数据可视化工具满足快速开发、易于操作的特性,能满足互联网时代信息多变的特点;

(3)更丰富的展现:数据可视化工具需具有更丰富的展现方式,能充分满足数据展现的多维度要求;

(4)多种数据集成支持方式:数据的来源不仅仅局限于数据库,数据可视化工具将支持团队协作数据、数据仓库、文本等多种方式,并能够通过互联网进行展现。

数据可视化技术在现今是一个新兴领域,有越来越多的发展、研究等数据可视化分析,在诸如美国这些国家不断被需求。企业获取数据可视化功能主要通过编程和非编程两类工具实现。主流编程工具包括以下三种类型:从艺术的角度创作的数据可视化,比较典型的工具是 Processing.js,它是为艺术家提供的编程语言。从统计和数据处理的角度,R语言是一款典型的工具,它本身既可以做数据分析,又可以做图形 理。介于两者之间的工具,既要兼顾数据处理,又要兼顾展现效果,D3.js是一个不错的选择。像D3.js这种基于Javascript的数据可视化工具更适合在互联网上互动的展示数据。

大数据导航(http://hao.199it.com/)今日新增医疗数据工具,欢迎访问收藏~

]]>
Google推出Cloud Datalab:数据探索与可视化的交互式工具 //www.otias-ub.com/archives/394170.html Wed, 14 Oct 2015 09:45:06 +0000 //www.otias-ub.com/?p=394170 Google于今日推出了名叫Cloud Datalab的新款交互式开发工具,只需轻点几下数据表,就可以带你探索、分析和领略可视化的数据。该公司称,这项服务旨在帮助开发者“从原始数据中获得见解,探索、分享和快速发布报告,简单却又富有成本效益”。这项服务用到了Jupyter notebooks(此前叫做IPython),改格式允许用户通过活跃代码创建直观可视的文档。

251e6fadebfe3b6

Jupyter在数据服务领域相当知名,并且有一个推动其蓬勃发展的生态系统,而新款Google工具也将因此变得更加易用。

通过Cloud Datalab,开发者们能够借助Google BigQuery、计算引擎和云服务来探索、变换、可视化、以及处理数据。

用户可选用Python、SQL和JavaScript(通过BigQuery的用户定义函数),并基于此来构建开发BigQuery数据管道、创建机器学习模型等。

2fc89b021d67b31

说到数据的可视化,开发者们还可以利用Google Charting或matplotlib Python库。

初上手的时候,你得先将Cloud Datalab作为应用引擎(App Engine)应用程序来部署。这会是该服务的主要成本投入,至于测试阶段和之后的收费标准,Google暂未披露。

部署完成后,你就可以开始新项目的建设和设定新的notebooks,服务中已经预先提供了一些上手范例。

8df17c225fc1486

在Cloud Datalab和其它商业智能工具(Business Intelligence Tools)之间有一些重叠的部分,比如亚马逊最近宣布的Amazon QuickSight

但在目前,Google既没有将该服务划归为“BI”类产品,也没有限制非技术用户。当然,Cloud Datalab最酷的一点还是开源,所以开发者们能够随意扩展分支或完善GitHub项目。

最后,为了完善Could Datalab,Google还于今日推出了Cloud Shell,以便开发者们通过命令行对谷歌云平台上的计算资源进行控制。

Cloud Shell由一个临时的计算引擎虚拟机支撑,但提供了5GB的永久存储。

https://cloud.google.com/datalab/

 

]]>
人类历史上最有影响力的五个数据可视化信息图 //www.otias-ub.com/archives/265911.html Thu, 14 Aug 2014 08:34:19 +0000 //www.otias-ub.com/?p=265911 数据可视化、信息图是这两年大数据热潮中的时髦概念,但实际上数据可视化和信息图古已有之,而“数据化运营”和“可视化管理”几乎贯穿了整个近代西方经济和文明的崛起历程。很多时候,上百年历史的手绘信息图让今天的数据科学家们也为拍案叫绝,奉为圭臬。

近日,大数据可视化公司Tableau Software评出了人类历史上最有影响力的五个数据可视化信息图,这些数据可视化图表强大而美观,从很大程度上改变了人类思考世界的方式。IT经理网为大家整理如下:

第五名:伦敦霍乱地图  作者John Snow(“权力的游戏”剧迷请淡定)

bigdata1

1854年伦敦爆发霍乱,10天内有500人死去,但比死亡更加让人恐慌的是“未知”,人们不知道霍乱的源头和感染分布。只有流行病专家John Snow意识到,源头来自市政供水。John在地图上用黑杠标注死亡案例,最终地图“开口说话”,显示大街水龙头是传染源。这张信息图还使公众意识到城市下水系统的重要性并采取切实行动。

第四名:世界经济变迁 作者Rosling

bigdata2

瑞典科学家累计研究全球经济数据超过30年,但直到2007年他再TED Talk上以可视化的方式展示这些数据,人们才能真正领略到他的数据研究的魅力。上图是Rosling展示的大量经济数据图表中的一张,直观展示了全球不同国家和地区个人收入与生活期望值之间的关系。

第三名:俄法战争 作者Charles Minard

bigdata3

原图链接

1812年拿破仑率大军踏上征服莫斯科的艰苦旅程,结果遭遇极端天气,98%的士兵都冻死在路上。50年后,当大多数法国人依然沉浸在拿破仑的荣耀中时,巴黎的工程师Charles Minard选择用数据的方式告诉世人这场战争的残酷性。信息图中的黑色粗线显示了极端天气如何击败了拿破仑的军队,这张图也让人们在反思战争的时候,更深入了解战争的真实代价。

第二名:战争死亡统计 作者Florence Nightingale

bigdata4

1855年,在争夺巴尔干半岛控制权的克里米亚战争中,英国军队与俄军和疾病两线作战。作为一位护士,你如何说服将军们投钱在医院和医疗设施上,而不是枪炮弹药?

伟大的Florence Nightinggale(南丁格尔)用数据图表的方式展示了那些可预防疾病(蓝色和灰色区域)导致的惊人死亡数字。看过南丁格尔的数据可视化信息图后,卫生和医疗成了英国军队的头号要务。

第一名:人类文明的清明上河图  作者 Joseph Priestley

bigdata5

大图链接:

人类浩瀚历史长河中,无数文明、精英、国家交相辉映、盘根错节,即使是历史学家,往往穷经皓首,也难以做到一览无余。但18世纪的一位博学的英语教师Joseph Priestley设定了一个野心勃勃的目标:将人类历史上的国家、文明与重要历史人物之间的关系集中展现出来。最终Joseph绘制了两个互相关联的人类文明卷轴,第一张信息图标注了人类历史上2000个重要历史人物,第二张则绘制了人类历史上国家和民族的变迁,两张图使用相同的时间轴,可以叠加使用。

]]>
30 个把数据可视化的简单工具 //www.otias-ub.com/archives/238770.html //www.otias-ub.com/archives/238770.html#comments Wed, 11 Jun 2014 10:43:05 +0000 //www.otias-ub.com/?p=238770

Big Data 的重要性与日俱增,许多企业的资料库内都收集了非常多消费者资料,但要将这一笔笔冷僻又繁杂的数字与名目资料转化为有价值、为企业带来效益的策略拟定参考,需要倚赖资料科学家的脑袋与适当的统计软体,再把结果图表化,让一般企业、大众都看的懂,也就是「看图说故事」与「数字会说话」两者的结合。

但有哪些简单又实用性高、不需要专业的编码知识、也不需要特别的训练就可以用的软体呢?以下介绍 30 个着名的资料图表化软体给大家参考,想要让顾客听懂你在说什么、说服你的客户就靠它们了!

1. iCharts

iCharts 是能够连接市场研究出版者、经济及产业面的资料和专业的消费者的平台,拥有数以万计的图表,涵盖层面包刮商业、经济、运动和其他类别,它让大众能够简单的了解并能够跟上世界最新统计资料的脚步。

为了拥有庞大的资料量,它提供以云端为基础和受专利保护的图表工具,让企业和个人都能推出品牌、行销以及用图表分享他们的资料,透过网站分享给数百万的人。很棒的是,iChart 提供免费帐户给使用者,让你能够使用基本的互动是图表,当你花钱购买更进阶的版本,你就能使用更多不同的功能;图表本身是具有互动性的,因此可以从 Google Docs、Excel spreadsheet 和其他来源撷取。

2. Fusion Charts Suit XT

Fusion Charts Suit XT 是一个专业的、进阶版的 JavaScript chart library,让我们能够建出任何形式的图表。

採用 SVG(Scalable Vector Graphics,可缩放向量图形)和支持超过 90 种以上的图表类型,包括 3D、甘特图(gantt)、各种不同的压力表图(gauges chart)、漏斗图(funnel chart),甚至世界 / 各州 / 个国家的地图。同样地,大部分的图表包含 2D 及 3D 的视图,图表是完全可客制化的,标籤、字体、边界等等全部都是可以依使用者作改变。

除此之外,他们也重视工具间的互动性,提示框(tooltips)、向下延伸资料(drill down)、可点选的图例关键字(legend keys)、缩放及上下捲动,以及一次按键进行图表输出或列印。

3. Modest Maps

Modest Maps 是一个小而可延伸、给想要使用互动式地图的设计师和开发者的免费的图书馆,提供核心设定在紧密、清楚的套件特色,拥有许多额外的功能。

4. Pizza Pie Chart

Pizza Pie Chart 是建立在来自 Adobe 的 Snap SVG 结构基础上的圆饼图(pie chart),透过 HTML 和 CSS 而非 JavaScript 物件,专注于进行简单的整合,但你仍可以透过 JavaScript 物件连结到 Pizza。

更方便的是,你可以传送饼图到任何有 Pizza 的装置,在传送后,饼图会自动变成合适的大小形式,当然也可以固定它最大的长宽。

5. Raw

Raw 是免费且开源的网站应用程式,为弹性地视觉化资料并尽可能以最简单的方式进行。

事实上它将自身定位为「弥补电子表格(spreadshit)应用程式和向量图表编辑之间的遗漏」,藉由下载资料设定、复制贴上或是拖曳资料,让我们能够客制化浏览或分层。以受观迎的 D3,js 为基础,支援各种不同的图表类型像是树状图、气泡图(bubble chart)等等,客户端安装 Raw 是非常直接的。

6. Leaflet

Leaflet 是现代化开源的 JavaScript library,是为了手机优化的良好互动地图。

容量只占 JavaScript 的 31KB,拥有所有大部分开发商所需要线上地图的特色,Leaflet 融合了简单、效能及实用性三者的设计,有效率的跨桌上型及行动手机平台高效能地运作,虽以 HYML5 及 CSS3 为优势,但仍能够让版本较早的浏览器进行浏览动作。

7. Chartkick

Chartkick 是 Ruby gem(同样也是 JavaScript API-由 JavaScript 语言编写的应用程式埠)为了能简单又快速地创造出好看的图表。整合了两大图表库:Highcharts 以及 Google Charts,并能够使用和这两个图库相同的功能来建立图表,支援多种图表类型以及单一图表含多样系列,同样地,像是刚刚所提到地 Chartkick.js,不需要 Ruby 也能够带给用户端相同的功能。

8. Ember Charts

Ember Charts 是由 Ember.js 和 D3.js 架构所建立地图表库,它包含时间序列、长条图、元饼图以及散布图,容易修改并做延伸。这些图表的元素可以看出在图表互动性及呈现上,完整地实践了他们的想法。

9. Springy

Springy 是一个以力导向的图表版面配置演算法,也就是说,弹性地使用真实世界的物理来尝试并理解如何呈现一个好看的网络型图表,Springy.js 设计的小且且简单,它提供一个抽象化图表操作以及计算版面配置,画版面配置以及互动都是随个人喜好,这代表说,你可以使用 canvas、SVG、WebGL 甚至是旧版的 HTML 要素。

10. Bonsai

 

Bonsai 是一个为了建构图表以及动画的开源 JavaScript liabrary,由这个图库提出使用 SVG 以及功能充足的 API 得出的结果,支援建构简单的图形如长方形、圆形或椭圆等,有了特定的功能以及为了能客制化图形的路径函数,针对不同形状做颜色、梯度变化率以及漏斗型的筛选如灰阶、透明度等应用。

11. Google Charts

Google Charts 提供了非常棒的方式能在网站上视觉化资料,从一条简单的线图到很复杂的阶层型树状图,图库艺廊提供了非常多可使用的图表类型,对于专业视觉画的图表如地理图、动态压力图等,是十分好用的工具;另外包内建含动画和使用者互动控制的功能。

12. jsDraw2DX

jsDraw2DX 是一个独立于 JavaScript liabrary、为利用 SVG 产生任何形式的互动图,除了有能够产生任何基本的图形如线、长方形、多边形、圆形、椭圆、弧形等等之外,它也能画出曲线、任何度数的贝兹曲线(Beziers)、函数绘制图等等。

13. Cube

Cube 同样也是开源系统,能视觉化时间序列资料,建立在 MongoDB、Node 以及 D3。如果你将 Cube 传送到时戳事件,你能在内部后台简单地建立集合矩阵的实境视觉化。举例来说,你也许可以使用 Cube 来监控网站浏览量、计算每五分钟下载量。

14. Gantti

Gantti 是一个为了快速地产生 Gantt 图表的开源 PHP 类别,这些图表单纯地涵盖了 HTML5-CSS3,而没有任何 JavaScript。预设的图表结果看起来就已经很有亲和力了,但也能很简单地客制化,它运作只单纯地透过定义开始入口以及结束时间、要求单一函数指令;同样地,这些图表能够跨浏览器。

15. Smoothie Charts

Smoothie Charts 是真的小型地图表资料库,主要是为了实际现场串流资料。虽然有很多图表资料库能让你动态地更新资料内容,但没有一个能真正地优化持续性的串流资料。Smoothie Charts 目前只能在 Chrome 和 Safari 上运作,事实上,相较于其他视觉化形式的资料库像是 Flot,它比较不好用;但是,还是得强调,它真的非常擅长于展现串流资料。

16. Envision.js

Envision.js 是一个 JavaScript liabrary,用来简化创造快速又具有互动性的 HTML5 视觉化图像。它有两种不同的图表类型:财务型的时间序列资料以及专为开发者所用的 API 以建立客制化图表。它採用 framework-agnostic 模型以及依赖部分微型图表库。

17. BirdEye

BirdEye 是 Declarative Visual Analytics,它属于一个群体专案,为了要提升设计和广泛的开源资料视觉化发展,并且为 Adobe Flex 建视觉分析图库,这个动作以叙述性的资料库为主,让使用者能够建立多元资料视觉化介面来分析以及呈现资讯。

18. Arbor.js

Arbor.js 是由网页工程师以及 jQuery 所建立的图表视觉化资料库,提供有效率、以力导向的版面配置演算法,抽象画图表组织以及筛选更新的处理。

它不受限于你必须要用特定的方法来进行萤幕绘画,可以使用 canvas、SVG 甚至是 HTML 定位要素,能够依据你的专案来选定你需要的东西。Arbor.js 帮助你专注于图表资料以及它的特色,而非要花一堆时间在数学运算来产出版面配置。

19. Gephi

Gephi 对于所有类型的网络及复杂的系统、动态性和阶层图等,都兼具互动性视觉化以及搜寻平台。以图表为基础的视觉化者以及资料搜寻者,不只能够应付大量的资料集,还能创出美丽的图表,同样也能让你筛选、清除不必要的资料。

20. HighChartjs

Highcharts JS 是单纯由 JavaScript 所写的图表资料库,提供简单的方法来增加互动性图表道你的网站或是网站应用程式。目前它能支援线图、样条函数图(spline)、面积图、面积样条函数图(areaspline)、柱状图、长条图、圆饼图和散布图等等。特别的是,它能够在现代浏览器像是 iPhone 和版本 6 的 IE 等运作,不需要特别的程式设计技术,就能设定 Highcharts 组态。

21. Javascript InfoVIS Toolkit

JavaScript InfoVis Toolkit 提供创造网站上的 Interactive Data Visualizations,这个资料库拥有很多独特的样式以及动画编辑效果,而且也是免费的。

22. Axiis

Axiis 是开源资料视觉化架构,专为初学者以及专业开发者设计,Axiis 给予开发者有办法来深入的定义资料视觉化,只要透过简要而直观的标籤语言。Axiis 提供预建的视觉化内容以及抽象的版面配置模板,以及让你能够创造自己独特的视觉化图表。

23. Protovis

Protovis 是使用 canvas 元素的 JavaScript 视觉化工具包,利用图表的方法让资料视觉化,透过基本的几何图如柱状图与点图,来组合客制化的资料浏览。这些几何图被称作为 marks,每个 mark 经过编码后成一笔视觉化资料,并且透过动态性,像是颜色及位置来呈现,当然你可以有趣地来结合它们来变得更丰富、又具互动性的视觉资料。

24. HumbleFinance

HumbleFinance 是一个 HTML5 资料视觉化工具,和 Google Finance 的 Flash 图表很相似,利用 Prototype 和 Flotr libraries,不受限只有呈现财务资料,任两个分享在横轴的 2D 的资料都能够可以。资料必须储存在 JavaScript 变数,以及在跑函数来产生图表前,需要设定三个参数。可以手动地选择一部分的资料,并放大该部分的资料,这是一个非常有用的功能当你在处理大量的资料时。

25. D3.js

D3 是一个为了操作以资料为主的 HTML 文件,小而免费的 JavaScript library。D3 能够帮助你快速的视觉化你的资料,不论是 HTML 或是 SVG 都可以,并且可以进行互动性、合併流畅的转换以及阶段性动态到你的页面上。

D3 不是传统的视觉化架构。D3 只解决问题的癥结点:有效率的操作资料文件,这反而给予 D3 特别的弹性,能够在 CSS3、HTML5 以及 SVG 上功能都很完整。

26. Dipity

Dipity 让你能够建立免费的数位时间轴,不只建立,在互动模式下还能分享、插入,视觉化的时间轴能够整合到影音、图片、文字、连结、社群媒体、时戳以及位置中。

27. Kartograph

Kartograph 不需要任何地图提供者像 Google Maps,用来建立互动式地图,由两个 libraries 组成:从空间数据开放格式,利用向量投影的 Python library 以及 Post GIS,并将两者结合到 SVG 和 JavaScripts library,并把这些 SVG 资料转变成互动性地图。

28. TimeFlow

TimeFlow Analytical Timeline 是为了暂时性资料的视觉化工具,现在有 alpha 版本因此有机会可以发现差错,提供了以下不同的呈现方式:时间轴、日历、柱状图、表格等。

29. Paper.js

Paper.js 是一个开源向量图表叙述架构,能够在 HTML5 Canvas 运作,对于初学者来说它是很容易学习的,其中也有许多专业面向可以提供中阶及高阶使用者。

30. Visualize Free

Visualize Free 是一个建立在高阶商业后台集游 InetSoft 开发的视觉化软体免费的视觉分析工具,视觉化是一个很棒的方法,从多元变量资料筛选并看其趋势,或是利用简单地点及方法来切割资料或是小范围的资料,如果你正在找一个方法来视觉化搜寻并呈现资料,而一般的 office 图表软体没办法处理,那 Visualize Free 会是一个很棒的选择。

来源:科技橘报   FastCompany;图片来源:FastCompany ; luc legay, CC Licensed

]]>
//www.otias-ub.com/archives/238770.html/feed 1
文本流可视化经典之作 //www.otias-ub.com/archives/129619.html Thu, 04 Jul 2013 15:28:16 +0000 //www.otias-ub.com/?p=129619 AT&T的Emden R. Gansner、胡一凡和Stephen North在Graph Drawing 2012上发表了一篇关于文本流可视化的文章,无论是文章解决的问题、采用的方法、最终结果甚至写作手法都堪称一流,因此此文被评为当年的Best Paper。

论文的目标是如何帮助用户领会大规模文本流数据隐含的知识,作者提出了一种可视化分析方法,重点考虑三个方面的问题:如何分析并可视化流数据;通常时间相近的消息语义上更相似;用户需要浏览文本细节的工具。为此作者开发了TwitterScope系统,动态监测Twitter上发布的消息,经过实时语义分析、聚类与可视化映射、以及动态更新视图等过程,不仅为用户呈现了Twitter中相关话题的整体视图,而且能让用户查看历史记录和消息内容,系统界面如图1.

图 1  TwitterScope系统界面

在文本分析过程中,论文比较了LDA和TD/IDF方法,发现尽管LDA理论上结果更准确但是在Twitter这种短文本的分析上效果并不理想,因此最终采用了TD/IDF方法。由于消息动态到达,话题中的关键词权重会动态变化。系统设计了一个时间窗N,对当前时间之前的N条消息进行分析,当N很大时,话题的变化较小。当两条消息相似性超过一定阈值(默认0.2)时,则用边相连,边的权重为二者相似性大小,最终分析的结果形成图结构。聚类和可视化映射都采用了经典的方法,MDS用于高维投影,模块化聚类根据权重将相似的消息聚拢。由于MDS具有良好的距离保持特性,高维空间中相似的节点在平面上仍然距离更相近。图2显示了对各类别消息添加色调之后用地图隐喻的可视化结果,每块区域即为一个“国家”。

 

图2 地图隐喻

在动态布局上,作者下了一番功夫来保证新增加的节点不会对先前的视图造成很大的变化,即所谓mental map perservation.作者分两步来实现,首先确定新视图中每个节点的位置,其次由于每个节点其实是图片,所以尽量保证图片有较少的形变(Procrustes变换)。

真正原创性的工作是对散落分布的图元的可视化上。由于可能存在很多话题,不同话题之间的消息并不相连(不相似),因此需要消除不同“国家”之间的重叠或拉近不同“国家”之间的距离。论文采用polyminoes算法检测“国家”之间是overlap或underlap,并引入距离因子充分利用可视化空间,实践表明这种方法能够快速收敛。图3展示了初始重叠的图元经过三次迭代后的最终结果。

 

图3 空间压缩算法迭代结果

论文给出了很多实例表明其方法的有效性,例如图 4,从中不仅能看到历史时刻的话题主要描述的内容“Thailand”,”kill”, “Bombing”,而且点击具体的tweet可以引导用户进入具体的网页查看关于此话题的具体新闻。

图4 可视化案例

]]>
信息图营销价值 //www.otias-ub.com/archives/96251.html Mon, 25 Feb 2013 12:46:42 +0000 //www.otias-ub.com/?p=96251 信息图(Infographic)是指将数据、信息或知识的可视化表现形式。近两年来信息图借助社交媒体广为流传,一副好的信息图可能会被多达1500万人看到。无论在Twitter还是LinkedIn上,信息图的转发和分享数量都远远高于传统贴文。

]]>
信息图为何具有威力 //www.otias-ub.com/archives/64982.html //www.otias-ub.com/archives/64982.html#comments Mon, 27 Aug 2012 01:30:59 +0000 //www.otias-ub.com/?p=64982 为何信息视图具有如此大的威力?原因很简单因为他是一种能够快速让用户阅读和理解的数据或信息可视化方式。当然如下背景在推动着信息视图的走红:

信息过载:平均每个人每天相当于面对着174种充满信息的报纸,99%的信息立马被大脑过滤了,只剩下1%的信息能够通过大脑审查,信息视图就在其中

大脑使然:人类1/2的大脑属于处理视觉化信息的功能,而眼睛其实是大脑的延伸;传输到大脑里的90%的信息是可视化的;65%的人是视觉学习者

文本,图像处理方式不同:图像能够整幅被处理;而文字信息的处理则有先后次序;大脑处理图像的速度是文本的6万倍;多数人只记得他们所阅读内容的20%

在Google上,信息视图的搜索量在过去两年增长了800%,采用了信息图的发布商流量增长比没有采用的高12%;在Twitter上的讨论也是相当激励

信息视图是内容营销最强悍的先锋,确保你的信息视图能打动目标受众,让他们时刻惦记你;大脑过滤99%的场景信息,只有不凡才能留住

]]>
//www.otias-ub.com/archives/64982.html/feed 1