北京治疗白癜风哪家医院最权威 http://pf.39.net/bdfyy/xwdt/1
地理空间图
数据的多维度特征
当我们进行数据分析的时候,可以从多种维度抽象数据的特征,并以不同的分析与可视化手段进行洞察。除了基础的多维数量特征之外,最为重要的特征维度是地理位置、时间序列与关联关系这三个。
随着所分析数据的复杂化,需要将多个维度协同进行分析。从图分析角度来看,将图数据与时序,以及与地理位置结合是解决实际问题的必须手段。由此就产生了带有时间属性的动态图(Dynamicnetwork)以及带有地理属性的地理空间图(Geospatialgraph)。在应对这两种分析场景的时候,可视分析组件也需求给出解决方案。
上一篇文章结合剑桥智能的可视分析组件初步介绍了动态图可视分析《动态(时序)网络可视化方法》,这篇我们聊聊图分析与可视化和地理位置结合。
典型的地理空间图典型的地理空间图可以描述各种资源在不同地理位置之间的流动或者描述不同的关联事件在多个地理位置之间的发生情况。例如:航空网络、航运网络、人口迁徙网络、事件调查网络等。
航空网络示意
在动态图中,节点或关系的属性都可以附带时间。但是在地里空间图中,大多数地里坐标应该都是节点的附加属性,例如机场、港口、出发地与目的地等。当我们基于关联数据(图数据)结合其地理位置属性进行分析的时候,原本简单的网络就成为地理空间网络。
地理空间网络示意
为什么需要地理空间图
在许多情况下,了解地理空间图数据非常有价值。以下是一些您可能会发现有用的信息。(以下引用自剑桥智能博客)
地图解锁数据洞察力
有时候,只有在我们所生活的真实世界中呈现数据时,数据才变得有意义。例如,警官经常将调查结果绘制在地图上,以了解在什么地点发生了什么事情。欺诈调查员也是如此,他们将保单、索赔、证人、车辆和损坏报告都呈现在地图上,从而进行分析与调查。
将这些关联数据绘制在地图上面就可以完成图片,从而揭示原本很难看到的见解。
地理空间图示例
警察对此非常了解,多年来一直使用地图作为调查工具。这就是为什么如此多的侦探电影都包含这样的场景的原因:调查人员困惑地注视着用钉子和细绳覆盖的事件室墙上的一张大地图。
调查示例
我们可以再看个真实案例,这是代表典型保险欺诈索赔的数据模型。人们与保单息息相关,保单上有索赔,索赔涉及车辆,证人,维修店和损坏报告。
典型保险欺诈索赔的数据模型
当您尝试在网络图上绘制此信息时,会遇到挑战。图数据库中的大多数数据没有地理空间信息。保险案件-保单所有者和维修店的地址-没有彼此直接链接。
但是当我们将关联数据中的地理位置信息叠加到地图上,则刚好展示了人们修好受损汽车的过程。
地图上显示的保险欺诈索赔
只有在我们进行了这种可视化建模之后(从原始关联数据过渡到地图上的可视化模型),我们才能快速发现异常。大多数人(紫色)前往最近的修理厂(绿色)修理汽车。但是有些人特意去一个维修店,并且距离很远(红色链接)。这只是在找最好的修车厂吗?还是我们应该调查他们是否欺诈性地夸大了索赔?
地图作为可视化面板
从总体来看研究数据会有不一样的发现,这时细节变得不那么重要,关键特征反而凸显出来。可视化面板给出有用的数据“总览”视角。
地图面板在网络威胁分析、大型电信或IT网络管理的场景中作为数据总览的可视化面板很常见。从全局切换到具体细节视图可以帮助他们了解系统性能,监视故障并快速进行维修:
从总览到详情示例
一家全球公司的IT网络的可视化面板视图
当分析师深入特定位置以按需获取详细信息时,可视化面板可以作为大量细节数据的访问介质,提供增量数据加载以及直观地对项目进行分组的交互方法。
可以更深入地研究数据,并探索单个设备或子网级别的情况
映射为自定义视图
在不同行业和世界不同地区,人们需要在不同种类的地图上查看其图形数据。美国执法人员熟悉ESRI’sArcGIS制图生态系统,而英国警察最有可能使用OrdnanceSurvey。地图的定义也不限于地理位置。在一些基础可视化上查看关联也很有帮助-从关联切换到关联视图。
如果无法叠加最新的卫星图像,则无法可视化战场情报。如果关联数据无法利用地理围栏之类的工具来跟踪关键目标是否偏离虚拟边界,则可能会错过一些见解。
例如,您可能需要了解人群在机场或办公室设备中的流动。
自定义视图示例:机场图显示了涉及航站楼之间换乘的航班中转量
3
地理空间网络与资源迁徙数据分析
与地理空间网络结合最紧密的数据就是全球的资源迁徙,例如航空、航运与人口迁徙。
全球互联:解开空中交通网络
人们不仅旅行越来越频繁,而且越来越远,越来越快。把全球所有机场之间的航班连接进行可视化与分析将会很有意义。
此“地图”是基于OpenFlights.org在3.75个机场(37.条单条路线–加权总和较高,因为许多航空公司采用同一条路线)的图表上应用了地理位置布局以及力导向布局的可视化效果。
地理空间图可视化
结合力导向布局与社群聚类算法进行分析。自然地,地理空间特征还是可以辨别出来:各大洲几乎都是可见的,并且区域通常都处于其原始位置(连接亚洲和美洲的太平洋岛屿除外-想象一下这幅图的三个维度,后面是太平洋)。
力导向布局可视化
主要观察结果:印度与中东的联系比与南亚和东亚的联系更多。俄罗斯集群非常明显,可以连接俄罗斯以及许多前苏联成员国的机场。拉丁美洲显然被划分为与美国紧密相连的南部集群和中美洲集群
难民的全球迁徙
基于联合国难民署的数据,对全球难民的来源国家、目标国家以及难民数量进行基于地理空间的网络可视化。
全球难民迁徙网络
可以看到最大的难民来源国家:叙利亚及其邻国,阿富汗及其邻国,乍得,苏丹,刚果民主共和国和索马里,也包括从乌克兰到俄罗斯联邦。
六个最大的难民来源国
下图高亮了欧洲国家,除了乌克兰,“欧洲堡垒”几乎成了避难所。
欧洲国家的难民输入
如果配上时间轴,我们又可能看到随着不同时期冲突的发生,难民迁徙数量与目的地的变化。
时空数据与图数据的结合
在真实的数据分析中,还有一些情况需要结合时间维度、地理空间维度与关联关系维度进行分析。
“POLE”模型(人员,对象,位置和事件)广泛用于警察调查中,并提供了一种结构化的方法来分类,存储和连接与事件有关的信息。
例如:一辆汽车在新泽西州被盗,然后在曼哈顿再次被发现,据报有近两起抢劫案。随后,该车辆被抛弃在第二起抢劫案的西北部,附近发现了一把武器。交互式时间轴工具显示这一切都发生在6月18日凌晨点至10点之间。
时间轴标记显示了抢劫案的发生时间
在我们的可视化中,都可以对数据集进行分层,添加更多信息和上下文以帮助揭示更大的图景。让我们从一些自动车牌识别(ALPR)数据开始。
借助ALPR数据,我们可以更详细地了解犯罪嫌疑人在荷兰隧道内的活动
接下来,让我们添加一些手机数据,看看我们的嫌疑人在抢劫期间是否与任何人通信。可以看到犯罪嫌疑人在凌晨6点左右发生的四个犯罪嫌疑人打来的电话-在7-11点抢劫之后。
时间表包含来自四个来源的数据:抢劫时间,目击者报告,ALPR时间和嫌疑人的电话
武器被发现后,大约在上午10点,另一个可能的同伙打来电话。
整体数据展示
通过与时空数据结合的网络可视化进行交互,将来自不同来源的数据进行分层,调查人员可以回答“who,what,where,when”的问题,从而简化了复杂的场景以揭示感兴趣的人和调查对象。这也使确定案件中最相关和可发现的信息变得更加容易,从而有助于实现定罪的总体目标。
参考资料: