关联图谱基于图数据库建立关系网络图,是一种可视化的智能分析产品。通过数据抽取和转换,图计算引擎对数据进行查询和分析,实现秒级数据运算和数据可视化,并以图谱的形式展示给用户的图形分析工具。用户可以基于已建好的图谱进行查询、分析和探索。
什么是关联图谱?
在了解什么是关联图谱之前,我们先来了解下什么图,什么是图数据库。那什么是图呢?
图是相互连接事物及其关系的一种结构化表达,是最接近真实世界的数据组织结构。通过图将所有的数据连接起来,即时地传达信息,易于揭示复杂的关系模式。
图由节点和边构成,图将现实生活中可触摸的能看得见的实体(如某个人、某台电脑、某张银行卡等),或无法触摸肉眼也不可见的某个事故、某个案件、某次意外等,都抽象成图中的节点。而任意两节点与节点间的关系,则抽象成边。
图就是由一组一组的节点和边构成的,节点可以有多个属性,边也可以有多个属性,节点可以有多个标签,代表着不同的身份。如某个人在生活中即是一个孩子的爸爸,也是一位丈夫,也是某个金融科技公司的CPO。
图可以包含非常丰富的关联信息,比如:电话与电话间的呼叫关系、邮件往来关系、亲属关系、拥有关系等,在社交网络、交通网络、通讯网络、资金网络等各个领域的各种场景下,图都能最直观地展现实体间的关系链路,传达关系路径。
在科技领域有个六度空间理论,就是我们常听说的,世界上任何两个人最多只需通过6个关系就一定能找到对方,而关联图谱可以把这个理论变成现实。
好了,我们现在知道了什么是图,那图存在什么地方呢?数据量大的时候怎么办呢?
毕竟中国13亿多的人口,形形色色的关系所构成的社会关系网络,更是上亿级别的数据量。
图存储在图数据库(Graph Database)中,图数据库以图论为理论基础,图论中图的基本元素是节点和边,在图数据库中对应的就是节点和关系。用节点和关系所组成的图为真实世界直观地建模,支持百亿量级甚至千亿量级规模的巨型图的高效关系运算和复杂关系分析。
目前市面上较为流行的图数据库有Neo4j、Orient DB、Titan、Flock DB、Allegro Graph等。
不同于关系型数据库,一修改便容易“牵一发而动全身”图数据库可实现数据间的“互联互通”,与传统的关系型数据库相比,图数据库更擅长建立复杂的关系网络。
关联图谱基于图数据库建立关系网络图,是一种可视化的智能分析产品。通过数据抽取和转换,图计算引擎对数据进行查询和分析,实现秒级数据运算和数据可视化,并以图谱的形式展示给用户的图形分析工具。用户可以基于已建好的图谱进行查询、分析和探索。
关联图谱在风控领域中主要用于事中、事后的查询和分析,目前在反欺诈、反洗钱、互联网授信、车险、项目审计、公司关系、信用卡申请、交易等场景下均有应用。
可以这么说,凡是有关系的地方都可以用到关联图谱,我们现实生活中的实体都是由一个一个看似非常简单的关系组成的,如:人与人之间、公司与人之间、公司与公司之间、人与某个项目、某个活动与某个明星、学校与某个学生,生活中可触摸的不可触摸的事物都可以用关系连接起来。
这些容易被我们忽视的隐形关系和看似非常常见的关联关系,往往是风险突破口和识别欺诈、发现团伙的重要线索,下篇将详细介绍关联图谱的应用场景。