从图数据平台入手「费马科技」未来要开发分布式数据库

修改 | 石亚琼

依据Gartner的估量,全球非联系型数据库(NoSQL)在2020~2022估量保持在30%左右高速添加,远高于数据库全体商场。图数据库作为非联系型数据库的一种,在数据存储、相关上优势显着,是未来处理杂乱数据联系的技能趋势。今日要介绍的费马科技便是一家专心于图数据技能,为企业供给高功能图数据存储及剖析途径的公司,具有自主研制的两大中心产品——图数据途径(LightGraph)和图核算途径(PandaGraph)。

首要咱们先来简略了解一下“图”的开展史。

图论起源于18世纪欧拉对哥尼斯堡七桥问题的研讨,并经由许多数学家甚至核算机科学家竭尽全力的开展协助人们处理了许多实际问题。现在,依据图模型的数据剖析办法现已运用在了互联网的许多场景,例如交际网络剖析、网页排序、社区发现,在核算化学、天体物理学、生物信息学等自然科学范畴也有广泛运用。

图数据库并非指存储图片的数据库,而是以图这种数据结构存储和查询数据。节点和联系是构成图的两要素,图核算是将数据依照图的方法建模,把各类数据相关起来,将不同来历、不同类型的数据融合到同一个图里进行剖析,得到本来独立剖析难以发现的成果。

图数据库的出现是互联网年代信息爆破和数据杂乱化的成果。因为以Oracle为代表的传统的联系型数据库只能以二维表的方法表明联系,因而在处理杂乱联系上功率较低,而与之比较的图数据则更拿手处理杂乱的联系网络;此外,费马团队在图数据技能上现已积累了十多年的技能经历,把握了很多研讨成果,因而团队期望将技能落地为运用来处理现实问题,这也是费马进入图数据库商场的原因。

费马图数据途径

在产品功能上,费马与竞赛对手比较,技能优势体现在:

  • 图数据途径(LightGraph):现在速度可达千万极点/秒,能够完成10TB级外存存储。具有存储、查询,和简略剖析的功用。LightGraph在简略使命的履行速度上远高于Neo4j 及TigerGraph。

  • 图剖析途径(PandaGraph):费马图剖析途径的优势在于速度快、省内存。在处理速度上,PandaGraph的速度是Spark 及 GraphX的300倍;在内存运用量上,PandaGraph比Graph X节约一个数量级(12倍)。

此外,费马在图核算及图数据商场的竞赛优势还体现在团队实力和商场空间两方面:

公司表明:费马在图核算及图数据范畴投入了很多研制力气。现在公司共有职工16人,其间13人均为研制,中心团队来自清华大学及闻名通讯设备商,公司每年研制本钱占总本钱80%以上。

依据Gartner研讨报告,2019~2022年,图数据库商场将会以每年100%的添加率添加;而在曩昔的2018年,图数据库商场大概是5亿美元,到2022年保存估量至少80亿美元。商场尚处于蓝海。

在盈利形式上,费马供给规范的软件产品,选用相对通用的技能,因而不需求针对职业进行产品定制化。收购周期约为1年,首要依托招投标的方法。

现在公司已服务7-8家大中型公司,均匀客单价约百万。其间约80%-90%来自金融范畴,公司近期开发了工业范畴客户,未来也将开辟中小型客户。公司前期以直销作为首要获客方法,现在正在开辟途径。公司估量本年营收约几百万,下一年可达两千万。首要添加点来自于图数据库,现在已与多家大型银行在谈协作。

虽然图核算及图数据具有功能优势及宽广的商场空间,但要落地仍然面对技能及商业形式上的难点。

关于图数据来说,图数据要完成大规模运用,难点首要在技能上。因为图数据的存储和剖析与传统的联系数据库不同,对数据规整性要求高,一旦数据规整性差,就会影响核算,且剖析难度会跟着剖析维度的添加而添加。

事务上,关于图核算来说,图核算对数据全面性要求高,因为会涉及到多个数据源,且数据源往往会分归于多个体系,因而数据集成是个难题,这也是一切大数据途径面对的问题。虽然图数据库产品能够在技能上确保东西的易用性,但整体来说仍是需求和谐分担不同体系的部分来合作作业,这要消耗极大的人力本钱。

别的,现在商场上图核算商场没有翻开,因为收费形式是个难点,首要在于难以对产品定价。因为客户的运用频率和重要性不完全成正比。例如,给网页做排序核算会涉及到万亿等级的网页数据处理,按数据量收钱关于客户来说费用太高;何况核算体系或许每天只运算一两次,这样也很难依照机器台数收钱,别的核算机搁置也会形成高额的运维本钱。

图数据面对的是全球的竞赛,现在公司的竞赛对手包含:

美国的TigerGraph (2012年建立,现在A轮);国内公司包含BAT,这些互联网头部公司会在内部针对自己的产品开发相应的图数据库,但这种图数据库的运用针对性较强,所以并不适用于商场上其他客户。

费马科技于2016 年 5 月取得锋瑞、青岛泰屹、金沙江和臻云基金等出资人种子出资,投后估值 8000 万;2017 年 11 月取得京东金融 pre A 轮出资,投后估值约 1.6 亿。

公司表明,图核算在运用范畴上将从金融范畴向工业、出产制作、互联网范畴扩展;图数据现在职业上缺少规范规范,公司现在正积极参与职业规范定制,期望能够成为像传统联系数据库相同的规范数据库。现在费马的图数据库能够支撑百亿等级的节点,适用于商场上绝大部分客户,但在未来假如涉及到超大规模数据的话,或许需求分布式数据库,公司现在也处于研制阶段。

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!