SequoiaDB从「多模数据湖」、「实时数据湖」发展到「湖仓一体」架构,为客户提供「数据核心」所需的全量数据存储,实时对客服务,及基于统一数据源的分析能力,充分激活客户的离线数据。当中,数据入湖的时效性直接影响整体数据应用效果,巨杉数据库通过对接业界主流的Flink,Spark和Storm等主流的流式框架,实现实时生产数据的高速入湖,原汁原味的将数据保留在巨杉数据库中。SequoiaDB是巨杉数据库通过10年的不断迭代,从多模数据湖架构演进出来的“湖仓一体”架构产品。SequoiaDB的“湖仓一体”结合了数据湖与数据仓库,是一个融合的基础设施环境,支持从原始数据到精炼数据的整个过程,并最终提供优化后的数据以供消费。
秒级数据入湖
从客户的结构化数据需求出发,巨杉众多的金融客户着眼于盘活海量的历史存量数据,并同时卸载发生在传统Oracle/DB2上的业务。因此,巨杉依托自研的SequoiaDB分布式数据库,形成了历史数据平台的方案。从业务的角度出发,SequoiaDB通过高性能的连接器,对接包括Flink,Spark和Storm等主流的流式框架,实现实时生产数据的高速入湖,原汁原味的将数据保留在巨杉数据库中。这里起到的作用有点像数仓模型中的ODS层,但巨杉又利用其分布式数据库高并发访问的能力,可以直接对外提供实时数据访问服务。
鉴于SequoiaDB多副本高可用的特性,很多用户实际上把巨杉数据库作为全系统数据的全量最终存储。在部署实践里,前端操作型数据库产生的数据变更在通过ogg/CDC等工具抽取后,通过批量的方式load到巨杉数据库中;或是加载到以kafka为代表的各类消息队列,再通过流式引擎写入巨杉数据库中。流式和批量数据汇总加工整合即可对外提供服务,根据业务需要,实时入湖的数据从业务实际发生到在巨杉中提供访问服务时延在秒级。
上图有两个核心技术点需要关注。一是数据入库链路,从架构中可以很清晰的看到通过流和批两条数据链路,这是当前比较成熟的一个典型的Lambda架构。为了尽可能的高效接收来自不同数据源的数据,SequoiaDB开发了Spark connector和Flink connector等多种通用数据格式的解析器,打通实现了高可靠的数据链路,支持增删改各类操作,并在客户场景中解决exactly once数据入库问题。
其次是随着巨杉数据库在业务系统的深入,很多用户发现把数据从取出,做ETL,加载到DW层再做完各类统计分析汇总时,会存在以下问题:
1.时延较高,无法满足实时分析的需求
2.搬迁复制数据成本高,数据要在不同条件下保存多份,还要开发大量的工具
3.传统数仓模型不能很好的适应业务变更,需要的专业技能门槛也很高
所以部分客户开始跟巨杉一起探讨直接在海量数据湖上做数据转换和分析的可能,也就形成了现在巨杉数据库的“湖仓一体”架构。
流式数据加工
针对客户提出的流式数据加工处理,以及未来越来越多的实时分析场景,SequoiaDB在结合Spark Streaming和对接Flink后,提供简单易用的数据加载工具和列存的数据加载功能。SequoiaDB还开发了行存数据到列存数据的自动化转换工具,客户只需要基于需求简单配置需要转换分析的表,就可以实现实时增量数据同步转换,极大的方便简化数据加工师和分析师的工作。总的来说,客户可以在一个SequoiaDB平台实现低延时的数据入库,高并发的即时数据查询,几乎透明的行列数据转换,以及高性能的数据加工分析能力。
结语
SequoiaDB通过对接业界主流的流式框架,实现了多源数据的快速入湖。未来,巨杉数据库将继续不断创新,打造更加安全、稳定、可靠的数据库系统,持续助力金融行业客户信息化创新,释放全量数据价值。
责任编辑:kj005
北京超算“名”“利”双收,超算商业化已经来临
少年志智未来 iEnglish2020用户年度盛典在京落幕
美国“毅力”号火星车发射升空 探索矿物、寻找生命迹象
无人机技术将重新定义城市规划 塑造智慧城市的方式
SequoiaDB从「多模数据湖」、「实时数据湖」发展到「湖仓一体」架构,为客户提供「数据核心」所需的全量...
面对数据量井喷、业务融合多样化等挑战,出于数据库与数据库之间的不兼容,为了避免复杂操作性、有效降...
10月10日,VR品牌PICO发布《运动,不留借口!》主题视频,并正式宣布拳王邹市明、健身达人帕梅拉担任PIC...
清朝乾隆十年,贵州总督张广泗经乾隆御批开修赤水河,方使赤水河上游古朴神秘的茅台镇酒冠黔人国,盐登...
时光流逝,理想如斯在这个9月,小羊驼5岁啦从2017到2022从0到1的起步,从1到100的跨越5个周期的春去秋来...
当知名辩手、家居达人、网红博主以及脱口秀演员,这些不同领域内的达人坐在一起,直播揭秘心中理想型,...
近日,戴森推出最新无绳吸尘器——G5 Detect,实现了技术的颠覆式革新。而命名中就带着代际革新意味的...
信用卡逾期收到法院起诉警告函怎么办信用卡逾期之后,若收到法院起诉警告函的话,那持卡人就一定要想办...
摘要:九芯净水品牌成立16周年,创始人吴联星表示,愿为百年净水工程奋斗终身。随着人们健康意识的不断...
根据国务院发展研究中心的定义,数字化转型是指利用新一代信息技术,构建数据的采集、传输、存储、处理...
很多时候,当人们去医院检查却被医生临时通知要住院时,免不了需要准备一些住院需要用到的生活物品,或...
近日,「第十三届中国优秀数据中心峰会」暨中国计算机用户协会数据中心分会第28届年会于北京拉开帷幕,...
10月10日上午,由御百氏(贵州)天然矿泉水有限公司生产的‘天书谷’矿泉水现身在国家生态环...
今天(10月10日)恰逢"世界居室卫生日",那么国人家庭居室卫生的"死角"究竟在哪里?"厨房"仍然是国人家...
2022年10月10日,宁波新芝生物科技股份有限公司正式在北京证券交易所挂牌上市,至此,本次北交所IPO之旅...
随着岁月的流逝以及自身护肤知识的增多,现在大家在护肤品的选择思路上也和以往大有不同了。抗老精华液哪...
秋天是丰收的季节,这不,一年一度的收参季又到了。人参被人们称为百草之王,除了有神功,它还很娇气,...
引言:9月17日-20日,正值世界骑行日-World Cycling Day,20位医美精英缘聚洱海,共同见证了乳酸的力量,以...
以前卡里面的钱用完了,交燃气费只能去线下营业厅,如果太晚还只能熬到第二天营业厅上班才能去充值,现...
在刚刚过去的国庆假期,新茶饮市场持续火热,喜茶发布的数据显示,相比节前,部分门店在国庆期间销量增...
随着技术与互联网生态的飞速发展,移动支付已然成为了主流的生活方式之一。作为移动支付领域的先行者,...
华尔顿,国内厨电企业排行中始终处于前列的老牌企业。成立三十载,它始终保持突围劲头,持续关注用户日...
刚做外汇黄金交易的朋友都知道,如果我们想获取交易利润,那首先要学会顺势而为,可是往往搞不清楚顺哪...
全球汽车加速向电动化转型背景下,动力电池掀起了全球产能布局新一轮竞赛。国内来看,除了宁德时代、亿...
是否及时开展供热企业用电检查?是否扎实开展线路巡视,及时消除设备隐患?自10月10日起,国网泰来县供电分...
经济观察网 余诗琪 文 成立近3年的百度健康团队,继官宣升级成为百度大健康事业群组之后(百度集团第...
换季时节,气温忽冷忽热,流感也开始蠢蠢欲动。一些体质比较弱的人,稍不注意,就容易被它钻空子。而且...
过去,用户买东西主要为产品本身价值买单,在商品功能相同的情况下,买最便宜的。现在,人群对消费的追...
10月10日,作为2022年卡塔尔世界杯的官方赞助商,蒙牛集团发布了12款世界杯历史系列包装,并推出主题TVC广...
近日,郑州市金水区大石桥办事处巡防队员对辖区各路段巡逻时发现一个黑色手提包被车主遗忘在电动车上,...
未知物第三方检测机构,主要可为企业承接多种材质与产品的检测项目。挪亚未知物第三方检测机构可提供(包...
9月6日,中央全面深化改革委员会第二十七次会议召开,会议上提到的新型举国体制受到广泛关注。近年来,...
获奖作品公示脑中风是人类健康的第一杀手,在我国,每12秒钟就有1位中风新发患者,每21秒就有1人死于中...