当下,大数据在企业经营管理中的广度和深度不断拓展,企业都在积极探索数据背后的价值。在复杂的商业环境下,顺势而为、“提升数据价值,发展数据智能”成为企业重新塑造自我信心的重要一环。企业的敏捷性,来源于其数据的高效利用率和灵活部署能力,而后者又可以适应这不断变化的商业契机,抓住机遇,助力企业战略转型。
“数字化转型”概念的提出颠覆了企业组织流程、内部层次架构和业务流转的固有模式,企业在运营和生产过程中,涌现出越来越多的实时决策场景,数据驱动的业务和决策应用也开始逐渐渗透到企业的各个业务线和部门。在此背景下,数据平台从IOE时代逐步演进到大数据湖仓一体架构,不难看出企业在这一趋势下一路向前,从被动接受到主动迎接,从业务层面到战略转型,它无疑成了推动技术进步的重要因素。
滴普科技深耕以机器学习+湖仓一体的新一代数据智能基础设施建设,明确“云上优先”战略,从战略到产品,进行了一轮全新的能力聚焦与升级,经历超过上百PB级数据的综合测试与商业实践,完成了核心产品FastData实时湖仓平台的重大迭代升级。
FastData 2.0重新定义湖仓
滴普科技FastData 2.0基于现代数据技术栈实践思路,打通从了数据源集成、数据分析,再到数据价值实现的完整链路;以云原生、实时高处理性能、低运维成本、操作和体验更优的产品特性,帮助企业建立统一治理、流批一体、湖仓一体的云原生数据智能平台,实现海量数据实时分析,致力于成为支撑企业数字化转型的核心基础软件设施。
批流融合及全链路CDC需要同时满足实时和批量的数据处理能力,降低企业维护的成本和复杂性,扩大最佳的资源使用效能;需要满足全链路CDC,端到端实现从数据源到湖仓数据的增量分析,兼备实时数据分析的全面性和准确性。
事务ACID一致性需要提供ACID保证数据写入一致性;提供快照保证读写的并发;提供upsert/merge into能力极大地缩小数据库入库延迟。对象存储不支持文件原地更新,新的记录以 append 的方式写入新文件,即使对文件中的一行记录进行更改,也要重写整个文件,并且多线程并发读写也可能造成数据不一致。湖仓一体通过多版本的方式保证事务读写并发不冲突,通过将修改记录在 change file 中通过合并 base 文件的方式提升记录更改效率。
DataOps提供数据统一服务、数据沙箱、数据开发、代码版本管理、CI/CD、工程化运维的流程化和自动化。
统一元数据管理支持异构数据的统一元数据管理,实现端到端的数据链路的自动化元数据采集,支持全链路血缘,一键式分析技术、业务、操作元数据详情,为数据标准建设和数据质量提供重要支撑。湖仓一体中的 Catalog 是统一的元数据目录,它可以帮助我们让数据发现变的更简单,更加快速的查找到你想要的数据,同时提供面向多引擎(Hive Spark flinktrino 等)的公共元数据存储和统一元数据服务。
基于云原生架构,与主流云厂商深度连接,提供基于多云架构的统一数据平台,帮助企业以最优成本、最敏捷的方式搭建数据资产和数据分析的全链路,更加精细化实现数据价值。FastData 2.0面向企业高密度数据应用场景,立足数据驱动业务,围绕提升客户业务价值的核心目标,将湖仓一体作为产品升级迭代的核心架构,同时全面整合了从数据源、数据分析到数据价值实现的完整链路,对产品能力进行了全面深入的升级优化。
从产品形态与服务上来看,产品可实主流公有云环境的灵活部署,包括AWS、Azure、华为云、阿里云等云上环境;提供实时湖仓引擎,将结构化、非/半结构化源数据存储到数据湖中,调动分析引擎进行数据计算,最终将计算数据存储到湖仓的表引擎中;此外,FastData还重点拓展了支持机器学习的数据智能开发能力,并将湖仓中的数据通过可视化技术将业务运维要求实时反映出来,真正帮助企业用好数据,高效释放数据价值,驱动企业业务的发展。
FastData 2.0产品线全面升级
升级后的FastData2.0,从底层的实时湖仓引擎DLink,到中间Dataops的数据智能开发平台DataFacts,再到上层面向商业应用及数据应用的数据分析平台DataSense,已形成完整的湖仓体系。
解决数据存储、处理及分析效率——实时湖仓引擎FastDataDLink
搭建企业级流批一体、湖仓一体分布式数据库,提供多种数据类型的统一存储能力,支持流批一体数据处理、数据分析、数据科学等多工作负载。采用存算分离架构,弹性扩展、高并发、低延时,支持EB级多模数据存储与处理,无缝连接大数据生态,提供一站式数据探索与数据开发能力。
解决数据开发效率及数据管理问题——数据智能开发平台FastDataDataFacts
降低企业数字化转型实施门槛,实现数据价值可持续释放,为数据工程师提供数据集成、数据建模、数据开发、数据服务、数据质量、数据安全等开箱即用的服务能力,降低企业数字化转型实施门槛,提升数据智能平台构建效率,赋能企业数据资产持续沉淀,从而实现数据价值可持续释放。
解决“数据最后一公里”——数据分析平台FastDataDataSense
用数据透视业务,助力精准决策。DataSense是基于统一业务语义的数据分析平台,通过无代码开发的数据工厂Metric Store提升资产开发效率,为企业各类业务应用提供组装式的数据分析服务能力。
致力于打造更加坚实灵活的湖仓一体,存算分离数据平台底座,是FastData 2.0的全线产品升级的目标。支持同时满足实时和批量的数据处理能力,实现数据智能开发与可视化增强分析,帮助企业以最优成本、最敏捷的方式搭建数据资产和数据分析的全链路,更加精细化实现数据价值。滴普科技产品线总裁杨磊表示:“客户的核心逻辑都是基于业务考虑,在这个过程中,如何打通数据链路,持续优化企业内部的运营效率,是核心关注点”。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com