奇点云数据云重磅发布构建企业新一代数据基础设施

时间: 2025-11-24 13:43:04 |   作者: 南宫注册入口官网注册

  ,旨在为企业构建统一、开放、中立、安全的数据基础设施,封装复杂技术,降低数据管理与资源成本,高效沉淀数据资产,助力企业充分激发数据要素潜能。

  本文将着重介绍StartDT Data Cloud中产品的最新功能和最新特性。

  · 基础引擎层:数据存算引擎DataKun、数据安全引擎DataBlack

  DataSimba是StartDT Data Cloud的核心,由7个域支撑数据集成、研发、运维、服务、治理等全链路功能,构建企业自有的数据生产力。

  数据开发、数据运维、数据分析师、算法工程师等多类型用户,都能依托DataSimba这个一站式的数据云平台,高效完成数据相关工作。

  其中,“云原生”指DataSimba具备微服务、容器化编排、存算分离、CI/CD等云原生技术特性,为企业降低数据应用在云上的存算成本,提升研发效率。

  “跨平台”则指公司能够使用统一的账号权限体系,对多个IaaS云基础设施、多个Workspace(域)来管理,实现分级多域、跨云跨平台部署,提升协作与管控效率。

  继“上云”之后,“多云”也已成为不争的趋势。Flexera 2021年的云状态报告(2021 State of the Cloud Report)显示,92%的受访企业在IT架构上选择多云战略,企业平均会使用2.6朵公有云+2.7朵私有云。

  DataSimba的“跨平台”和“云原生”正是为此而生——DataSimba支持海内外9大主流云厂商的云原生,并可横跨多云,统一账号、权限、审计的多Workspace的兼容管理。

  奇点云合伙人、CTO地雷表示:“我们的云原生不是单一云厂商的云原生,而是‘客户的云原生’,支持客户做出自主选择。”

  目前,DataSimba已迭代至4.0版本。在过去一年里,DataSimba每天帮助客户进行千亿行数据存算,作业量增长了30倍,Workspace数增长了33倍。

  DataSimba向上搭载“效率工具层”,即数据服务工具箱Simba Toolkits。它包含多种数据服务工具,沉淀自数据资产研发的实际场景,内置科学的数据工程方法论,专为帮助工程师提升开发效率而生。

  “这1年来,客户除了会和我们的行业专家共创,如何用数据赋能业务、降本增效,另一类问题的出现频率也慢慢变得高,例如,如何为我们的工程师‘解放双手’?”地雷介绍,“以四大工厂为代表产品的数据服务工具箱,就能很好地解决其中大部分问题。”

  集成了成熟的数据建模方法论,沉淀了各行业差异化的数据标准,帮企业全面高效地完成数仓规划和数据标准的落地,并进一步创建标准的数据模型与统一、无二义的指标体系,助力企业实现数据资产化。

  聚焦标签开发场景,沉淀自奇点云在泛零售领域的多年实践深耕,内置OEET(Object-Entity-Event-Tag)方法论,助力企业快速搭建自有的标签类目体系,沉淀标签数据资产。

  客户可用低代码的方式开发弹性标签,易用低门槛地实现个性化标签配置,解耦低频数据开发和高频业务运营需求,以此来实现高价值的数据应用共享和复用,驱动个性化运营。

  采用低代码方式配置生成API,支持混合编排复杂场景,帮企业快速完成数据接口的配置和全生命周期管理,让数据高效、安全地得到使用。

  作为面向算法应用开发者的工程平台,提供数据采集、IDE开发、在线服务等机器学习全流程。从模型开发、模型训练,到模型部署,一站式完成算法应用场景;内置预测、推荐、人群聚类等多种模型,无需开发,开箱即用。

  上述工具已在客户场景中广泛实践,实际提效也得到印证。以SimbaMetric指标工厂为例,在一家制造业集团客户的实践中,数据团队的规范化数据建模效率提升了50%,数据开发和治理的成本也有所降低。

  DataKun位于数据云的基础引擎层,支持各类型大数据Job和Service的计算与存储,帮企业构建智能化、轻量级的大数据基础平台,快速建立其自有的大数据分析处理能力。

  越来越多的公司开始追求数据能力的自主可控、可持续,竭力避免与单一选择强绑定。这不仅体现在“多云”趋势上,也体现在数据存算引擎的倾向上。

  什么是自主可控?奇点云创始人、CEO行在谈道,“数据存算引擎一定要兼容整个生态和社区,能够持续升级,给客户用最新、最好的。客户自己要能够掌握,而不是问题出现时只能抱着黑匣子傻等。我们全力支持客户自主选择,而不受任何迁移阻力限制。在这之中,也包含着对‘国产替代’的要求,关键技术国产化,是DT时代中国公司发展的必然选择。”

  “开放的,可替换,可迭代,可掌握”,这12个字构成了奇点云对自主可控的理解,也是企业验证数据存算引擎自主可控的金标准。

  因此,DataKun支持开源组件与自定义组件,提供预置最佳实践版本组合,支撑客户数据基础设施自主选择,并保证对关键节点的持续更新,实现“技术可控”;支持数据基础设施的平滑迁移、存算分离,大大降低License费用和存储成本,实现“成本可控”;同时,兼容国产芯片和软件,在全信创环境下稳定运行,保障自主可控。

  DataBlack是数据安全引擎,脱胎于企业合规审计、安全分享等需求,与数据存算引擎DataKun共同保障企业数据云的安全可控。

  区别于传统的网络安全和信息安全,数据安全的目标是保障数据资产的保密性、完整性、可用性。企业如果仅有以抵御网络攻击为中心的安全策略,已不足以满足DT时代的安全管理要求。

  为此,奇点云发布DataBlack,它遵循以数据为中心的安全架构设计理念,覆盖了企业从数据采集、传输、存储、应用、共享到销毁的全生命周期,支撑企业完成事前、事中、事后的全场景全链路管控,强化企业数据安全治理能力与风险防御能力。

  DataBlack基于数据安全的事前识别、事中管控和事后审计的全场景进行建设和保障:

  事前阶段,通过规则和智能识别对数据来进行扫描,找出平台上的敏感数据,完成分级分类;通过数据脱敏和数据加密等功能,对数据来进行管控;

  事中阶段,提供动态脱敏、风险识别和权限管控功能,精细化地管控数据使用场景,降低数据被滥用和误用的风险;

  事后阶段,通过数据审计功能,可有效地监控平台内敏感数据分布及用户使用行为,满足合规要求。

  目前,DataBlack已在多个客户场景落地,每天保护数据百亿行。以事中管控为例,在一家车企,持有权限的某员工曾在凌晨试图批量下载订单数据,DataBlack监控到异常,引发智能告警,成功拦截了这起违规事件。

  为了可信可控的数据未来,DataBlack将不断进化,坚持为数据资产安全保驾护航。

  统一、开放、中立、安全的特征,使数据云能够真正胜任“企业数据基础设施”这一重要职责——解决多云多引擎管理难、运维成本高等问题,消解复杂度,高效便捷地响应各种数据需求,帮企业实现数据资产的自主可控,让数据要素真正发挥价值。