1.1 为什么需要数据模型
正如一部汽车的动力取决于引擎,同样在一个BI产品里面也有一个引擎——数据建模。
Smartbi提供的数据建模功能 数据模型 带来了“敏捷建模”的新思路,从“数据引擎”上提高数据准备效率,为上层应用(即席查询、交互仪表盘、电子表格等)输出更澎湃的“动力”,
让Smartbi成为拥有“多维建模”能力的一站式BI产品,全面提升产品的功能性和便捷性,相当于把汽车从原来的V4发动机升级到了V12发动机,这是一个质的飞跃!
接下来,我们看一下为什么需要数据模型?
1.1.1 增强“一站式”的架构能力
A客户刚接触BI平台建设,未有完善的数据集市,但是市场上的数据集市工具和BI工具是分开的,无法满足一站式BI的需求。此外,其他BI厂商虽有数据集功能来为数据展现服务,但是因为数据集本身分散、混乱等问题,难以承担“敏捷建模”的使命。
客户期望:一个产品满足完成数据处理、敏捷建模、数据分析、数据分享等BI需求
“数据集市”必不可少,却位于BI软件之外。数据模型让“多维建模”能力融入BI产品,用户无论是否有数据仓库或是ODS,只需使用Smartbi,都可以敏捷建模实现数据集市。从而使得Smartbi具备一站式BI能力,即可一站完成数据连接、数据处理、数据建模、数据分析、数据分享等全流程功能。
1.1.2 增强"数据准备”的敏捷能力
B客户是一家大型金融企业,数据仓库建设已经成熟,且是通过大宽表来实现数据集市,分析应用起来更加直观、效率更高。
但是因为宽表模式的限制,存在增删分析字段不方便、数据重复膨胀口径不一、关联计算时数据量大性能慢、宽表和业务手工Excel数据关联混合分析不方便等问题,技术人员处理起来不灵活、不敏捷。
客户期望:能够实现更加敏捷的多维建模。
受限于技术,传统“数据集市”不敏捷。在处理实际需求时,技术人员响应不快,处理不灵活,需要较长时间。
因此,Smarbi带来了“敏捷建模”的新思路:现代化BI是以自助敏捷为理念,即无论是数据分析还是建模操作,都希望更加简单敏捷。Smartbi数据模型就是通过更简单灵活的建模操作(查询过程中对用户完全透明地完成动态Cube模型的构建),让用户能更快速地响应需求、更敏捷地进行数据建模等。
1.1.3 增强“模型计算”的基础能力
小李是一家大型金融企业的数据分析师,经常要做各类业务数据的统计分析,比如要统计银行各营业部近5天购买金融产品金额超过1万的客户数。类似需求,小李都要找IT人员,通过书写复杂的二次汇总计算脚本费时费力才能勉强实现。
客户期望:让数据二次三次加工处理不再费时费力
Smartbi数据模型提供了丰富、强大的计算能力,不仅支持SQL计算、ETL分布式计算、MDX计算;还支持快速实现同环比时间计算、占比、排名、累计等;同时支持在计算中使用参数,动态获取结果。
1.1.4 整合分散的业务数据,提升关联分析的效率
小王是一名大型企业的业务员,经常要及时灵活分析业务发展情况。但是由于业务数据分散存在多个业务系统,比如:产品生产系统中的产品表(MySQL库)、订单系统的订单表(Oracle库)等,并且还有部分存储在本地Excel文件中的数据很难导入系统进行关联分析。因此导致小王业务分析效率、正确率低下,对业务指导不够及时。
客户期望:整合分散的业务数据,及时灵活的分析业务数据
Smartbi数据模型整合多种数据集类型,融合线上线下数据,包括数据源表、即席查询、SQL查询、导入文件等,并且支持跨库数据整合,可以直接连接Oracle、MySQL、Excel文件等各类数据关联分析,满足不同用户的数据准备需求,提升数据分析的效率。
1.1.5 解决“网状路径”的选择问题
对于使用Smartbi V10之前版本的用户,初始使用各种数据集进行数据准备和分析时,往往不知如何选择使用。
数据模型对Smartbi产品数据准备和数据分析之间的关系进行了重新梳理,统一了表现层和数据层,从而让表现层和数据层关系变得简单,用户一眼即可看清功能逻辑,学习和使用成本进一步降低。
1.2 数据模型特性优势
1.2.1 相比数据集优势
在传统的数据分析场景中,往往会把数据统一接入到一个数据平台,例如数据仓库。基于数据仓库,把数据开发整理成宽表形式的数据集,数据集提供数据到BI等上层分析应用,用户通过查看报表和数据应用来做业务洞察分析和开展业务决策。
这种情况下,BI 报表或应用系统的数据分散存储在各个数据集,当数据量、用户数越来越多时,数据管理会产生很大的混乱。例如指标数据在不同报表中出现数据解释歧义、数据口径不一致等。并且用户在使用时很难快速定位需要分析的指标数据存在哪张表上,数据使用的效率很低,也降低了业务用户对数据的信心。
Smartbi数据模型相较于数据集,数据管理的方式,从根本上由“表”转变成“指标”。Smartbi 数据模型,将所有查询结果归集实现数据层统一,所有的指标数据被统一管理,并且形成指标数据体系。基于维度模型以“维度”和“度量”重新构建数据结构,以多维模型为基础,提高数据处理效率与计算能力。既能满足业务多变的需求,又能避免数据冗余导致的数据表无限扩充。
1.2.2 功能特性总结
特性类别 | 特性描述 |
---|---|
一站式 | 数据模型让“多维建模”能力融入BI产品,用户无论是否有数据仓库或是ODS,只需使用Smartbi,都可以敏捷建模实现数据集市。从而使得Smartbi具备一站式BI能力,即可一站完成数据连接、数据处理、数据建模、数据分析、数据分享等全流程功能。 |
数据统一 | Smartbi数据模型整合多种数据集类型,融合线上线下数据,包括数据源表、即席查询、SQL查询、导入文件等,并且支持跨库数据整合,可以直接连接Oracle、MySQL、Excel文件等各类数据关联分析,满足不同用户的数据准备需求,提升数据分析的效率。 |
敏捷建模 | Smartbi数据模型通过更简单灵活的建模操作(查询过程中对用户完全透明地完成动态Cube模型的构建),让用户能更快速地响应需求、更敏捷地进行数据建模。 Smartbi数据模型支持拖拽等简单操作即可快速生成度量、维度层次,如一键生成时间维、设置地理维等,同时支持多种模型类型,包括星型模型、雪花模型和星座模型。 |
计算提升 | 数据模型对Smartbi产品数据准备和数据分析之间的关系进行了重新梳理,统一了表现层和数据层,统一了数据分析的计算能力,提供了丰富、强大的计算能力,不仅支持SQL计算、ETL分布式计算、MDX计算;还支持快速实现同环比时间计算、占比、排名、累计等;同时支持在计算中使用参数,动态获取结果。 |