概述说明
自助数据集支持跨库查询,当用户查询数据的范围比较广,并不限于一个数据库时,可以跨多个数据库进行查询。
实现跨库查询的前提条件:保证系统中的“跨库联合数据源”和“高速缓存数据库”有效,且进行跨库查询的数据库已经同步到跨库联合数据源中。
目前支持做跨库的数据源类型包括:高速缓存库、Hadoop_Hive、星环、Vertica、CH、Greenplum、Infobright、Oracle、DB2 V9、MySQL、MS SQL Server、Spark SQL、Teradata_v12、Informix、IMPALA、PostgreSQL。
示例分析
业务需求描述
某企业的生产部门和销售部门有各自的数据信息存储库,现在公司上层要求结合库存数据和销售数据进行综合分析。具体要求有:
1、各个地区的销售情况,主要通过销售额数据体现,并且能够对区域进行下钻,查看下级省份和城市的销售情况。
2、不同类别的产品库存情况。
3、不同类别的产品在各个地区的订购量情况。
4、不同类别的产品销售情况,主要通过销售额数据体现,通过产品类别选择查看所属产品的销售情况。
需求及数据分析
由于生产部门和销售部门的数据分别存储在不同的数据库:生产部门的数据存储在基于Oracle数据库的“Stock”数据源中,销售部门的数据存储在基于MySQL数据库的“Sales”数据源中。
因此该综合分析需要进行跨库查询,创建一个跨库数据集,并可以用该数据集设计一个自助仪表盘。