目录 |
---|
...
为了简化数据库表的迁移操作,使项目实施流程标准化,降低项目实施门槛,提高项目实施效率。产品中提供了ETL自动化工具,它能够基于简单的模板配置,自动生成自助ETL和物理表,用户可以执行生成的ETL实现物理表的灌数操作。同时,它还允许用户手动修改对应的Excel规则模板,实现更细致的配置。
它主要用来解决ETL操作中比较简单但繁琐的贴源层数据的自动化处理,它通过简单的界面话配置操作,配置源库和贴源层的表和字段的关系,自动创建ETL流程,简化繁琐的操作。
功能入口
入口一:在 数据准备 > 自助ETL 中,选择 ETL自动化。
...
入口:在“数据准备“界面左侧资源树的“ETL自动化”节点上,右键选择 新建 > ETL自动化。
...
操作流程
ETL自动化工程的操作流程如下:
各流程节点的说明如下:
- 新建ETL自动化:指创建新建ETL自动化,入口参见:功能入口。
- 配置模板:用于配置及下载Excel模板。详情请参见:配置模板。
- 上传模板:用于上传配置及下载好的Excel模板。详情请参见:上传模板。
- 保存:用于自动生成保存自助ETL的目录。详情请参见:保存。
- 校验Excel:按照内置规则校验Excel模板内容。详情请参见:校验Excel。
- 执行自动化生成:自动生成自助ETL,并且执行该ETL生成相应的物理表。详情请参见:执行自动化生成。
操作详情
下面以示例的方式对操作详情进行说明。
配置模板
1、在“新建ETL自动化”界面单击 下载源数据信息 按钮:
2、弹出“下载源数据信息”窗口,在该窗口中进行模板配置:
该窗口中各配置项说明如下:
配置项 | 说明 |
---|---|
来源数据源 | 选择需要迁移的数据库表,该项一确定后,“库表列表”则列表出所选库下的所有表。 |
目标数据源 | 选择数据库表迁移的目标库。 |
目标表命名规则 ETL资源命名规则 | 用于分别设置目标表或ETL资源的命名规则,支持前缀或后缀。 要求:只能输入1~20个字符,可使用数字,字母和下划线或者它们的组合,需以字母开头,后缀不能以下划线结尾。 需要单击 高级设置,才显示该设置顶。 这两项设置完后,单击 应用 按钮,命名效果即显示在“源表名称”、“目标表名称”、“ETL资源名称”。 |
源表名称 目标表名称 ETL资源名称 | 命名规则应用后,显示的命名效果。 |
库表列表 | 显示用户所选的来源数据源的库表列表,支持通过表名关键字搜索。 |
来源表与目标表的映射关系列表 | 显示来源数据源中库表字段与目标数据源库表字段的映射关系。 |
3、以上配置完成后,单击右下角 下载 按钮,将配置好的内容以Excel模板的介质存储到本地。示例文件如下:
Excel中各主要标签页说明如下:
标签页 | 说明 |
---|---|
系统清单 | 列举所有数据源(来源、目标)的名称、数据库信息等 |
变量与参数 | 为了简化表述而使用的变量或参数。该表可以为空 |
目标系统数据字典 | 以 数据源 → schema → 表名 → 字段的结构排列 列举目标数据源的对应目标表中所有写入的字段名称、字段类型、主键信息等 |
表清单 | 列举本次ETL自动化中创建的所有ETL资源,及其中分别用到的数据源和目标源信息 |
字段映射清单 | 列举来源表和目标表之间的所有字段映射关系 |
详细说明见模板中的 0-使用说明 和 模板检查规则 标签页
上传模板
将以上导出的Excel模板上传:
保存
单击右下角的 保存 按钮,弹出“保存”窗口,设置名称为“TEST”。
...
“保存”窗口单击 确定
...
,提示保存成功后,系统在“ETL自动化”节点下自动生成“TEST”目录:
校验Excel
单击右下角 校验Excel 按钮,只有校验通过才能执行下一步操作。
校验检查规则可以在模板“ExcelTemplate”中查看:
执行自动化生成
检验通过后,单击 执行自动化生成 按钮,执行最后一步操作。
该操作完成后,系统自动生成如下两类资源,实现了库表迁移:
按照规则命名的“ETL资源” | 按照规则命名的目标库表 |
---|---|
信息 | ||
---|---|---|
| ||
|
参数配置
某些场景还需要配置参数,目前参数配置有如下两个方法:
第一种:在模板上手工配置:
第二种:执行自动化生成后,在ETL资源编辑界面进行配置: