第89页,共606页。 显示 6,060 条结果 (0.136 秒)
抽取数据到动态表(表名不是固定的)
1. 应用场景 数据需要按天存储,每天数据需要存放在当天的日期后缀表中。 2. 实现思路 定义公共参数获取当前日期。 在etl 中定义一个etl 参数引用公共参数。 etl 中把当天的数据覆盖的方式写入到一张临时表。 在目标表(覆盖) 节点的执行后sql 中,根据这张临时表创建当天日期后缀表,日期后缀通过参数进行替换,然后把临时表数据写入到当天日期后缀表。 3. 操作步骤 3.1 定义公共参数获取当前日期 在“运维设置 → 全局资源定义 → 参数定义"中创建一个当前日期的参数。 image2024-12-5_16-9-30.png 注意:数据类型应为其它类型ETL通过公共参数和in关键字过滤数据
1. 应用场景 在ETL的数据查询或者关系数据源中使用in关键字进行参数过滤。 select * from `cars` where `type` in ('德系','法系','韩系','美系','日系','自主') 2. 实现思路 1、定义公共参数public_param,设置参数默认值和备选值。注意:尽管参数值可以设置很多,但是这里建议加上limit,避免参数值过多。 image2024-8-29_13-48-9.png 2、新建ETL,并定义参数etl_param,并设置类型为参数,参数定义为public_param 3、拖拽数据查询或者关系数据源节点,在where部分添加:列 in (${etl_param数据挖掘 - CBLOF
概述 CBLOF(Cluster-Based Local Outlier Factor,基于聚类的本地异常因子)是一个异常检测节点,原理是先用聚类算法把为数据分为K个簇,而后通过设定占比阈值和突降倍数阈值,把簇区分为大簇和小簇,聚类完成后,计算每个点到最邻近大簇的距离(邻近距离),邻近距离越大的数据点为异常数据的概率越大。 CBLOF算法适用于当没有已知正常的数据时,对所有输入的新数据进行异常值的辨别。 输入/输出 输入 一个输入端口,接收要异常检测的数据 输出 一个输出端口,用于输出检测后的结果 参数设置 参数名称 说明 备注 选择特征列数据挖掘 - CBLOF
概述 CBLOF(Cluster-Based Local Outlier Factor,基于聚类的本地异常因子)是一个异常检测节点,原理是先用聚类算法把为数据分为K个簇,而后通过设定占比阈值和突降倍数阈值,把簇区分为大簇和小簇,聚类完成后,计算每个点到最邻近大簇的距离(邻近距离),邻近距离越大的数据点为异常数据的概率越大。 CBLOF算法适用于当没有已知正常的数据时,对所有输入的新数据进行异常值的辨别。 输入/输出 输入 一个输入端口,接收要异常检测的数据 输出 一个输出端口,用于输出检测后的结果 参数设置 参数名称 说明 备注 选择特征列数据权限设置—透视分析
透视分析是基于即席查询和数据集定义来定制的。如果要透视分析的数据权限也生效,则需对其数据来源进行数据权限设置,具体如下: 来源 说明 示例 基于即席查询 对即席查询设置好数据权限后,则透视分析也会生效。 即席查询 基于可视化数据集 对可视化数据集依赖的数据源和业务主题设置好数据权限后,则透视分析也会生效。 基于数据集的资源 基于SQL数据集/原生SQL数据集 需要在对应的SQL语句中手动添加条件。 SQL/原生SQL数据集数据权限 如需使用“SQL数据集、原生SQL数据集或可视化数据集”,需更换一个包含"SQL数据集、原生SQL数据权限设置—透视分析
透视分析是基于即席查询和数据集定义来定制的。如果要透视分析的数据权限也生效,则需对其数据来源进行数据权限设置,具体如下: 来源 说明 示例 基于即席查询 对即席查询设置好数据权限后,则透视分析也会生效。 即席查询 基于可视化数据集 对可视化数据集依赖的数据源和业务主题设置好数据权限后,则透视分析也会生效。 基于数据集的资源 基于SQL数据集/原生SQL数据集 需要在对应的SQL语句中手动添加条件。 SQL/原生SQL数据集数据权限 如需使用“SQL数据集、原生SQL数据集或可视化数据集”,需更换一个包含"SQL数据集、原生SQL数据挖掘-功能使用
Smartbi Mining具有强大的数据挖掘功能,不仅具有良好的拓展性,并且还有很多实用小工具提升实验效率,进入数据挖掘界面主要分为实验界面和主界面: 模块 说明 实验界面 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=51940535 针对实验管理界面的各个按钮进行介绍。 主界面 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=51942649 挖掘实验的各种运维管理界面介绍 实验界面是构建数据挖掘实验中使用最多,该页面除了一些工具按钮,参数面板等,主要的还是数据挖掘-功能使用
Smartbi Mining具有强大的数据挖掘功能,不仅具有良好的拓展性,并且还有很多实用小工具提升实验效率,进入数据挖掘界面主要分为实验界面和主界面: 模块 说明 实验界面 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=51940535 针对实验管理界面的各个按钮进行介绍。 主界面 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=51942649 挖掘实验的各种运维管理界面介绍 实验界面是构建数据挖掘实验中使用最多,该页面除了一些工具按钮,参数面板等,主要的还是数据挖掘-标准化
概述 标准化数据使数据具有单位标准差归一化或平均数据中心化。 单位标准差归一化:将输入数据进行单位标准差归一化,使转换后的数据具有单位标准差; 平均数据中心化:将输入数据进行中心化,使转换后的数据均值为0。 如果某个特征的标准差为0,则该特征的返回结果也为0。 输入/输出 … 数据减去均值再除以标准差 勾选则将输出入据进行单位标准差归一化 平均数据中心化 数据减去均值 勾选则将数据进行中心化 示例 使用“鸢尾花数据”,特征选择4个特征列,勾选单位标准差归一化,输出结果如下图: image2020-6-4 10_7_49.png 标准化数据挖掘-标准化
概述 标准化数据使数据具有单位标准差归一化或平均数据中心化。 单位标准差归一化:将输入数据进行单位标准差归一化,使转换后的数据具有单位标准差; 平均数据中心化:将输入数据进行中心化,使转换后的数据均值为0。 如果某个特征的标准差为0,则该特征的返回结果也为0。 输入/输出 … 数据减去均值再除以标准差 勾选则将输出入据进行单位标准差归一化 平均数据中心化 数据减去均值 勾选则将数据进行中心化 示例 使用“鸢尾花数据”,特征选择4个特征列,勾选单位标准差归一化,输出结果如下图: image2020-6-4 10_7_49.png 标准化