第205页,共487页。 显示 4,865 条结果 (0.26 秒)
宕机/慢问题跟踪以及信息采集
服务器内存配置的比较小,需要参照基本的服务器要求:系统环境要求 https://history.wiki.smartbi.com.cn/pages/viewpage.action?pageId=35750004 调整服务器内存大小 应用服务器JVM参数配置 https://wiki.smartbi.com.cn/pages … 环境。 需要看是否有加jvm参数-Djava.awt.headless=true,若没有,需添加此参数,wiki:使用Linux系统部署的Smatbi服务突然无法启动或进程消失 2、查询星环数据库导致java进程消失。 添加jvm参数-DANTLR_DO_NOT_EXIT=true,wiki数据挖掘-正则表达式
概述 在处理文本过程中,经常会使用正则表达式去处理,目前ETL正则处理文本功能较弱,多个ETL项目中均有实施人员提到希望增强该功能。 image2023-1-29_13-57-9.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出正则表达式处理后的结果。 参数设置 设置正则表达式处理的参数: image2023-1-29_13-58-56.png 设置说明如下: 参数 说明 选择列 要进行正则表达式处理的列。 正则表达式 要匹配的正则表达式。 输出方式 匹配数据挖掘-去除重复值
概述 去除重复值是用于删除数据集中的重复行(假如有两行相同,保留其中一行)。 image2020-5-29 14:4:51.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出去除重复值的结果。 参数设置 设置去除重复值的参数: image2021-9-23_15-33-52.png 设置说明如下: 参数 说明 选择列 用于选择进行去除重复值设置的列: image2021-9-23_15-34-14.png 示例 1、原先关系数据源的输出结果有12条数据,对其进行去除数据挖掘-排序
概述 排序节点可实现对单个字段或多个字段组合的升序或降序排序。 image2020-5-29 15:34:25.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出排序的结果。 参数设置 设置排序的参数: image2020-5-29 15:35:36.png 设置说明如下: 参数 说明 排序 用于选择排序字段及排序优先级: image2020-5-29 15:36:42.png 1、添加排序:添加排序字段,可单选或多选排序列。 当选择多列时,平台会根据选择的第一列进行排序数据挖掘-正则表达式
概述 在处理文本过程中,经常会使用正则表达式去处理,目前ETL正则处理文本功能较弱,多个ETL项目中均有实施人员提到希望增强该功能。 image2023-1-29_13-57-9.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出正则表达式处理后的结果。 参数设置 设置正则表达式处理的参数: image2023-1-29_13-58-56.png 设置说明如下: 参数 说明 选择列 要进行正则表达式处理的列。 正则表达式 要匹配的正则表达式。 输出方式 匹配数据挖掘-日期时间
概述 用户在录入日期类型数据时,经常会遇到日期格式不统一的问题。 image2023-1-29_14-9-3.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出日期时间处理后的结果。 参数设置 设置日期时间处理的参数: image2023-1-29_14-9-56.png 设置说明如下: 参数 说明 选择列 要进行日期时间处理的列。 新增列后缀 输出结果的列名后缀。 输入字段格式 输入字段的日期时间格式 输出字段格式 处理后输出字段的日期时间格式数据挖掘-去除重复值
概述 去除重复值是用于删除数据集中的重复行(假如有两行相同,保留其中一行)。 image2020-5-29 14:4:51.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出去除重复值的结果。 参数设置 设置去除重复值的参数: image2021-9-23_15-33-52.png 设置说明如下: 参数 说明 选择列 用于选择进行去除重复值设置的列: image2021-9-23_15-34-14.png 示例 1、原先关系数据源的输出结果有12条数据,对其进行去除数据挖掘-排序
概述 排序节点可实现对单个字段或多个字段组合的升序或降序排序。 image2020-5-29 15:34:25.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出排序的结果。 参数设置 设置排序的参数: image2020-5-29 15:35:36.png 设置说明如下: 参数 说明 排序 用于选择排序字段及排序优先级: image2020-5-29 15:36:42.png 1、添加排序:添加排序字段,可单选或多选排序列。 当选择多列时,平台会根据选择的第一列进行排序数据挖掘-列选择
概述 列选择节点用于从输入数据集中选取指定的数据字段。 常用于数据集中字段过多,对分析结果无用,而又影响分析效率的情况。 image2020-5-21 16:31:1.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出列选择的结果。 参数设置 设置列选择的参数: image2020-5-21 14:5:14.png 设置说明如下: 参数 说明 选择输出列 用于选择通过输入端口连接的前置节点资源输出的数据集的列: 2022-02-11_15-08-46.png 示例可选资源区
列出了所有可被“可视化数据集”使用的资源。用户只需将各资源拖到相应的区域,如将表中的字段拖拽到字段区。 可视化数据集可以基于数据源或是业务主题来创建,基于不同的来源其可选的资源是不同的。 基于数据源的可选资源包含:表字段、计算字段、过滤器、业务视图字段、参数、数据源相关业务主题的业务属性、函数、用户属性、其他数据集的字段。 基于业务主题的可选资源包含:业务主题的业务属性、过滤器、函数、用户属性、参数。 这些可选资源一般都是全局资源,都是在数据源或是业务主题或是公共参数等创建好的资源,直接拖拽到各个区域使用。 我们可以用该区最下方的搜索引擎对相关资源快速搜索定位。可以在搜索区输入所需字段的真名或是别名进行模糊搜索