第39页,共578页。 显示 5,778 条结果 (0.077 秒)
数据挖掘-数据清洗
概述 规范化字符串,可移除字符串中空格、标点符号、字母、数字等不必要的字符或设置大小写方式。 2021-09-03_14-54-49.png 输入/输出 输入 一个输入端口,用于接收数据源。 输出 一个输出端口,用于输出数据清洗后的结果。 参数设置 数据清洗配置: 2021-09-03_14-56-27.png 数据清洗配置界面如下: 2021-09-03_14-58-56.png 设置项说明如下: 设置项 说明 已选字段 需要进行数据清洗的字段 处理方式 对字段进行清洗,清洗方式包括移除所有空格、移除首尾空格、移除标点符号、移除数字、移除字母SQL/原生SQL数据集数据权限
基于数据源和业务主题创建的数据权限原则上对于书写的SQL语句的数据集,如SQL数据集和原生SQL数据集是不生效的。 如果对SQL数据集和原生SQL数据集实现数据权限,则需要对SQL数据集本身的where条件中直接加上限制条件。 操作入口 在“数据集”界面打开SQL数据集或是原生SQL数据集。 进入“数据集”界面的入口: 入口1:选择系统快捷菜单 数据集 。 sql数据集入口.png 双击所需的SQL数据集或原生SQL数据集或在其更多操作0.jpg,选择 打开。 qx25.jpg 如需使用“SQL数据集或原生SQL数据集”,需更换一个包含"SQL数据集或原生SQL数据集”的License授权文件。 实现方式多维数据源数据权限
多维数据源中数据权限的设置通过限制用户访问多维数据集中维成员和度量值的权限而实现。 管理角色不受数据权限控制。 对某维度层次结构或度量值设置了数据权限,在定制多维分析时若没有选择该维度成员或度量值,系统默认在MDX语句添加上过滤内容。 操作入口 在“多维数据源”的数据集的更多操作0.jpg,选择 设置数据权限,则进入“设置数据权限”界面。 image2019-8-19 11:35:16.png 界面介绍 多维数据源中数据权限界面.png “数据权限设置”界面主要分为以下几个区域: 可选资源区:该区主要列出了设置数据权限可使用的资源。 设置区:该区为设置所选维度数据权限的主要区域。系统数据挖掘-数据预处理
在数据挖掘中,海量的原始数据存在着大量不完整、不一致、有异常的数据,严重影响到数据挖掘建模的执行效率,甚至可能导致挖掘结果的偏差,所以进行数据预处理就显得尤为重要。 Smartbi拥有强大数据处理功能,对各种结构化数据,可进行排序、去重、映射、行列合并等处理,满足客户日常数据处理的需要。 使用数据预处理可以: 1、提高数据的质量。 2、让数据更好地适应特定的挖掘技术或工具。 数据预处理数据挖掘-数据预处理
在数据挖掘中,海量的原始数据存在着大量不完整、不一致、有异常的数据,严重影响到数据挖掘建模的执行效率,甚至可能导致挖掘结果的偏差,所以进行数据预处理就显得尤为重要。 Smartbi拥有强大数据处理功能,对各种结构化数据,可进行排序、去重、映射、行列合并等处理,满足客户日常数据处理的需要。 使用数据预处理可以: 1、提高数据的质量。 2、让数据更好地适应特定的挖掘技术或工具。 数据预处理关系数据源数据权限
针对关系数据源创建的数据权限。 在关系数据源中通过对查询的目标表设置数据权限,当即席查询、可视化数据集和电子表格中涉及到这个数据源的这些表时,数据权限设置条件会自动启用。 设置数据权限 1、进入数据权限设置页面。 入口一:在关系数据源的更多操作0.jpg,选择 设置数据权限,进入“设置”界面。 image2020-3-12 18:40:14.png 选择需要设置数据权限的表,在表的更多操作0.jpg,选择 设置 ,进入“数据权限设置”界面。 image2020-3-11 16:23:29.png 入口二:在关系数据源下需要设置数据权限的表中选择更多操作0.jpg,选择 设置数据权限,进入“数据权限设置”界面SQL/原生SQL数据集数据权限
基于数据源和业务主题创建的数据权限原则上对于书写的SQL语句的数据集,如SQL数据集和原生SQL数据集是不生效的。 如果对SQL数据集和原生SQL数据集实现数据权限,则需要对SQL数据集本身的where条件中直接加上限制条件。 操作入口 在“数据集”界面打开SQL数据集或是原生SQL数据集。 进入“数据集”界面的入口: 入口1:选择系统快捷菜单 数据集 。 494.png 双击所需的SQL数据集或原生SQL数据集或在其更多操作0.jpg,选择 打开。 495.png 如需使用“SQL数据集或原生SQL数据集”,需更换一个包含"SQL数据集或原生SQL数据集”的License授权文件。 实现方式 在SQL参数 - 基于带参数数据模型创建电子表格,参数默认显示全部
(仅供参考) 基于数据集模型创建的电子表格通过参数进行数据筛选时,有些情况下用户希望当不选择参数值、或选择“全部”、“所有”这样的参数值时返回所有数据。基于这样的需求,具体操作参考如下示例。 电子表格参数默认值显示“全部”效果下图 image2022-5-24_11-54-56.png 实现步骤如下 方案1 1、创建带参数数据模型。创建过程参考“数据模型-参数应用”中的SQL查询示例,需注意SQL绑定参数部分如下图方式书写: image2022-5-24_11-49-35.png 2、在参数设置中设置默认值和备选值,设置方式如下: image2022-5-24_11-53-43.png 此SQL示例数据多维数据源数据权限
多维数据源中数据权限的设置通过限制用户访问多维数据集中维成员和度量值的权限而实现。 管理角色不受数据权限控制。 对某维度层次结构或度量值设置了数据权限,在定制多维分析时若没有选择该维度成员或度量值,系统默认在MDX语句添加上过滤内容。 操作入口 在“多维数据源”的数据集的更多操作0.jpg,选择 设置数据权限,则进入“设置数据权限”界面。 26.png 界面介绍 27.png “数据权限设置”界面主要分为以下几个区域: 可选资源区:该区主要列出了设置数据权限可使用的资源。 设置区:该区为设置所选维度数据权限的主要区域。系统提供三种设置方式:映射设置、简单设置和高级设置。 功能3、数据挖掘的Python计算节点集群
Python节点主要用于机器学习的DBSACN算法和自定义模块的python脚本扩展。如果没有用到这两个功能模块,可以不用部署python节点。 数据挖掘服务引擎如果没有用到这两个功能模块,也可以不用部署python节点 Python计算节点集群环境如下: 服务器IP 主机名 组件实例 部署目录 … -i 's/=enforcing/=disabled/g' /etc/selinux/config 2. 安装前配置 1、配置主机名映射 如果服务器已配置hosts环境信息,则无需重复配置 将数据挖掘组件中的服务器主机名映射到hosts文件中 vi /etc/hosts 文件末尾添(根据实际环境信息设置