第16页,共605页。 显示 6,044 条结果 (0.071 秒)
数据挖掘-FP-Growth
、前项、后项等)。 fp+关联规则11.png输出.png 相关概念 序号 概念 定义 说明 业务意义 1 频繁项集 频繁项集是指满足支持度最小阈值的所有项集。 项,是指我们分析数据中的一个对象;项集,就是若干项的项构成的集合,如集合{牛奶、麦片、糖}是一个3项集。 频繁项集表示频繁地并且同时出现在交易数据集中的商品的集合,可用于发现共现事项或者发现事物的热点信息 。 2 支持度 Support 支持度是指几个频繁关联的数据在数据集中出现的次数占总数据集的比重。 假设数据集有 10 条记录,包含{‘牛奶’, ‘面包’}的有 5 条记录,那么{‘牛奶数据挖掘-FP-Growth
、前项、后项等)。 fp+关联规则11.png输出.png 相关概念 序号 概念 定义 说明 业务意义 1 频繁项集 频繁项集是指满足支持度最小阈值的所有项集。 项,是指我们分析数据中的一个对象;项集,就是若干项的项构成的集合,如集合{牛奶、麦片、糖}是一个3项集。 频繁项集表示频繁地并且同时出现在交易数据集中的商品的集合,可用于发现共现事项或者发现事物的热点信息 。 2 支持度 Support 支持度是指几个频繁关联的数据在数据集中出现的次数占总数据集的比重。 假设数据集有 10 条记录,包含{‘牛奶’, ‘面包’}的有 5 条记录,那么{‘牛奶数据挖掘-梯度提升决策树
概述 梯度提升决策树原理是训练多棵CART分类树,每棵树建立是基于前一课树的残差,不断的迭代拟合前一课树的残差,通过损失函数的负梯度来拟合,直到残差达到最小。 示例 使用“银行零售客户流失”案例数据,包含17个特征列和1个二类的目标标签。需要对银行客户预测是否流失。通过数据预处理及模型训练,如下图: image2020-6-4 16:33:34.png 其中,特征离散是将年龄、卡龄等数据离散化,是为了提高模型的准确度,提高运行速度。 模型构建中,梯度提升决策树的各个参数: 参数名称 值 说明 归一化 正则化 详情请参考 归一化 https数据挖掘-梯度提升决策树
概述 梯度提升决策树原理是训练多棵CART分类树,每棵树建立是基于前一课树的残差,不断的迭代拟合前一课树的残差,通过损失函数的负梯度来拟合,直到残差达到最小。 示例 使用“银行零售客户流失”案例数据,包含17个特征列和1个二类的目标标签。需要对银行客户预测是否流失。通过数据预处理及模型训练,如下图: image2020-6-4 16:33:34.png 其中,特征离散是将年龄、卡龄等数据离散化,是为了提高模型的准确度,提高运行速度。 模型构建中,梯度提升决策树的各个参数: 参数名称 值 说明 归一化 正则化 详情请参考 归一化 https数据模型-工具栏
系统不检测模型表关系,表关系建立需要手动或者通过工具栏按钮 检测关系 http://wiki.smartbi.com.cn#检测 实现。 系统配置image2022-2-3_17-54-29.png:表示读取 系统选项 > 高级设置 中的设置项“数据模型加载时自动检测关系 https … 读取数据,从而提高查询速度。 禁止缓存2021-4-30 14-40-24.png:每次刷新数据都需重新到数据库中读取。此选项一般适用于数据需要实时刷新的报表。 系统配置2021-4-30 14-41-12.png:表示读取 系统选项 > 性能优化> 数据集中的设置项“自动缓存 https电子表格&Web电子表格设置项
是新窗口打开。 在新标签页打开 目标报表资源是否是新标签页打开。 显示工具栏 目标报表资源新窗口打开时,是否显示"工具栏"。 自动刷新 目标报表资源打开时,是否自动刷新数据。 参数设置 目标报表资源上拥有参数时,参数值的来源设置。详情请参考 。 点击对象设置 电子表格跳转规则点击对象设置,包含标签页的选择,表格与图形的选择,以及选择表格及图形后对应的设置项。 image2021-10-27_15-1-57.png 选择“表格” 选择“表格”时,表示通过点击表格上的字段进行跳转。需设置点击进行跳转的单元格位置。 输入框内输入单元格位置,如B4、A1关系型数据源-TiDB数据连接
: image2023-9-12_11-0-7.png 说明: 1)名称是数据连接名称,用户可以自定义,不可为空 2)用户名和密码是连接字符串中配置的数据库的连接用户名和密码,一般可以联系数据库管理员获取。 3)驱动程序类型为TiDB时,会提供“大数据量兼容”和“允许加载Excel数据”两个配置项进行选择: 大数据量兼容:默认勾选。在勾选“大数据量兼容”后 … 1 概述 本文介绍如何在Smartbi中连接TiDB数据库。 版本信息如下: 驱动版本 Smartbi版本 mysql-connector-java-5.1.48 Smartbi V10.5.15及以上 2 数据连接 2.1 配置信息 驱动程序类 连接关系型数据源-SelectDB数据连接
自定义,不可为空 2)用户名和密码是连接字符串中配置的数据库的连接用户名和密码,一般可以联系数据库管理员获取。 3)驱动程序类型为MYSQL时会提供“大数据量兼容”和“允许加载Excel数据”两个配置项进行选择: 大数据量兼容:默认勾选。针对MySQL类型数据库的一个策略,在勾选“大数据量兼容”后,会自动在“连接 … 1 概述 本文介绍如何在Smartbi中连接SelectDB数据库。 版本信息如下: 驱动版本 Smartbi版本 mysql-connector-java-5.1.48 Smartbi V10.5.12及以上 2 数据连接 2.1 配置信息 驱动程序类关系型数据源-MySQL 数据连接
量兼容”和“允许加载Excel数据”两个配置项进行选择: 大数据量兼容:默认勾选。针对MySQL类型数据库的一个策略,在勾选“大数据量兼容”后,会自动在“连接字符串”结尾添加“&useCursorFetch=true&defaultFetchSize=-2147483648”,用于优化内存占用,在抽取千万级别的海量 … 1 概述 本文介绍如何在smartbi中连接MySQL数据库。 版本信息如下: 驱动版本 Smartbi版本 mysql-connector-java-5.1.48 Smartbi V9.5及以上 1、MySQL 导入文件编辑模式时支持新增字段。 6.png数据集主体区
用于定义分组条件 清除、软键盘、收起、最大化 表关系 输出字段确定后,其表之间的关系即显示在表关系区 收起、最大化 查询标签 用于在同一个可视化数据集中的各子数据集间进行切换 输出字段 输出字段是指用户最终查询的数据字段。相当于SQL语句中的输出 … 关系 可视化数据集表关系的修改只是针对当前可视化数据集生效,不会影响继承的数据源或是业务主题的表关系设置。 查询标签 查询标签用于可视化数据集多查询时对子查询进行切换,如下图。 子查询通过数据集输出区的查询节点进行添加。 image2019-10-29 14:53:23.png