第215页,共365页。 显示 3,642 条结果 (0.123 秒)
应用商店-界面介绍
/viewpage.action?pageId=52626199 应用商店 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=52626291 搜索应用:对当前TAB页中所有应用名称进行模糊搜索。 刷新:刷新当前TAB页中所有应用。数据挖掘-特征选择
概述 特征选择的作用是从数据集中选取有用特征,用于分类预测或者回归预测算法的训练; 其中:标签列必选,但是只有分类回归预测算法才需要选择标签列,聚类训练时则不需要选择标签列。当与特征节点组合使用时则不需要选择标签列。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出接收到的数据集。 参数设置 参数名称 说明 备注 选择特征列 用于选择做为特征列的字段 必填 选择标签列 用于选择做为标签列的字段 分类、回归算法必填、聚类算法及组合使用不需要选择 示例 特征选择中数据挖掘-特征转换
概述 特征转换是实现特征类型的转换,将类别型变量转换为数值型变量,方便算法训练学习计算。 例如:将特征列中“男”“女”变量转换为0、1的数值。结合特征抽取中抽取和变换节点组合使用。 输入/输出 输入 没有输入端口。 输出 一个输出端口,用于接入下一个节点,与抽取节点组合使用。 参数设置 参数名称 说明 备注 新增列后缀 用于设置在原字段名后追加后缀生成新的列,默认后缀为:Index; 该节点与抽取、变换节点组合使用; 图片1.png 示例 使用“鸢尾花数据”,将种类(Species)该列的类别型数据变换数据挖掘-正则化
概述 用于标准化输入数据,使每个向量具有单位范数;Normalizer需要输入参数p,指定标准化范数,默认值为2;该标准化方法可用于提升算法效果。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出接收到的数据集。 参数设置 参数名称 说明 备注 选择列 用于选择需要正则化的列。 必填,列数<=10 新增列后缀 用于设置在原字段名后追加后缀生成新的列,默认后缀为:Normalized; 必填 P范数 指定标注化范数。 必填导出
报表是指把报表数据结果导出成WORD、PDF、CSV、TXT、Excel格式文档的一种操作方法。 操作入口:单击工具栏中的 导出 按钮,弹出下拉框,选择导出格式即可。 2022-02-10_16-23-35.png 说明: 导出成Excel、CSV或TXT格式时,允许导出的内容有:数据格式、参数名称及取值; 表头、表尾和告警不予导出。 导出TXT格式时,自定义的分隔符只识别英文输入状态下的分隔符。 分页显示的多维分析,导出到Excel是全部导出;导出到CSV、TXT是部分导出。 存在过滤设置的多维分析导出后以过滤后的数据为准。 从版本11恢复ECharts图形-联合图
产品的运费和价格情况。 数据结构: image2019-10-22 15:37:30.png 定制要点: 将“产品目录名称”字段作为“水平(X)轴”,“运费”和“单价”字段作为“左垂直(Y)轴”分别以线图和柱图显示。 image2019-10-22 15:43:27.png 预览效果: image2019-10-22 15:29:55.png 业务场景描述: 查看公司各产品的价格和销售量情况。 数据结构: image2019-10-22 15:40:58.png 定制要点: 将“产品目录名称”字段作为“水平(X)轴”,“单价”字段作为“左垂直(Y)轴”且柱图显示,“数量”字段作为“右垂直(Y数据挖掘-最小最大归一化
概述 最小最大值归一化是对原始数据的线性变换,使结果映射到[0,1]区间。设minA和maxA分别为特征A的最小值和最大值,将A的一个原始值x通过MinMaxScaler映射到区间[0,1]间,公式为:x' = (x-minA)/(maxA-minA)。 输入/输出 输入 没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用 参数设置 参数名称 说明 备注 新增列后缀 用于设置在原字段名后追加后缀生成新的列,默认后缀为:Normalized; 必填 图片1.png 示例 使用“鸢尾花数据”,特征选择4个特征数据挖掘-最大绝对值归一化
概述 最大绝对值归一化通过除以每个特征内的最大绝对值将每个特征映射到[-1,1]的范围;它不会移动和中心化数据,因此不会破坏任何的稀疏性。 输入/输出 输入 没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用 参数设置 参数名称 说明 备注 新增列后缀 用于设置在原字段名后追加后缀生成新的列,默认后缀为:Normalized; 必填 图片3.png 示例 使用“鸢尾花数据”,特征选择4个特征列,最大绝对值归一化为[-1,1]范围的数据,输出结果如下图: 图片4.png 最大绝对值归一化数据挖掘-假设检验
概述 通过特征变量与目标变量之间的偏差来检验数据之间的相关性或回归分析中的拟合结果。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出假设检验结果数据集 参数设置 参数名称 说明 备注 选择特征列 用于选择需要检验的字段列 必填 选择标签列 用于选择做为标签列的字段(必须为数值型) 示例 使用“鸢尾花数据”,选择4个特征列和1个标签列,输出结果如下图: 图片6.png 鼠标点击右键查看分析结果: 图片7.png 以上图知:已挑选的特征列的P值都趋近于0数据挖掘-主题-词分布(LDA)
概述 主题-词分布(LDA)指的是LDA模型训练后输出的每个主题和每个主题输出的词及概率分布。 常用于做词云图分析。 参数设置 参数名称 说明 主题词数 每个主题输出的词数。 示例 使用文本数据,分析主题词分布情况以及各词的概率权重。主题-词分布(LDA)设置的参数每个主题输出的词数为8,输出结果如下: 图片8.png 其中topic0-5表示输出的5个主题的概率权重,termName表示输出的词,其中主题概率为0.0表示该主题所对应的词是没有的。termCode表示输出的词编码。 主题-词分布(lda)