第214页,共365页。 显示 3,642 条结果 (0.367 秒)
ECharts图形-联合图
产品的运费和价格情况。 数据结构: image2019-10-22 15:37:30.png 定制要点: 将“产品目录名称”字段作为“水平(X)轴”,“运费”和“单价”字段作为“左垂直(Y)轴”分别以线图和柱图显示。 image2019-10-22 15:43:27.png 预览效果: image2019-10-22 15:29:55.png 业务场景描述: 查看公司各产品的价格和销售量情况。 数据结构: image2019-10-22 15:40:58.png 定制要点: 将“产品目录名称”字段作为“水平(X)轴”,“单价”字段作为“左垂直(Y)轴”且柱图显示,“数量”字段作为“右垂直(Y系统监控-会话
maxInactiveInterval 最大允许空闲的时间(秒) ip 最后访问的客户端IP地址 user Smartbi登录用户名,NotLogin表示未登录 Item(属性) name 属性名称 className 属性类型数据挖掘-正则化
概述 用于标准化输入数据,使每个向量具有单位范数;Normalizer需要输入参数p,指定标准化范数,默认值为2;该标准化方法可用于提升算法效果。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出接收到的数据集。 参数设置 参数名称 说明 备注 选择列 用于选择需要正则化的列。 必填,列数<=10 新增列后缀 用于设置在原字段名后追加后缀生成新的列,默认后缀为:Normalized; 必填 P范数 指定标注化范数。 必填数据挖掘-最小最大归一化
概述 最小最大值归一化是对原始数据的线性变换,使结果映射到[0,1]区间。设minA和maxA分别为特征A的最小值和最大值,将A的一个原始值x通过MinMaxScaler映射到区间[0,1]间,公式为:x' = (x-minA)/(maxA-minA)。 输入/输出 输入 没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用 参数设置 参数名称 说明 备注 新增列后缀 用于设置在原字段名后追加后缀生成新的列,默认后缀为:Normalized; 必填 图片1.png 示例 使用“鸢尾花数据”,特征选择4个特征数据挖掘-最大绝对值归一化
概述 最大绝对值归一化通过除以每个特征内的最大绝对值将每个特征映射到[-1,1]的范围;它不会移动和中心化数据,因此不会破坏任何的稀疏性。 输入/输出 输入 没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用 参数设置 参数名称 说明 备注 新增列后缀 用于设置在原字段名后追加后缀生成新的列,默认后缀为:Normalized; 必填 图片3.png 示例 使用“鸢尾花数据”,特征选择4个特征列,最大绝对值归一化为[-1,1]范围的数据,输出结果如下图: 图片4.png 最大绝对值归一化数据挖掘-假设检验
概述 通过特征变量与目标变量之间的偏差来检验数据之间的相关性或回归分析中的拟合结果。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出假设检验结果数据集 参数设置 参数名称 说明 备注 选择特征列 用于选择需要检验的字段列 必填 选择标签列 用于选择做为标签列的字段(必须为数值型) 示例 使用“鸢尾花数据”,选择4个特征列和1个标签列,输出结果如下图: 图片6.png 鼠标点击右键查看分析结果: 图片7.png 以上图知:已挑选的特征列的P值都趋近于0数据挖掘-特征选择
概述 特征选择的作用是从数据集中选取有用特征,用于分类预测或者回归预测算法的训练; 其中:标签列必选,但是只有分类回归预测算法才需要选择标签列,聚类训练时则不需要选择标签列。当与特征节点组合使用时则不需要选择标签列。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出接收到的数据集。 参数设置 参数名称 说明 备注 选择特征列 用于选择做为特征列的字段 必填 选择标签列 用于选择做为标签列的字段 分类、回归算法必填、聚类算法及组合使用不需要选择 示例 特征选择中数据挖掘-特征转换
概述 特征转换是实现特征类型的转换,将类别型变量转换为数值型变量,方便算法训练学习计算。 例如:将特征列中“男”“女”变量转换为0、1的数值。结合特征抽取中抽取和变换节点组合使用。 输入/输出 输入 没有输入端口。 输出 一个输出端口,用于接入下一个节点,与抽取节点组合使用。 参数设置 参数名称 说明 备注 新增列后缀 用于设置在原字段名后追加后缀生成新的列,默认后缀为:Index; 该节点与抽取、变换节点组合使用; 图片1.png 示例 使用“鸢尾花数据”,将种类(Species)该列的类别型数据变换数据挖掘-主题-词分布(LDA)
概述 主题-词分布(LDA)指的是LDA模型训练后输出的每个主题和每个主题输出的词及概率分布。 常用于做词云图分析。 参数设置 参数名称 说明 主题词数 每个主题输出的词数。 示例 使用文本数据,分析主题词分布情况以及各词的概率权重。主题-词分布(LDA)设置的参数每个主题输出的词数为8,输出结果如下: 图片8.png 其中topic0-5表示输出的5个主题的概率权重,termName表示输出的词,其中主题概率为0.0表示该主题所对应的词是没有的。termCode表示输出的词编码。 主题-词分布(lda)数据挖掘-词向量
概述 词向量是表示文档的单词序列,通过训练Word2vec模型,将词语转化为向量。该模型将每个单词映射到一个唯一的固定大小向量。Word2Vec模型通过文档中所有单词的平均值将每个文档转换为一个向量;然后可以将该向量用作预测、文档相似性计算的特征。 参数设置 参数名称 说明 生成向量的数量 词向量的维度,默认值为50 词频 默认值为2,词频大于该值的词才能入选词典 示例 图片9.png 效果 使用“垃圾短信识别”示例数据,词向量的参数生成向量数量为50.词频为2,特征选择后,输出结果如下: 图片10.png 词向量