搜索 -

第47页，共108页。显示 1,077 条结果 (0.026 秒)

数据挖掘-最小最大归一化
概述最小最大值归一化是对原始数据的线性变换，使结果映射到[0,1]区间。设minA和maxA分别为特征A的最小值和最大值，将A的一个原始值x通过MinMaxScaler映射到区间[0,1]间，公式为：x' = (x-minA)/(maxA-minA)。输入/输出输入没有输入端口输出一个输出端口，与抽取、变换节点组合使用参数设置参数名称说明备注新增列后缀用于设置在原字段名后追加后缀生成新的列，默认后缀为：Normalized；必填图片1.png 示例使用“鸢尾花数据”，特征选择4个特征
Smartbi Insight V10帮助中心 • 二月 15, 2022
数据挖掘-最大绝对值归一化
概述最大绝对值归一化通过除以每个特征内的最大绝对值将每个特征映射到[-1,1]的范围；它不会移动和中心化数据，因此不会破坏任何的稀疏性。输入/输出输入没有输入端口输出一个输出端口，与抽取、变换节点组合使用参数设置参数名称说明备注新增列后缀用于设置在原字段名后追加后缀生成新的列，默认后缀为：Normalized；必填图片3.png 示例使用“鸢尾花数据”，特征选择4个特征列，最大绝对值归一化为[-1,1]范围的数据，输出结果如下图：图片4.png 最大绝对值归一化
Smartbi Insight V10帮助中心 • 二月 15, 2022
数据挖掘-假设检验
概述通过特征变量与目标变量之间的偏差来检验数据之间的相关性或回归分析中的拟合结果。输入/输出输入一个输入端口，用于接收数据集输出一个输出端口，用于输出假设检验结果数据集参数设置参数名称说明备注选择特征列用于选择需要检验的字段列必填选择标签列用于选择做为标签列的字段（必须为数值型）示例使用“鸢尾花数据”，选择4个特征列和1个标签列，输出结果如下图：图片6.png 鼠标点击右键查看分析结果：图片7.png 以上图知：已挑选的特征列的P值都趋近于0
Smartbi Insight V10帮助中心 • 四月 21, 2021
数据挖掘-词袋
概述词袋是为了对句子进行分词，根据分隔符将句子分割开来，分成一个个独立的词语或者单词。常用于英文文本分割语句。输入/输出输入一个输入端口，用于接收数据集输出一个输出端口，用于输出分隔后的结果参数设置参数配置说明备注选择文本项选择需要分割的文本列必填分隔符输入指定的分隔符必填示例使用“垃圾短信识别”数据，选择需要分割的文本列，设置”/”分隔符进行分割，输出结果如下图： image2020-6-4 11_11_16.png 词袋
Smartbi Insight V10帮助中心 • 二月 15, 2022
数据挖掘-特征选择
概述特征选择的作用是从数据集中选取有用特征，用于分类预测或者回归预测算法的训练；其中：标签列必选，但是只有分类回归预测算法才需要选择标签列，聚类训练时则不需要选择标签列。当与特征节点组合使用时则不需要选择标签列。输入/输出输入一个输入端口，用于接收前置节点传下来的数据集。输出一个输出端口，用于输出接收到的数据集。参数设置参数名称说明备注选择特征列用于选择做为特征列的字段必填选择标签列用于选择做为标签列的字段分类、回归算法必填、聚类算法及组合使用不需要选择示例特征选择中
Smartbi Insight V10帮助中心 • 十一月 27, 2020
数据挖掘-特征转换
概述特征转换是实现特征类型的转换，将类别型变量转换为数值型变量，方便算法训练学习计算。例如：将特征列中“男”“女”变量转换为0、1的数值。结合特征抽取中抽取和变换节点组合使用。输入/输出输入没有输入端口。输出一个输出端口，用于接入下一个节点，与抽取节点组合使用。参数设置参数名称说明备注新增列后缀用于设置在原字段名后追加后缀生成新的列，默认后缀为：Index；该节点与抽取、变换节点组合使用；图片1.png 示例使用“鸢尾花数据”，将种类（Species）该列的类别型数据变换
Smartbi Insight V10帮助中心 • 九月 08, 2020
数据挖掘-停用词处理
概述停用词处理是由于有些词频很高，但对文章却没有太多意义的语气词和助词等等，比如这、我、你们、吗等等，对这些词进行去掉处理以便能够更好的分析语义。常用于关键词提取分析。输入/输出输入一个输入端口，用于需要过滤停用词的字段。输出一个输出端口，用于输出去掉停用词之后的结果。参数设置参数名称说明备注字段选择选择需要去除停用词的列必填停用词列表在对话框填写停用词，每行填写一个停用词必填示例使用“深圳企业信息”示例数据，选择分词后去除停用词的列(企业名称
Smartbi Insight V10帮助中心 • 二月 11, 2022
数据挖掘-日期计算
概述在日期的计算中，经常要对日期计算日期差或对日期进行加减指定天数等操作。 image2023-2-3_11-42-53.png 输入/输出输入一个输入端口，用于接收数据集。输出一个输出端口，用于输出日期计算处理后的结果。参数设置设置日期时间处理的参数： image2023-2-3_11-45-7.png 设置说明如下：参数说明选择列要进行日期计算处理的列。计算方式作和：日期列与整数、日期与整数列作和作差：日期列与日期列、日期列与整数列作差指定列(值) 指定列或者指定值粒度
Smartbi Insight V10帮助中心 • 二月 03, 2023
数据挖掘-字符串处理
概述在处理文本过程中，经常需要从字符数据中提取数字。 image2023-2-17_17-22-55.png 输入/输出输入一个输入端口，用于接收数据集。输出一个输出端口，用于输出字符串处理后的结果。参数设置设置字符串处理的参数： image2023-2-17_17-25-25.png 设置说明如下：参数说明选择列要进行字符串处理的列。新增列名称字符串处理后输出列的名称。处理方式提取数字提取整数提取浮点数数字片段位数提取的位置，选择的列中
Smartbi Insight V10帮助中心 • 二月 17, 2023
数据挖掘-字符串处理
概述在处理文本过程中，经常需要从字符数据中提取数字。 image2023-2-17_17-22-55.png 输入/输出输入一个输入端口，用于接收数据集。输出一个输出端口，用于输出字符串处理后的结果。参数设置设置字符串处理的参数： image2023-2-17_17-25-25.png 设置说明如下：参数说明选择列要进行字符串处理的列。新增列名称字符串处理后输出列的名称。处理方式提取数字提取整数提取浮点数数字片段位数提取的位置，选择的列中
Smartbi Insight V11帮助中心 • 四月 22, 2023

关注我们

服务支持