第96页,共255页。 显示 2,550 条结果 (0.028 秒)
数据挖掘-字符串处理
概述 在处理文本过程中,经常需要从字符数据中提取数字。 image2023-2-17_17-22-55.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出字符串处理后的结果。 参数设置 设置字符串处理的参数: image2023-2-17_17-25-25.png 设置说明如下: 参数 说明 选择列 要进行字符串处理的列。 新增列名称 字符串处理后输出列的名称。 处理方式 提取数字 提取整数 提取浮点数 数字片段位数 提取的位置,选择的列中数据挖掘-正则化
概述 用于标准化输入数据,使每个向量具有单位范数;Normalizer需要输入参数p,指定标准化范数,默认值为2;该标准化方法可用于提升算法效果。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出接收到的数据集。 参数设置 参数名称 说明 备注 选择列 用于选择需要正则化的列。 必填,列数<=10 新增列后缀 用于设置在原字段名后追加后缀生成新的列,默认后缀为:Normalized; 必填 P范数 指定标注化范数。 必填数据挖掘-过滤
概述 根据用户需求,通过写SQL语句(片段)的方式,对数据集中指定字段进行条件筛选过滤。 image2020-9-8_9-10-20.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出过滤的结果。 参数设置 设置过滤与映射的参数: image2020-5-21 13:58:29.png 设置说明如下: 参数 说明 过滤器 对数据的指定字段进行过滤。 image2020-5-21 11:42:59.png 示例 1、原先示例数据源的输出结果有150条数据,对其进行过滤数据挖掘-主题-词分布(LDA)
概述 主题-词分布(LDA)指的是LDA模型训练后输出的每个主题和每个主题输出的词及概率分布。 常用于做词云图分析。 参数设置 参数名称 说明 主题词数 每个主题输出的词数。 示例 使用文本数据,分析主题词分布情况以及各词的概率权重。主题-词分布(LDA)设置的参数每个主题输出的词数为8,输出结果如下: 图片8.png 其中topic0-5表示输出的5个主题的概率权重,termName表示输出的词,其中主题概率为0.0表示该主题所对应的词是没有的。termCode表示输出的词编码。 主题-词分布(lda)数据挖掘-词向量
概述 词向量是表示文档的单词序列,通过训练Word2vec模型,将词语转化为向量。该模型将每个单词映射到一个唯一的固定大小向量。Word2Vec模型通过文档中所有单词的平均值将每个文档转换为一个向量;然后可以将该向量用作预测、文档相似性计算的特征。 参数设置 参数名称 说明 生成向量的数量 词向量的维度,默认值为50 词频 默认值为2,词频大于该值的词才能入选词典 示例 图片9.png 效果 使用“垃圾短信识别”示例数据,词向量的参数生成向量数量为50.词频为2,特征选择后,输出结果如下: 图片10.png 词向量向量机启动自动调参之后,模型准确度下降
(本文档仅供参考) 问题现象 支持向量机的模型启用自动调参之后,模型的准确度下降 (未启用时) image2023-7-31_18-4-23.png (启用后) image2023-7-31_18-4-47.png image2023-7-31_18-4-58.png 解决方案 超参数搜索范围导致的:自动调参算法可能会在参数搜索空间中找到一个非常不利的组合,导致性能下降。这可能是由于搜索范围选择不当或者搜索算法本身的局限性导致的。建议重新评估所使用的超参数搜索范围,可以尝试更广泛或更有针对性的搜索范围。电子表格满足条件增加跳转链接
12、设置参数传递:目标报表中参数“产品类别”来源为源报表中的“产品类别”数据列字段,因此参数来源选择“单元格数据”,参数值填入“B5”。 image2020-6-10 19:11:59.png 13、保存跳转规则,查看效果。 点击跳转源数据: image2020-6-10 19:13:28.png导入模板绑定到电子表格报表
、年月等字段)。 2、基于上面那张表A,使用 Smartbi 电子表格功能开发一张报表作为Excel 导入模板。在下载模板时,可以选择报表的参数,下载不同的模板回来。只要数据库中表A的数据变了,下载回来的模板自然就不同了。 开发电子表格报表 参考 快速新建电子表格 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=83701890 文档,开发一张补录模板报表。该报表要满足如下要求: 1、该电子表格报表的 Sheet名、列头、顺序等应该和 “Excel导入模版”定义的一致。 2、报表的数据从数据库表中获取,报表可能还要有参数。 3、有几个电子表格点击跳转分析项高亮
(spreadsheetReport, obj); changeColor(spreadsheetReport); addFont(spreadsheetReport, value); }; //设置参数并刷新 function jumpTo(spreadsheetReport, obj) { var paramsInfo = []; //将参数放入参数数组 paramsInfo.push(obj); //设置当前参数值 if (paramsInfo.length > 0) spreadsheetReport.setParamsInfo(paramsInfo); //电子表格做局部刷新字段筛选器-展示样式
(多选) 以下拉树的形式展示,可多选。 img-2022-06-15_15-47-51.png 下拉树筛选器不支持切换成其他类型的筛选器;使用前,先在模型中定义树形参数,才可在仪表盘中使用,详见:数据模型-参数应用 https://wiki.smartbi.com.cn/pages … 匹配,则需要手动选择与其字段内容格式匹配的数据格式,才能筛选出对应频度的数据 参数 有 使用的是参数本身设置的格式。 image2021-9-16_16-3-38.png 其中的【自动】代表是使用控件默认真实格式,各格式代表的真实格式如下: 日期筛选器格式 真实格式 示例