第143页,共677页。 显示 6,766 条结果 (0.446 秒)
数据挖掘-词袋
概述 词袋是为了对句子进行分词,根据分隔符将句子分割开来,分成一个个独立的词语或者单词。常用于英文文本分割语句。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出分隔后的结果 参数设置 参数配置 说明 备注 选择文本项 选择需要分割的文本列 必填 分隔符 输入指定的分隔符 必填 示例 使用“垃圾短信识别”数据,选择需要分割的文本列,设置”/”分隔符进行分割,输出结果如下图: image2020-6-4 11_11_16.png 词袋数据挖掘-词袋
概述 词袋是为了对句子进行分词,根据分隔符将句子分割开来,分成一个个独立的词语或者单词。常用于英文文本分割语句。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出分隔后的结果 参数设置 参数配置 说明 备注 选择文本项 选择需要分割的文本列 必填 分隔符 输入指定的分隔符 必填 示例 使用“垃圾短信识别”数据,选择需要分割的文本列,设置”/”分隔符进行分割,输出结果如下图: image2020-6-4 11_11_16.png 词袋审核流程中设置了【流程结束后入库】,那么数据存储在哪里?怎么找到?
(本文档仅供参考) 问题 审核流程中设置了【流程结束后入库】,那么数据存储在哪里?怎么找到? 解决方案 审核填报的数据存储在知识库中的act_ge_bytearray中间表中,但其存储格式为二进制文件,人为不可识别。可使用以下sql查询出某个流程实例中回写的数据: (1)先在act_hi_varinst表中查到数据记录id: SELECT bytearray_id_ FROM `act_hi_varinst` WHERE name_ ='smartbi_workflow_writeBackData' AND proc_inst_id_='流程实例id' (2)通过bytearray_id_查二进制数据 SELECT数据挖掘-文本分析
文本分析是对文字类型的数据进行处理的方法,即从大量文本数据中抽取出有价值的知识,并且利用这些知识重新组织信息的过程。 文本分析数据挖掘-文本分析
文本分析是对文字类型的数据进行处理的方法,即从大量文本数据中抽取出有价值的知识,并且利用这些知识重新组织信息的过程。 文本分析挖掘-元数据编辑成date类型输出为null
(本文档仅供参考) 问题说明 数值类型是string,通过元数据编辑改成date,但是输出都是null,如下图: image2024-1-17_17-26-20.png 解决方案 元数据编辑节点并不能实现字符串转日期,字符串转日期得用:数据挖掘-日期时间 。 date输出位null了Echarts图形-扩展属性:标签 - 环形图的数据标签只显示百分比且只保留两位小数
问题 环形图可以只显示百分比,不显示文字吗?另外那个百分比好像会四舍五入,可以保留两位小数吗? 未命名.jpg 解决方案 在环形图上加上以下扩展属性即可。 { "series": [{ "label": { "normal": { "show": true, "position": "outer", "formatter": "{d}%" } } }] } 环形图数据标签显示百分比数据挖掘-随机森林特征选择
。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出增加了离散后的字段的数据集。 参数设置 参数名称 说明 备注 选择特征列 选择需要的特征列,必须是数值列 必填(特征列中不能含有null … 导致过拟合。 树的个数 取值范围:>=1的整数;默认值为20。 随机森林中决策树的棵数。 衡量准则 gini 裂分标准,entropy表示熵值,gini表示基尼指数; entropy 示例 使用“鸢尾花数据”,预测鸢尾花类别。选取4个特征列和1个标签列数据挖掘-随机森林特征选择
。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出增加了离散后的字段的数据集。 参数设置 参数名称 说明 备注 选择特征列 选择需要的特征列,必须是数值列 必填(特征列中不能含有null … 导致过拟合。 树的个数 取值范围:>=1的整数;默认值为20。 随机森林中决策树的棵数。 衡量准则 gini 裂分标准,entropy表示熵值,gini表示基尼指数; entropy 示例 使用“鸢尾花数据”,预测鸢尾花类别。选取4个特征列和1个标签列⬝ 使用DB2数据库作为知识库
Smartbi 使用 DB2 做知识库的时候,数据库的表空间页大小必须是32k。创建库有下面两种方法,说明如下: 方法一: 使用 DB2 的控制中心,创建知识库。 1、右键“数据库”打开右键菜单,选择 创建数据库 > 标准。 worddav1947d4303d05b6d2290d6cd167e578b8.png 2、输入数据库名称,并设置“缺省缓冲池和表空间页大小”为“32k”。 worddavf6dadca3aafd6729f75cc44aa3309395.png 3、点击完成,完成知识库的创建。 方法二: 使用命令行创建知识库。 1、在dos窗口中输入db2cmd,登录到db2的命令行环境