第141页,共579页。 显示 5,789 条结果 (0.265 秒)
数据挖掘-TF-IDF
概述 一种统计方法,TF意思是词频,IDF意思是逆文本频率指数,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。 TF-IDF值越高,说明该词越重要。 输入/输出 输入 没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用。 参数设置 参数名称 说明 备注 特征项数 输入的数值n,代表算法最终会筛选出TF-IDF值最高的n个词 必填 示例 图片3.png 效果 使用“垃圾短信识别”数据,选择数据挖掘-评分卡构建
aValue,bValue是通过设置的参数计算后所得,用于评分卡模型输出时的计算公式。 注意事项 作为评分卡构建的输入,逻辑回归模型必须使用WOE编码后的数据进行训练,且该WOE编码模型应同样接入评分卡构建节点。HANA数据源使用keystore连接
(本文仅供参考) 问题 连接HANA数据库时路径上还需要配置keystore地址,这种是要怎么配置,这个路径有要求吗? 解决方案 可参考如下方式连接: jdbc:sap://ip:端口?reconnect=true&useOldAliasMetadataBehavior=true&encrypt=true&trustStore=/usr/beam/beam_fssc/keystore hana连接keystore hana如何连接keystore数据挖掘-最优主题输出数
概述 最优主题输出数节点用于查看LDA模型训练后输出的主题数量和模型的困惑度(perplexity),可以作为LDA模型表现的评估标准。 示例 使用文本数据,训练LDA模型后在“抽取”节点下接入“最优主题输出数”节点。 图片5.png 其输出结果如下: 图片6.png 其中k为LDA模型输出的主题数量,perplexity为LDA模型的困惑度。困惑度越低,模型效果越好。数据挖掘-最优主题输出数
概述 最优主题输出数节点用于查看LDA模型训练后输出的主题数量和模型的困惑度(perplexity),可以作为LDA模型表现的评估标准。 示例 使用文本数据,训练LDA模型后在“抽取”节点下接入“最优主题输出数”节点。 图片5.png 其输出结果如下: 图片6.png 其中k为LDA模型输出的主题数量,perplexity为LDA模型的困惑度。困惑度越低,模型效果越好。原生SQL数据集参数不合并
(本文档仅供参考) 问题 原生SQL数据集中多处用到了同一个参数,预览界面里面显示了多个参数 image2022-4-25_14-31-6.png 解决方案 这是参数设置中没有勾选【输出合并】导致的,勾选【输出合并】即可将多个相同的参数合并显示为一个参数。 image2022-4-25_14-33-30.png image2022-4-25_14-34-3.png集群环境部署跨库联合数据源报找不到节点
(本文档仅供参考) 问题 集群环境部署跨库联合数据源报错 image2020-3-9 10:25:45.png 解决方案 排查思路: 1.两个节点的跨库联合数据源,配置的都应该是主节点的ip地址。 2. 子节点要连接到主节点,子节点ip地址要写主节点的ip image2020-3-9 13:49:31.png 3.nodeID必须以ffffffff-ffff-ffff-ffff-ffffffffffff格式,由于是16进制,只能写0-9,a-f。例如,一个节点是 ffffffff-ffff-ffff-ffff-fffffffffffa,另一个节点服务端宏:电子表格清单报表使用sum函数计算超1w行数据
(本文档仅供参考) 问题 通过电子表格做清单报表,报表数据超10000条,同时在报表中有sum()函数。导出报表在excel中打开发现sum()函数中只sum了前10000条记录,10000条后面的数据为计算。 方案 问题原因:清单报表考虑性能问题,导出是分批导出的,每次导出10000条,因此导出后无法通过sum去计算全部数据。 方案一(适用相关报表数量不多情况): 若清单报表需要使用sum函数计算,建议可以使用excel公式OFFSET,从而规避此问题,参考文档:清单报表使用sum函数,导出只计算前1w行数据 方案二(适用相关报表数量较多,而不想每一个报表手动添加OFFSET公式1.2 GET请求获取接口数据
("GET"); // 获取输入流,读取响应数据 var result; try { result = StringUtil.readFromStream(conn.getInputStream(), "UTF-8"); } finally { conn.disconnectSmartbiDemo数据源连接失败
(本文仅供参考) 问题描述 SmartbiDemo数据源连接失败,经排查后台hsql服务进程掉了 image2024-5-14_16-25-54.png 解决方案 正常重启smartbi会自动重启,若不方便重启smartbi服务,可通过执行计划任务的方式单独启动hsql服务: 任务类型选择定制 Packages.smartbi.smartbitemplatedemo.SmartbiTemplateDemoModule.getInstance().startHSQL(); image2024-5-14_16-32-15.png smartbidemo