第118页,共466页。 显示 4,654 条结果 (0.041 秒)
数据挖掘-全表统计
概述 全表统计是对观测数据进行不同的统计分析,可统计信息:最小值、最大值、平均值、标准差、方差、总和、行数、唯一值、缺失值、偏度、峰度、中位数、下四分位、上四分位、众数等指标;还可使用箱线图和直方图尽可能简单全面表达数据所蕴含的数值范围、分布等信息。 输入/输出 输入 一个输入端口,用于接收数据集 输出 没有输出端口 参数设置 参数名称 说明 备注 选择列 选择需要统计的特征列(列数<=10) 必填 可选统计 选择需要的指标进行统计分析。可选的指标:偏度、峰度、总和、众数、方差、标准差、缺失值。 使用全表统计节点默认统计的指标数据挖掘-TF-IDF
概述 一种统计方法,TF意思是词频,IDF意思是逆文本频率指数,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。 TF-IDF值越高,说明该词越重要。 输入/输出 输入 没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用。 参数设置 参数名称 说明 备注 特征项数 输入的数值n,代表算法最终会筛选出TF-IDF值最高的n个词 必填 示例 图片3.png 效果 使用“垃圾短信识别”数据,选择打印线程堆栈的特殊情况
(本文档仅供参考) 如何在没有jstack和jmap的情况下打印线程和堆? 操作步骤: 一、下载jattach文件 参考资料:https://github.com/apangin/jattach https://github.com/apangin/jattach 访问以上网址,依据实际的操作系统下载对应的jattach文件,比如这里我们下下载了Linux的:jattach image2022-7-7_11-41-17.png image2022-7-7_11-41-37.png 二、上传jattach文件到服务器 将jattach文件上传到服务器任意位置,并赋予可执行权限chmod 777指标模型-数管部门数据审批
数据部门的审批主要是操作两项内容:设置指标存储和为指标所存储的事实表灌数。 1、用数管部门审批用户登录系统,单击 我的待办,进入“我的待办”界面。 指标管理-13.png 2、找到业务员小陈新建的指标“合同金额”的流程,双击主题,进入到该指标的审核界面,审批用户单击两次 下一步 按钮或单击导航 存储设置,进入到“存储设置”界面: 指标管理-14.png 3、设置指标所属的事实表:我们想将指标“合同金额”放入到表“合同事实”中,该表已经存在,但是没有映射“合同金额”的字段,因此我们需要编辑表“合同事实”添加字段。我们单击 手工创建 按钮,打开“事实表管理”页面。 指标管理-15.png 4、在“事实表管理”界面,找到表数据挖掘-全表统计
概述 全表统计是对观测数据进行不同的统计分析,可统计信息:最小值、最大值、平均值、标准差、方差、总和、行数、唯一值、缺失值、偏度、峰度、中位数、下四分位、上四分位、众数等指标;还可使用箱线图和直方图尽可能简单全面表达数据所蕴含的数值范围、分布等信息。 输入/输出 输入 一个输入端口,用于接收数据集 输出 没有输出端口 参数设置 参数名称 说明 备注 选择列 选择需要统计的特征列(列数<=10) 必填 可选统计 选择需要的指标进行统计分析。可选的指标:偏度、峰度、总和、众数、方差、标准差、缺失值。 使用全表统计节点默认统计的指标数据挖掘-TF-IDF
概述 一种统计方法,TF意思是词频,IDF意思是逆文本频率指数,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。 TF-IDF值越高,说明该词越重要。 输入/输出 输入 没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用。 参数设置 参数名称 说明 备注 特征项数 输入的数值n,代表算法最终会筛选出TF-IDF值最高的n个词 必填 示例 图片3.png 效果 使用“垃圾短信识别”数据,选择teradata数据源,表名过长在smartbi中显示不全
(本文档仅供参考) 问题 在terdata数据库中,某个表的表名为“AM_BILL_SELF_HELP_EQUIP_TXN_DTL”。通过数据源管理添加到smartbi中后,查看该表。发现表名缺少了部分内容,只显示了“AM_BILL_SELF_HELP_EQUIP_TXN_DT”,“DT”哦后面的内容并没有显示出来。 数据库中: 1.jpg smartbi中: image2018-7-30 17:12:23.png 解决方案 通过dbvisualizer工具,使用相同的jdbc驱动直接连接teratada数据库,发现在dbvisualizer中,也是只显示到“DT”,缺少“DT”后面的内容Clickhouse抽取报错:Too many partitions for single INSERT block
/users.xml中修改调整max_partitions_per_insert_block参数,如配置文件中没有该配置,则新增一条; 相关参数配置项说明可参考如下,类似参数报错同时可采用此方法: https://blog.csdn.net/chy555chy/article/details/121664246 httpsJava调用jdbc驱动测试返回schema的存储过程
(本文档仅供参考) 使用场景 数据库管理的时候,数据库中的存储过程等没有显示。此jsp是调用驱动进行加载 对应schema下的存储过程等。 操作步骤 1、获取到jsp文件,下载地址:testjdbcGetProduce.jsp 注:该JSP适用于通过 DatabaseMetaData.getProcedures 获取的数据库,若不是通过改方法获取则不适用(例如:hana),是否使用该方法可以通过CPU采样确认,如: 05.png 2、将文件放到可以被访问到的路径如下,如smartbi应用的vision文件夹下,不需要重启 01.png使用IE登陆smartbi显示为英文
(此文档仅供参考) 问题现象 使用IE登陆smartbi显示为英文。 问题原因 因IE浏览器或是电脑自已的环境是英文的。 访问地址指定了英文语言 解决办法 一、检查IE电脑设置。 1.打开IE-按Alt+x-Internet选项-常规选项卡里点“语言”-添加-选择简体中文-确定-点加入的简体中文-点“上移”直到在第一个,也可删除不要的,确定-OK。 2.若还是没有反应,那你是浏览器界面也不少中文的了?那得在控制面板里点“区域和语言”,在最后那个管理选项卡里“更改系统区域设置”为中国,应该就行了,不行就重启一下,还不行在位置选项卡里选择当前位置为中国,在键盘和语言选项卡里也安装简体中文。 二、指定IE访问