第7页,共561页。 显示 5,602 条结果 (0.042 秒)
数据挖掘-WOE编码
概述 WOE编码是评分卡模型常用的数据处理步骤,用于对所选特征值进行WOE编码,并计算IV值,且可根据IV值做特征选择。 输入/输出 输入 一个输入端口,用于接收需要进行WOE编码的数据集。 输出 两个输出端口,输出1是用于输出WOE编码转换后的数据集,输出2是WOE编码模型 … ”,“是否贷款”这七个字段作为特征列。如下图: 2.png 然后通过“特征转换”新增列后缀index,结合“抽取”、“变化”节点之后,生成如下图: 3.png 最后接入“WOE编码”节点,即可点击鼠标右键查看分析效果: 4.png 到此就完成WOE值和IV值的计算。数据挖掘–指数平滑
进行预测的数据 输出 一个输出端口,用于输出预测后的结果 示例 如图,指数平滑节点输入端接入数据,可以使用对应的平滑算法对输入数据进行转换。 image2023-1-15_0-38-46.png image2023-1-15_0-39-0.png 输出结果中增加两列。第一列是拟合列,名称规则为被预测列的列名增加前缀,输出结果经过了指数平滑算法的拟合处理。另一列表明拟合列中的数据是否是预测结果,0表示是对历史数据的拟合,1表示是通过拟合数列对未来的预测。 image2023-1-15_0-39-15.png数据挖掘–指数平滑
进行预测的数据 输出 一个输出端口,用于输出预测后的结果 示例 如图,指数平滑节点输入端接入数据,可以使用对应的平滑算法对输入数据进行转换。 image2023-1-15_0-38-46.png image2023-1-15_0-39-0.png 输出结果中增加两列。第一列是拟合列,名称规则为被预测列的列名增加前缀,输出结果经过了指数平滑算法的拟合处理。另一列表明拟合列中的数据是否是预测结果,0表示是对历史数据的拟合,1表示是通过拟合数列对未来的预测。 image2023-1-15_0-39-15.png数据挖掘-产品简介
Smartbi Mining是广州思迈特软件公司自主研发的一站式可视化的数据挖掘平台。 1.什么是数据挖掘 数据挖掘是对商业数据中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性信息的过程。数据挖掘揭示的是未知的、将来的数据关系。数据挖掘的知识领域涵盖了数据库技术、统计学知识、机器学习、可视化等多学科知识的综合应用。 数据挖掘应用举例: 某商业银行不仅面临同业间的激烈竞争,还要面临非同业的竞争,特别是来自互联网金融的冲击,导致超过30%客户流失,并且流失率还在不断提高。针对这个商业银行的困惑我们派出了几个数据挖掘工程师用一周的时间提交了一个银行客户流失预测模型,预测准确率达到 86%。通过数据交互式仪表盘-数据格式
设置的数据格式,仪表盘不做数据格式处理; 值轴设置、小计、合计的数据格式,当设置为自动时,使用的是字段设置的数据格式; 若字段使用了转换规则,则以转换规则为先,数据格式不失效。 … 概述 仪表盘支持对数值和日期(时间)类型的字段设置数据格式,设置的数据格式为该组件私有且优先级高于公共数据格式。 入口 2022-02-19_15-22-35.png 示例 根据不同的应用场景,可设置不同的数据格式。 以表组件为例:给数值型字段“运费”设置数据格式为整型。 操作步骤 (1)选中字段透视分析 ⬝ 选择及处理数据
私有,原数据模型上的汇总依据不会受影响;计算度量其汇总依据是由引用的度量字段决定,所以不支持修改其汇总依据。 选择数据04.png 若需将 维度 字段放在 度量区 ,可先在维度字段上右键选择 复制转度量 ,对于转换的度量字段放在“自定义度量”目录下,支持修改其 汇总依据 。如以产品demo中的订单模型为例,统计 … 了转换规则,则以转换规则为先,数据格式不失效 3.3.3 设置显示名 数据模型中定义的字段名称有时可能不够清晰直观,那么在透视分析上可以通过 设置显示名 来自定义字段显示名称 设置显示名01.png 场景示例:报表上已把单价的”汇总依据“修改为”平均值“,因为需要将其显示名称改为”平均单价“ 在度量区如何跟踪数据不对的情况
字符串格式查询就会报错,又如原始库是double,在数据模型设置为int就可能让数据精度丢失等等。 2.6 影响显示效果的数据格式、转换规则、脱敏规则 这个是系统的后置处理做的,如出现问题可检查相应查询字段的设置,或者元数据的血统分析查看相应的设置。 3 常用跟踪工具 数据不对,主要可能有以下可能性 … 1 概述 类似经营分析模型,一个模型接入100张表很正常,并且最终查数据库的SQL是根据用户查询意图动态构建,无法一开始知道最终查询SQL,此时用户查询数据时如出现以下疑问,该如何跟踪确认? 怀疑数据被放大,明明是2000,系统看到是6000; 明明有数据,查询结果显示无数据; 数据的值明显不对,和实际相比数据挖掘-产品简介
Smartbi Mining是广州思迈特软件公司自主研发的一站式可视化的数据挖掘平台。 1.什么是数据挖掘 数据挖掘是对商业数据中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性信息的过程。数据挖掘揭示的是未知的、将来的数据关系。数据挖掘的知识领域涵盖了数据库技术、统计学知识、机器学习、可视化等多学科知识的综合应用。 数据挖掘应用举例: 某商业银行不仅面临同业间的激烈竞争,还要面临非同业的竞争,特别是来自互联网金融的冲击,导致超过30%客户流失,并且流失率还在不断提高。针对这个商业银行的困惑我们派出了几个数据挖掘工程师用一周的时间提交了一个银行客户流失预测模型,预测准确率达到 86%。通过数据原生SQL数据集
对字段的相关描述,被用于其提示信息中。允许重新设置。 数据类型 字段的数据类型,主要包含:整数、浮点、字符串、日期、时间、日期时间、文本、对象、集合。允许重新设置。 数据格式 根据数据类型选择输出字段的数据格式,该格式选项在 数据格式 中进行设置。允许重新设置。 转换规则 选择是否对该字段进行转换规则,若设置转换规则,其所选的转换规则在 转换规则 中定义。 脱敏规则 数据脱敏 是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。 检测输出字段 新建的原生SQL数据集,必须要设置 检测输出字段,否则在右侧“数据集输出区”面板上“输出字段”下的字段自助数据集-计算字段
,不支持转换为TIME类型。 以“销售额”为例,新建“销售额”计算字段,“销售额”的表达式为:销售额=单价*数量*(1-折扣),数据类型为“DOUBLE" 。 编辑表达式时,双击字段或将字段直接拖入表达式区域即可,点击 确定 保存当前计算字段,如下图: image2019-8-21 15:55:38.png … 计算字段是指使用已经存在的字段,通过四则运算、函数等书写表达式形成的新字段。 用户在创建报表时,有时通过现有数据字段不能完全满足数据分析的要求,因此就需要通过计算字段的方式来解决。 操作步骤 1.创建一个数据集,在“表属性区”的任意位置或字段的右键菜单中选择 新建计算字段。 新建计算字段.png 2.在弹出