第59页,共314页。 显示 3,135 条结果 (0.043 秒)
数据模型-创建度量
%95%B0%E6%8D%AE%E9%9B%86%E5%88%9B%E5%BB%BA%E5%BA%A6%E9%87%8F-%E8%AE%A1%E7%AE%97%E5%BA%A6%E9%87%8F。 标记度量 标记度量是指对已含有数据信息的字段标记成度量字段。 我们只需要在”维度面板“中将字段标记成度量字段即可: image2022-2-4_21-48-26.png 计算度量 计算度量通常是在已有度量基础上通过MDX表达式计算而实现的新度量。除此之外,还有一种特殊情况就是基于时间的差值,如:获取两个日期的天数。 演示示例 在我们的“快速入门”示例中,度量有“销售量”,我们将基于这个度量及省份和区域的维度来演示如何实现【升级注意事项】V10.1➜V10.5
,在10.5.15版本表格组件上增加的新功能只支持新“汇总表”和“交叉表”组件。新增加的功能包含:表格支持多次过滤、调整列头行高、调整字段位置支持保留原列宽。 3、可通过图层区的组件图标区分新旧组件,下图以“交叉表”组件为例: jxb.png 该功能为V10.5→V10.5.15版本变更点 … 。 去掉了部分数据预处理节点,包括拆分、采样节点。另外节点目录树有调整 V10.1数据预处理存在过滤和行处理节点; V10.1数据预处理存在空值处理、值替换、数据清理节点。 V10.5.8数据预处理中新增日期时间节点。 V10.5.12数据预处理中的过滤和行处理功能合并为行过滤节点电子表格
电子表格报表设计区中的图表共享为图表模板;更改图表模板。 属性 过滤 过滤用于对数据列字段的结果集筛选,它是对数据集对应得结果集进行筛选。 其他 其他通常用于电子表格报表进行排序、结果集筛选和是否使用Smartbi产品本身设置的显示值。 分页属性 分页属性是指一种以行或列为单位进行强制 … 。 定义流程 电子表格的定义流程。 设计原理 扩展属性 扩展在电子表格实现过程中实际上是决定了字段内容的展开情况,包含了扩展方向和扩展方式。 附属属性 附属属性是电子表格实现的基本原理之一,它用来确定单元格间的父子关系,这种父子关系决定着单元格扩展的样式效果。因此附属属性必须与扩展属性结合使用【升级注意事项】V8.5➜V10.1
自助仪表盘:在资源树下双击资源。 V8.5筛选器 提供"应用于组件 > 高级设置"选项,以此创建筛选器与图表组件的关联关系。 筛选器是从数据库中取数的。 V10.1筛选器 不再支持“应用于组件>高级设置”选项。 所有的联动关系都在全局的【联动设置】中设置字段之间的关联关系。 筛选器支持从缓 … 100%解决。 即席查询 V8.5在系统选项中提供“组合分析是否启用旧版的条件面板“设置项。 V10.1去除“启用旧版的条件面板”入口,不支持旧的条件面板。 (1)升级到V10.1版本后,由于升级时丢失了部分即席查询报表的内容,可能会出现问题(报表设置、字段设置和升级前数据挖掘-GBDT特征选择
概述 特征选择是为算法服务的,选择不同的特征会直接影响到模型的效果。GBDT特征选择,就是使用GBDT算法,来自动选择相关性高的特征。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出增加了离散后的字段的数据集。 参数设置 参数名称 说明 备注 选择特征列 选择需要的特征列,必须是数值列 必填(特征列中不能含有null) 选择标签列 选择做为标签列的字段 必填 需选择的特征数量 从待选择的特征列中输出特征列的数量 默认值为1,范围是[1Excel融合分析如何实现格式复杂信息量大的报表
、数据来源于多个数据源,可以为每个数据源新建一个sheet页,然后将字段拖拽到Excel融合分析中。 image2020-8-18_15-15-37.png 2、新建一个sheet,并自定义一个行列固定的报表,同时也新建一个需要随时手动调整的表格数据。 image2020-8-24_18-8-36.png 3 … 。 4、将其他空的单元格填充之后,在报表右侧添加一个图表展示销售情况。 image2020-8-24_18-11-8.png 5、最后补充表格外数据,用于记录了报表数据的时间段和未展示品牌的名称。 image2020-8-24_18-19-20.png 如果想更换其他时间段或者新增品牌的数据,记得对报表和表格Excel融合分析如何实现格式复杂信息量大的报表
、数据来源于多个数据源,可以为每个数据源新建一个sheet页,然后将字段拖拽到Excel融合分析中。 image2020-8-18_15-15-37.png 2、新建一个sheet,并自定义一个行列固定的报表,同时也新建一个需要随时手动调整的表格数据。 image2020-8-24_18-8-36.png 3 … 。 4、将其他空的单元格填充之后,在报表右侧添加一个图表展示销售情况。 image2020-8-24_18-11-8.png 5、最后补充表格外数据,用于记录了报表数据的时间段和未展示品牌的名称。 image2020-8-24_18-19-20.png 如果想更换其他时间段或者新增品牌的数据,记得对报表和表格数据挖掘-GBDT特征选择
概述 特征选择是为算法服务的,选择不同的特征会直接影响到模型的效果。GBDT特征选择,就是使用GBDT算法,来自动选择相关性高的特征。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出增加了离散后的字段的数据集。 参数设置 参数名称 说明 备注 选择特征列 选择需要的特征列,必须是数值列 必填(特征列中不能含有null) 选择标签列 选择做为标签列的字段 必填 需选择的特征数量 从待选择的特征列中输出特征列的数量 默认值为1,范围是[1数据挖掘-自动特征组合
概述 自由特征组合是将现有特征按照一定方式进行组合,形成新的特征,为后续的挖掘工作提供基础。它是通过将单独的特征进行组合(相乘)而形成的合成特征,特征组合有助于表示非线性关系。 例如:在电商推荐场景中,预测一个用户是否购买一个东西的场景下,性别(男女)是一个特征,时间维度是另一个特征(节假日,工作日,周末等待),特征组合就是假设性别特征是女,时间维度双11,会发现这两个特征组合起来一定是非常强对用户预测是否买东西的组合特征。女性在双十一购买商品的概率非常高,这就是交叉后的非线性的组合特征,非线性的组合特征对数据挖掘非常关键。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集某商业银行客户流失预测
收集高价值客群的个人信息、账户类信息、交易类信息等维度数据,以及结合第三方数据,利用随机森林算法构建客户流失预警模型,并输出影响客户流失的主要因素。 实施过程 数据来源于CRM系统中客户基本信息表、账单表等;第三方数据,数据时间窗为近一年的数据,客群为高价值客群,本次案例已获取到部分数据总共100000条数据。 数据维度信息包含: 银行自有字段:账户类信息、个人类信息、存款类信息、消费、交易类信息、理财、基金类信息、柜台服务、网银类信息; 外部三方数据:外呼客服数据、资产类数据、其他消费类数据; 本次案例流失定义为:3个月内没有与银行业务任何往来的客户。 本案例只提取到部分特征字段仅供参考,字段说明如下