第52页,共301页。 显示 3,004 条结果 (0.03 秒)
Smartbi V10.5.15-数据准备
库 +【数据模型】支持新建计算列 +【数据模型】支持转换规则 +【数据模型】支持自定义函数向导 ^【ETL自动化】源数据信息下载窗口左侧树增加全选功能 +【指标管理】支持接入已有的维表和事实表 背景介绍 在企业数字化转型进程中,许多企业已构建了自己的数据仓库,有独立的数仓 … +【数据模型】支持新建计算列 功能简介 有时,数据表中的原始维度和度量并不能满足客户的业务需要,需要使用公式或函数进行数据加工处理。在V10.5.15版本中,提供了新建计算列功能,利用各种函数新建计算列,并且计算列字段能够快速复用上次计算字段的内容,实现继续创建新的计算列。 jsl.png 参考文档 详情请参见Python组件的数据查询与处理技术指南
=83cfa432-7a85-4ff3-8472-9e48112ea33d 2.2 代码解读 在仪表盘Python组件中,这里只会贴一个代码片段,然后系统会自动将用户编写的代码片段提交到后台的Jupyter Kernel中执行。一些基础包已在Jupyter Kernel中初始化了,当然也可以在该代码片段中添加所需 … ": "销售表", "conds": [${品牌}] } 执行mql函数 df_sales = detail_trend_data_query_assistant(sql_json) 正常的pandas对dataframe的处理 # 提取年份信息 df_sales['年'] = df_sales['销售数据挖掘-支持向量机
时间。 正则参数 参数范围为:>=0的数,默认值为 :0。 正则项系数,损失函数中的 。 正则化可以解决模型训练中的过拟合现象; 正则项系数越大,模型越不会过拟合。 收敛阈值 参数范围为:>=0的数,默认值为 :0.000001。 收敛误差值。 收敛误差值,当损失函数取值优化到小于收敛阈值时停止迭代。 分类阈值 参数范围为:0~1。默认值为:0.5。 在二进制分类中设置阈值thresholds。 如果模型预测结果为分类标签1的估计概率>thresholds,则预测为1,否则为0。高阈值是鼓励模型更频繁地预测0,反之则预测为1。 自动调参设置 系统默认的各项数据挖掘-梯度提升决策树
概述 梯度提升决策树原理是训练多棵CART分类树,每棵树建立是基于前一课树的残差,不断的迭代拟合前一课树的残差,通过损失函数的负梯度来拟合,直到残差达到最小。 示例 使用“银行零售客户流失”案例数据,包含17个特征列和1个二类的目标标签。需要对银行客户预测是否流失。通过数据预处理及模型训练,如下 … 。 当模型达到该深度时停止分裂; 树的深度越大,模型训练的准确度更高,但同时也会增加模型的计算量且会导致过拟合; 学习率 取值范围:(0,1]的数;默认为空。 收敛步长,其决定着目标函数能否收敛到局部最小值以及何时收敛到最小值。较小的步长意味需要更多的迭代次数。 学习率决定了参数移动数据挖掘-支持向量机
时间。 正则参数 参数范围为:>=0的数,默认值为 :0。 正则项系数,损失函数中的 。 正则化可以解决模型训练中的过拟合现象; 正则项系数越大,模型越不会过拟合。 收敛阈值 参数范围为:>=0的数,默认值为 :0.000001。 收敛误差值。 收敛误差值,当损失函数取值优化到小于收敛阈值时停止迭代。 分类阈值 参数范围为:0~1。默认值为:0.5。 在二进制分类中设置阈值thresholds。 如果模型预测结果为分类标签1的估计概率>thresholds,则预测为1,否则为0。高阈值是鼓励模型更频繁地预测0,反之则预测为1。 自动调参设置 系统默认的各项数据挖掘-梯度提升决策树
概述 梯度提升决策树原理是训练多棵CART分类树,每棵树建立是基于前一课树的残差,不断的迭代拟合前一课树的残差,通过损失函数的负梯度来拟合,直到残差达到最小。 示例 使用“银行零售客户流失”案例数据,包含17个特征列和1个二类的目标标签。需要对银行客户预测是否流失。通过数据预处理及模型训练,如下 … 。 当模型达到该深度时停止分裂; 树的深度越大,模型训练的准确度更高,但同时也会增加模型的计算量且会导致过拟合; 学习率 取值范围:(0,1]的数;默认为空。 收敛步长,其决定着目标函数能否收敛到局部最小值以及何时收敛到最小值。较小的步长意味需要更多的迭代次数。 学习率决定了参数移动坐标轴设置
、以产品内置Demo资源的“订单模型”作为数据来源。 3、操作步骤 (1)添加双Y联合图组件,在数据选择区中,勾选 产品类别 、销售量 和 销售额 字段,由系统自动分配到 X轴 和 Y轴 上;或拖拽 产品类别 字段到 X轴 , 销售量、销售额 字段到 Y轴 。 shujushezhi-01.png (2)组件 … 、Min函数计算,手动输入其他函数无效,并实时校验公式是否合理; 在公式编辑框中可通过+ - * / 运算符,可以将动态字段和静态值结合起来做计算。如:Max(销售量)*1.5+50。 shujushezhi-13.png 3 坐标轴样式设置 组件属性设置中,可以进行坐标轴样式的设置,包括“名称、刻度、轴线自助ETL-前端接口说明
datamining.setCustomSaveCallback(function (result) { console.info(result) }) }) } } export default SaveDialogExtender ``` # 扩展接口 扩展接口是自助ETL/挖掘中提供的外部对系统进行修改 … }) }) ``` ### DATAMINING_ON_INIT **触发时机**:打开自助ETL/数据挖掘界面后 **作用**:获取editor对象,并调用其中的方法,例如,设置保存后的回调函数。 | | **名称** | **类型** | **说明大数据散点图
下图是模拟三角函数(正弦sin)的图像显示,体现周期性特点: image2018-9-6 16:55:2.png 优势 大数据量的情况下,在图形上能得到秒级渲染展示。 劣势 无法自定义单个数据项的样式。 配图建议: 列区:1个度量; 行区:1个维度/1个度量; 数据要求 … 。 示例 业务情景描述:三角函数(正弦sin)图像的研究。 效果 image2018-9-6 16:55:2.png 数据结构 以上业务情景的数据来源于关系数据源“northwind”的“t_scatter_large”,数据如下: image2018-9-21 16:31:44.png 操作步骤 (1附录:扩展包开发规范
中新增一个自定义计算函数 原始做法:直接重写整个菜单初始化方法,在同期值菜单下增加子菜单项:交易日环比。 FieldsSpace.prototype.initFuncMenu = function() { var PopupMenu = jsloader.resolve … ); } } } 7 避免导入资源覆盖原有资源 在使用PostUpgrade升级类导入资源时,需要仔细思考名称及路径的命名,避免出现覆盖目标系统资源或无法导入的情况。另外,不允许在升级类中导入知识库。 https://static.dingtalk.com/media