第32页,共200页。 显示 1,999 条结果 (0.058 秒)
Smartbi API接口插件
后的字符串。 若该参数值含有特殊符号,需要特殊处理,例如使用encodeURIComponent转义 2.4 API接口说明 目前在Smartbi API接口插件中仅整理了一部分的常用接口,具体接口调用方式和接口说明请见附件文档:SmartbiAPI接口说明文档V1.2.pdf快速准备数据并创建仪表盘
销售利润下滑主要是在2021年5月20号数据出现异常。 4.3.3 品类分析 1、点击左侧的 组件 选择 图形 分类,在 柱图 上点击+ 2、把右侧 数据 面板 维度 区的字段“产品类别”和 度量 区字段“销售利润” 分别拖拽到 组件设置 面板的 X轴 和 Y轴 区域 3、上一步分析到5月20号的利润异常,若想查当天具体产品的利润数据,则可以点击图表上的 作为筛选器 并 作用于 品类柱图 4、可点击品类柱图 下钻 到具体产品的销售利润 品类分析.gif 由此分析可定位到2021年5月份销售利润下滑主要是由于5月20号巧克力的销售出现了大量亏损。 4.3.4 明细数据分析 1、点击左侧的 组件 选择 表格 分类数据挖掘-WOE编码
。 参数设置 参数名称 说明 备注 选择列 用于选择进行异常值处理设置的字段。 31.png 必填(特征列中不能含有null) 分箱方式 分位数分箱:根据设置的数值算出对应的分位数,按照算出的分位数对字段进行分箱。 自定义分箱:用户可以自定义对字段进行分箱的区间。 不参与分箱:该字段不参与分箱。 设置 分位数分箱:将字段分成指定个部分,每一部分作为一个箱。比如设置分箱数为4,则计算出25%、50%、75%这3个分位数,将字段分为四个分箱。 自定义分箱:用户自己定义分箱区间。如-INF,500,1000数据挖掘-WOE编码
。 参数设置 参数名称 说明 备注 选择列 用于选择进行异常值处理设置的字段。 31.png 必填(特征列中不能含有null) 分箱方式 分位数分箱:根据设置的数值算出对应的分位数,按照算出的分位数对字段进行分箱。 自定义分箱:用户可以自定义对字段进行分箱的区间。 不参与分箱:该字段不参与分箱。 设置 分位数分箱:将字段分成指定个部分,每一部分作为一个箱。比如设置分箱数为4,则计算出25%、50%、75%这3个分位数,将字段分为四个分箱。 自定义分箱:用户自己定义分箱区间。如-INF,500,1000航空公司客户价值分析
整个预处理流程图如下: 图片17.png 建立模型 客户价值分析模型构建主要由两个部分构成,第一个部分根据航空公司客户五个指标的数据,对客户作聚类分群。第二部分结合业务对每个客户群进行特征分析,分析其客户价值,并对每个客户群进行排名。 客户聚类 采用 K均值 https航空公司客户价值分析
整个预处理流程图如下: 图片17.png 建立模型 客户价值分析模型构建主要由两个部分构成,第一个部分根据航空公司客户五个指标的数据,对客户作聚类分群。第二部分结合业务对每个客户群进行特征分析,分析其客户价值,并对每个客户群进行排名。 客户聚类 采用 K均值 https仪表盘中实现开始时间与结束时间选择不超1个月的时间范围
(此文档仅供参考) 问题描述: 比如:仪表盘中,有一个开始日期和结束日期的筛选器,比如选了10月12号,那结束日期最多只能选到11月12号这样。 解决方案: 思路如下:模型中sql查询,并新建对应开始和结束日期的模型参数。其中结束日期基于开始日期的参数选择值进行范围取值的控制。 image2024-11-1_17-24-41.png image2024-11-1_17-27-9.png image2024-11-1_17-27-42.png 效果如下: image2024-11-1_17-28-2.png 注:这种情况下,就不能进行一些时间计算操作,因为参数这边的取值是直接基于sql查询的条件去取的,这个是需要使用MS SQL Server提示端口号无效
(本文档仅供参考) 问题描述 MS SQL Server数据库在数据源处连接成功 image2024-1-25_10-53-40.png 但使用是提示端口号无效,com.microsoft.sqlserver.jdbc.SQLServerException:端口号 1433/ekp 无效。 image2024-1-25_10-53-14.png 解决方案 需修改连接字符串为 jdbc:jtds:sqlserver://<servername>:1433;DatabaseName=<database> 连接示例可参考:MS SQL Server数据1、数据挖掘执行引擎集群
部署执行引擎集群(一主一备) 数据挖掘执行引擎高可用一主一备无需zookeeper,需要部署两个执行引擎,,并进行相关配置即可 主机名 角色 10-10-35-176 执行引擎(主) 10-10-35-177 执行引擎(备) 主节点挂掉后,备节点需要1分钟左右才能感知到并执行切成主 … 挖掘执行引擎集群 启动smartbi中配置的数据挖掘执行引擎地址主节点 cd /data/smartbi-mining-engine-bin/engine/sbin/ ./experiment-daemon.sh start 7、启动备用节点执行引擎 待主节点启动完成后,等待1分钟左右,启动备节点执行引擎 cd数据挖掘-随机森林
概述 随机森林指的是利用多棵树构成森林对样本进行训练并预测的一种分类器。但是每棵决策树之间没有关联,每棵树都是基于随机抽取的样本和特征进行独立训练。 随机森林算法广泛应用于分类问题。其是决策树的组合,将许多决策树联合到一起,以降低过拟合的风险。随机森林支持连续数据或离散数据进行二分类或多分类。 优势:可反映出 … 停止分裂; 树的深度越大,模型训练的准确度更高,但同时也会增加模型的计算量且会导致过拟合; 树的个数 取值范围:大于等于1且小于等于500的整数,默认值为20。 随机森林中决策树的棵数。 衡量准则 gini 裂分标准,Entropy表示熵值,Gini表示基尼指数