第223页,共365页。 显示 3,642 条结果 (0.117 秒)
服务引擎
针对挖掘服务的设置项。 服务引擎页面如下: 66.png 各设置项说明如下: 序号 名称 说明 1 引擎服务端口 实验引擎的服务端口 2 引擎高可用时连接zookeeper地址 引擎高可用时,使用zookeeper进行主备选举,ip:port格式,如有多个zookeeper节点则为ip1:port1,ip2:port2,ip3:port3 使用逗号分隔。 3 引擎高可用设置,默认为不可用 是否启用引擎高可用,默认为false,即不启用引擎高可用。 4 系统api地址 实验引擎访问Smartbi的api地址。 5 节点数据是否存储 实验引擎数据挖掘–指数平滑
列,名称规则为被预测列的列名增加前缀,输出结果经过了指数平滑算法的拟合处理。另一列表明拟合列中的数据是否是预测结果,0表示是对历史数据的拟合,1表示是通过拟合数列对未来的预测。 image2023-1-15_0-39-15.png参数值控制查询字段
在Smartbi中,参数不仅只用于SQL的Where部分作为数据过滤,还可以用于Select部分,用于控制数据集的输出字段。 本示例演示通过勾选参数值内容,控制报表的输出字段。 实现步骤 1、新建参数 新建一个平铺勾选面板参数,设置参数的数据类型为“其他类型”。也可以设置控件类型为下拉框、对话框等。 image2019-11-12 15:47:9.png 2、参数的备选值设置 这里用静态列表方式。注意: 真实值必须为数据库中的字段名称。 所有字段必须来自于同一个表,这里不支持跨表查询。 image2021-8-28_17-32-15.png 3、新建原生SQL数据集 数据集内容为“select 参数演示MDX表达式参数
{}中的成员名称可以直接从左侧目录树上拖拽成员自动生成,必要时可以点击预览数据按钮预览MDX执行结果。 1005.png 3、在多维分析的自定义成员中使用该参数 新建多维分析,在左侧自定义成员—局部节点上新建自定义成员,在MDX表达式中拖入定义好的参数,保存后将参数拖拉到查询面板中。关于自定义成员的具体用法,请参考数据挖掘-卡方特征选择
概述 卡方特征选择与特征选择的功能类似,都是用于筛选特征到算法节点。卡方特征选择是根据卡方检验的数据相关性对特征变量进行排序,然后选择与目标变量相关性较大的特征变量。不同之处是卡方特征选择只设置需要选择的特征数量,然后该节点会根据目标字段列自动选择最相关的特征。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出接收到的数据集。 参数设置 参数名称 说明 备注 选择特征列 用于设置待选择的特征列(人工选择可能相关的特征列) 必填(特征列中不能含有null) 选择标签列 用于设置数据挖掘-PCA(主成分分析)
概述 PCA(主成分分析)是统计学上一种常用的方法,主要用来对高维数据进行降维,通过对多个维度进行线性组合,获得较少且能够描述数据特征的主成分指标,减少由于数据维度过多带来的庞大计算量,降低算法的复杂度,使用最少数量的主成分来解释最大量的方差。因为它可减少变量数目以此避免多重共线性,适用于预测变量较多大于观测值数目的情况。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出接收到的数据集。 参数设置 参数名称 说明 备注 选择特征列 用于设置待选择的特征列 必填(特征列中不能含有数据挖掘-特征离散
概述 特征离散的作用是将连续的数据进行等距离散化,就是把连续特征分段,每一段内的原始连续特征无差别的堪称同一个新特征,用户可以根据数据的特征自定义离散区间。 输入/输出 输入 没有输入端口 输出 一个输出端口,用于接入下一个节点,与抽取节点组合使用。 参数设置 参数名称 说明 备注 离散区间数 选择需要进行离散化的特征列,必须是数值列 必填范围是>=2的整数,默认为10 新增列后缀 离散后会生成新的字段,默认在原有字段名后追加Buckrizer后缀。该后缀支持修改。后缀默认值为Buckerizer数据挖掘-自定义离散
概述 将连续的属性进行离散化操作,方便数据挖掘处理。用户可自定义规则进行离散化操作。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出增加了离散后的字段的数据集。 参数设置 参数名称 说明 备注 自定义规则 区间:以英文逗号分隔离散区间,负无穷为-INF,正无穷为INF。 区间为空时,默认该字段不做离散处理。 必填。 区间填写示例:-INF,30,60, 90,INF 新增列后缀 离散后会生成新的字段,默认在原有字段名后追加Buckrizer后缀。该后缀支持修改关于
Smartbi、License和服务器版本相关的信息。 关于 关于页面包含了授权人、版本信息、公司官网链接、麦粉社区链接、版本发布说明链接、公司邮箱等信息。 guanyu-01.png Build:服务器打包时间; Version:服务器版本号; TAG:服务器版本。 License License页面包含信息如下: 2021-09-03_10-13-03.png License授权可以控制内容如下: 名称 说明 授权类型 授权的服务器类型。 授权人 服务器授权的人。 有效期至 服务器截至到什么日期有效。 注册用户数 注册用户的总数(不包括系统用户计划调度日志
用于记录各种计划信息。 界面介绍 “计划调度日志”界面分为“搜索栏、操作区、列表区”,如图: 微信截图_20221230103553.png 搜索栏 可通过设置“名称、任务类型、起始时间、调度结果、调度类型”这些设置项筛选计划。 微信截图_20221230104201.png 调度类型是指在调度计划时生成的日志类型,主要是为了监控用户的行为,如在什么时间点,用户对计划执行了什么操作等。 调度类型 说明 执行 执行计划时生成的日志,包含正常执行、重试执行、立即(手动)执行。 激活 计划的状态更新为启动时生成的日志,包含新建启用状态的计划、从不启用状态改成启用状态的计划