第127页,共408页。 显示 4,071 条结果 (0.032 秒)
生成时间层次
时间层次其实是对日期时间的一个细粒度划分,从大到小通常分为“年-季-月-日-时-分-秒”,在数据分析需求中,时间层次只需要小到“日”的粒度即可,因此系统提供的七种时间层次类型:年-半年-季-月-旬-周-日。 生成时间层次:指系统将指定的表示日期信息的字段自动生成时间层次。 设置方法 1、选中日期时间型字段,右键 … 层次在“时间维度管理”窗口中允许修改名称及数据类型。详情请参考 时间维度管理 时间维度管理.png 透视分析数据挖掘-卡方特征选择
概述 卡方特征选择与特征选择的功能类似,都是用于筛选特征到算法节点。卡方特征选择是根据卡方检验的数据相关性对特征变量进行排序,然后选择与目标变量相关性较大的特征变量。不同之处是卡方特征选择只设置需要选择的特征数量,然后该节点会根据目标字段列自动选择最相关的特征。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出接收到的数据集。 参数设置 参数名称 说明 备注 选择特征列 用于设置待选择的特征列(人工选择可能相关的特征列) 必填(特征列中不能含有null) 选择标签列 用于设置数据挖掘-卡方特征选择
概述 卡方特征选择与特征选择的功能类似,都是用于筛选特征到算法节点。卡方特征选择是根据卡方检验的数据相关性对特征变量进行排序,然后选择与目标变量相关性较大的特征变量。不同之处是卡方特征选择只设置需要选择的特征数量,然后该节点会根据目标字段列自动选择最相关的特征。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出接收到的数据集。 参数设置 参数名称 说明 备注 选择特征列 用于设置待选择的特征列(人工选择可能相关的特征列) 必填(特征列中不能含有null) 选择标签列 用于设置地图组件通过地理维度跳转至不同资源
,添加所需的地理维度字段和资源id image2024-5-14_16-6-52.png 3、地图中拖放省份、资源id字段 image2024-5-14_16-7-59.png 4、数据模型中添加参数,备选值为地理维度和资源id image2024-5-14_16-16-41.png 5、跳转规则中跳转地址设置: http://localhost:18080/smartbi/vision/openresource.jsp?resid=${参数名称} 跳转目标值配置数据模型中添加的参数 image2024-5-14_16-17-32.png 完成以上步骤,点击地图可以跳转到不同资源数据挖掘-梯度提升决策树
图: image2020-6-4 16:33:34.png 其中,特征离散是将年龄、卡龄等数据离散化,是为了提高模型的准确度,提高运行速度。 模型构建中,梯度提升决策树的各个参数: 参数名称 值 说明 归一化 正则化 详情请参考 归一化 https … 的值越大,模型训练更充分,但会耗费更多时间。 分裂特征的数量 取值范围:>=2的整数; 默认值:32。 对连续类型特征进行离散时的分箱数; 该值越大,模型会计算更多连续型特征分裂点且会找到更好的分裂点,但同时也会增加模型的计算量; 树的深度 取值范围:[1,30]的整数;默认值为4系统监控
系统提供系统监控入口,支持对系统网络,服务器等全面监控。便于用户优化系统参数,定位性能瓶颈。 系统监控是拥有管理员角色的用户登录才能看到的。 操作入口 在界面右上角选择 用户名称 > 系统监控,如下图: 15.png 界面介绍 系统监控.png 该界面中包含 ,以及系统监控中的不同的监控模块。说明如下 … 、jvm的内存、线程等等。 服务监控 监控挖掘服务的运行状况,包括运行服务的状况、缓存、jvm的内存、日志等。 计算节点 计算节点是指计算节点运行状态,即spark集群运行状态的监控。 作业流监控 监控作业流的运行情况,包括在线作业流、等待作业流、历史作业流等。 系统补丁 通过安装数据挖掘-梯度提升决策树
图: image2020-6-4 16:33:34.png 其中,特征离散是将年龄、卡龄等数据离散化,是为了提高模型的准确度,提高运行速度。 模型构建中,梯度提升决策树的各个参数: 参数名称 值 说明 归一化 正则化 详情请参考 归一化 https … 的值越大,模型训练更充分,但会耗费更多时间。 分裂特征的数量 取值范围:>=2的整数; 默认值:32。 对连续类型特征进行离散时的分箱数; 该值越大,模型会计算更多连续型特征分裂点且会找到更好的分裂点,但同时也会增加模型的计算量; 树的深度 取值范围:[1,30]的整数;默认值为4SSAS(分析服务)优化手册
保证唯一性) 4、 维度表中的字段如果没有分析意义,或暂时不用作分析,不要将它建为属性 5、 避免为每个维度指定多个不可聚合的属性(即IsAggregatable不要设为False) 6、 属性如设为不可聚合(IsAggregatable设为False),要指明DefaultMembers的值 7、 对具有 500,000 个或更多成员的属性使用数字键列 8、 有些说明性字段(比如客户的电话、邮箱地址),如果将它建为属性,请将AttributeHierachyEnabled 设为 False 9、 每个维度最好建立一个层次结构 1) 在维度中建立层次结构。如维度向导没有发现这些层次结构,要自行添加。 2Infobright 数据迁移到 SmartbiMppMD
工具访问知识库,输入查询语句: select * from t_restree where c_extended like '%"isExcelImport":true%' 如下图所示 image2022-1-25_17-16-48.png 表字段c_resname即Excel导入数据表名称,表字段 … 数据源包含数据行权限”,点击确定 图片3.png 将导出的资源保存在本地。 2、创建Infobright数据源连接 1)新建Infobright数据连接,连接到用于旧版高速缓存库的Infobright数据库,名称设置为“Infobright_db”,测试连接成功后,保存 产品附带的InfobrightInfobright 数据迁移到 SmartbiMppMD
工具访问知识库,输入查询语句: select * from t_restree where c_extended like '%"isExcelImport":true%' 如下图所示 image2022-1-25_17-16-48.png 表字段c_resname即Excel导入数据表名称,表字段 … 数据源包含数据行权限”,点击确定 图片3.png 将导出的资源保存在本地。 2、创建Infobright数据源连接 1)新建Infobright数据连接,连接到用于旧版高速缓存库的Infobright数据库,名称设置为“Infobright_db”,测试连接成功后,保存 产品附带的Infobright