第52页,共407页。 显示 4,064 条结果 (0.035 秒)
数据挖掘-合并列/合并行
。 image2021-9-13_19-32-34.png 其中,输出合并表的字段名默认以第一个输入端口对应结果集的字段名。 示例 1、关系数据源中有如下三张表: image2021-9-13_19-40-41.png 2、新建实验,在画布中拖拽如下节点: image2021-9-13_19-45-1.png 多个数据源必须从“合并行”输入端口 … 。 参数设置 设置合并列的参数: image2020-5-21 16:48:31.png 设置说明如下: 参数 说明 选择左表字段 用于选择通过左侧输入端口连接的前置节点资源输出的数据集的列: 2022-02-11_15-45-26.png 选择右秒懂!模型参数的应用与生存法则
)选择产品类别表的产品类别、产品表的产品名称、订单明细表的单价3个子查询的字段展示 ①勾选了参数显示,因为订单明细表的子图包含订单表(参数所在的子查询),所以选择的字段在同个子图内,参数设置勾选上“默认生效”时,切换参数时,单价的值会受参数值影响;但产品类别和产品名称因为不在子图内,则不受参数影响,如下 … (二)不勾选“默认生效”: 选择的字段不在同个子图内,切换参数不生效 选择的字段在同个子图内,切换参数也不生效,只影响参数所在子查询的结果 (1)选择产品类别表的产品类别、产品表的产品名称、订单明细表的单价3个子查询的字段展示。 没有勾选“默认生效”时,若取数子图中没有选择与参数相关的表或查询,该参数增量抽取介绍
”是 field,上一次抽取时 field 字段的最大值表示为 last_max(field),则本次抽取获取增量数据的过滤条件是 field > last_max(field)。 只能选择整型、日期、日期时间类型的字段。 只能选择一个字段,暂不支持计算列、分组字段。当前场景选择”OrderID“字段 … 的过滤条件是 field > last_max(field)然后通过“用于标识新增数据的参数”,将上述过滤条件传递到查询中。 只能选择与该表/查询映射的参数,如果没有映射参数,将不能进行增量抽取。 与参数关联的字段 只能选择数值型、日期、日期时间类型的字段。暂不支持计算列、分组字段。 增量数据入库数据挖掘-OneHot编码
,特征索引和特征值组成。 image2020-9-11_16-15-16.png 输入/输出 输入 没有输入端口。 输出 一个输出端口,用于接入下一个节点,与抽取节点组合使用。 参数设置 参数名称 说明 备注 新增列后缀 用于设置在原字段名后追加后缀生成新的列,默认后缀为:OneHot; 该节点与抽取、变换节点组合使用; image2020-9-8_9-48-8.png 非法数据处理策略 选择对非法数据进行处理的策略,非法数据指空值或未进模型的类别值。 自动过滤:在转换时,对在抽取时未出现的类别或空值二手车交易价格预测
交易价格预测; 2)对获取的数据进行基本的处理操作,相关性分析输入特征; 3)根据统计特征数据建立二手车交易价格预测模型; 4)对模型结果进行评估。 实施过程 本案例共收集到15万条二手车历史数据,字段详细说明如下: 字段名称 类型 字段说明 SaleID 整型 交易ID,唯一编码 name 整型 汽车交易名称,已脱敏 regDate 整型 汽车注册日期,例如20160101,2016年01月01日 model 浮点型 车型编码,已脱敏 brand 整型 汽车品牌,已脱敏二手车交易价格预测
交易价格预测; 2)对获取的数据进行基本的处理操作,相关性分析输入特征; 3)根据统计特征数据建立二手车交易价格预测模型; 4)对模型结果进行评估。 实施过程 本案例共收集到15万条二手车历史数据,字段详细说明如下: 字段名称 类型 字段说明 SaleID 整型 交易ID,唯一编码 name 整型 汽车交易名称,已脱敏 regDate 整型 汽车注册日期,例如20160101,2016年01月01日 model 浮点型 车型编码,已脱敏 brand 整型 汽车品牌,已脱敏回写-文件上传报错
的关键字,不要使用file作为字段名,可使用c_file。比如oracle数据库,file就是oracle数据库的关键字,详细可参考文档 https://www.cnblogs.com/yingsong/p/4485651.html https://www.cnblogs.com/yingsong/p/4485651.html 。 注:修改了数据库字段之后,需要在smartbi数据源表中右键同步表后保存。指标模型-指标存储管理
显示当前指标模型所有 表不存在 和 表结构不一致 的维表和事实表。 ● 表不存在:在指标模型上存在定义信息,但在指标存储库中并没有对应的表。 ● 表结构不一致:在指标模型上定义的结构和指标存储库中的表结构不完全一致,如 字段个数不同、字段名一样但是否为主键或是否为空 属性不同 … 库 指标模型与指标存储库的关联设置如下: 1、在“数据准备”界面的资源目录中,“指标模型”节点或其子目录的更多菜单中选择 新建 > 指标模型。 2023-01-30_14-25-59.png 2、在弹出的“新建指标模型”窗口中设置好名称,选择好数据源和Schema。其中“选择数据源”和“选择schema”用于Excel数据导入完整教程
。 列设置 image2019-8-23 11:2:33.png 字段名和字段类型:根据基本设置中设置的表自动读取。 是否主键:缺省会自动从数据库读取,但用户可以更改,例如选择学校代码、单位号作为主键。 是否允许为空:缺省会自动从数据库读取,但用户可以更改。绑定输入:设置数据库表列 … 。当开启批量,则会每执行1000条SQL,或结束扫描Excel时提交一次事务,性能较好。 列设置 image2019-8-23 11:2:33.png 字段名和字段类型:根据基本设置中设置的表自动读取。 是否主键:缺省会自动从数据库读取,但用户可以更改,例如选择学校代码、单位号作为多维分析如何实现数据标注效果?
该宏示例在 V10.5上 验证通过 提示:本文档的示例代码仅适用于本文档中的示例报表/场景。若实际报表/场景与示例代码无法完全适配(如使用功能不一致,或多个宏代码冲突等),需根据实际需求开发代码。 示例说明 在项目中需要显示多维分析报表的同时也要显示某些数据的标注说明。如对字段名’销售量‘以及含有’2016年‘的字段名进行标注,对于此类问题可以通过宏实现,具体效果如下图: image2020-6-10 18:21:24.png 设置方法 在“分析展现”节点下,创建一张多维分析; 选中多维分析,右键选择 编辑宏 进入报表宏界面。 在报表宏界面新建客户端模块,在弹出的新建模块对话框中选择对象为