第65页,共343页。 显示 3,423 条结果 (0.062 秒)
自助ETL-界面介绍
=.png 界面介绍 ETL工作流定制界面 ETL流程定制界面用于设计定制ETL工作流。如下图所示: image2022-10-26_16-46-21.png 该界面主要分为如下几个区: 节点资源区:显示当前流程可拖拽使用的资源,最顶端的文本框支持输入资源名称关键字模糊匹配搜索结果。详细介绍请参考自助ETL-节点资源区介绍 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=65606369。 画布区:用于定制ETL工作流。 节点配置区:用于对"画布区"所选资源的参数和属性进行配置。该区默认显示即席查询-计算字段 ⬝ 计算字段
新建计算字段.png 设置项 进入“计算字段编辑”界面,如图: 2022-02-16_14-22-49.png 界面分为两个区域,“可选资源区”和“设置区”。 可选资源区:该区主要列出了设置计算字段可选择使用的资源,也可通过下方搜索框搜索。 只显示即席查询已选择字段:勾选后可选资源区为即席查询当前已选择的字段。 设置区:该区主要列出计算字段设置项,这些设置项说明如下: 设置项 说明 名称 计算字段的名称 数据类型 计算字段的数据类型,有:字符串、整型、浮点型、日期、时间、日期时间。 数据格式 设置计算字段的显示格式,根据数据类型获取对应存在的数据格式。 表达式交互式仪表盘-展开/收缩
设计——展开收缩.gif 2、示例解析:上图效果显示的是具有层次结构的几个区域维度构建的交叉表,可以进行逐层展开和收缩实现查看不同层级汇总数据的效果。 实现步骤 1、定制层次维度: 展开的效果必须以层次维度为基础,因此我们要先定义层次维度。 1)在自助数据集中定义创建层次维度,如下图所示(详细可见 新建层次 … %96%B0%E5%BB%BA%E5%B1%82%E6%AC%A1 ): image2019-8-21 17:26:2.png 2)在仪表盘中创建层次维度: ① 新建仪表盘,数据选择任意自助数据集; ② 在自助数据集资源区的右键菜单选择 新建层次,打开“新建层次”对话框,输入层次名称并保存,资源区显示“区域”层次某政府单位疫情期间网民情绪识别
?pageId=51940619 节点,将微博中文内容重复内容去除,仅保留一条数据。 4、采样 在数据探索时,我们发现数据样本分布不平衡,0分类样本数量是其它类别的2-3倍,这个分布会对模型的预测结果产生影响。大部分模型的默认阈值为输出值的中位数,比如逻辑回归的输出范围为[0,1],当某个样本的输出大于0.5就会被划分为正例,反之为反例。在数据的类别不平衡时,假如正例数量大,反例数量极小,采用默认的分类阈值可能会导致输出全部为正例,产生虚假的高准确度,但这种分类结果并不是我们想要的,往往我们更看重反例的预测效果。因此在实际应用中,解决方法如下: 1)调整分类阈值,使得预测结果更倾向于类别较少的数据。 2)选择合适的评估标准,比如某政府单位疫情期间网民情绪识别
?pageId=51940619 节点,将微博中文内容重复内容去除,仅保留一条数据。 4、采样 在数据探索时,我们发现数据样本分布不平衡,0分类样本数量是其它类别的2-3倍,这个分布会对模型的预测结果产生影响。大部分模型的默认阈值为输出值的中位数,比如逻辑回归的输出范围为[0,1],当某个样本的输出大于0.5就会被划分为正例,反之为反例。在数据的类别不平衡时,假如正例数量大,反例数量极小,采用默认的分类阈值可能会导致输出全部为正例,产生虚假的高准确度,但这种分类结果并不是我们想要的,往往我们更看重反例的预测效果。因此在实际应用中,解决方法如下: 1)调整分类阈值,使得预测结果更倾向于类别较少的数据。 2)选择合适的评估标准,比如组件设置-组件
3、将文本组件拖入画布区,双击编辑文本组件,在工具栏中点击“添加字段”,选择图表1的“产品类别”字段。 image2021-10-13_18-13-34.png 并在后面添加文字“价格情况”。 image2021-10-13_18-12-15.png 4、右键设置这三个组件为“浮动”。 image2021-10-13_18-15-2.png 5、调整组件的位置如图: image2021-10-13_18-25-56.png 工具栏 说明 设置浏览状态下,鼠标移到组件是否显示工具栏。 效果 image2020-8-13_15-16-22.png 如果设置隐藏浏览工具栏,鼠标移到组件上不显示工具栏电子表格-模型查询
、选中数量、单价、销售额的单元格,设置数据设置为“汇总”。 image2022-1-10_18-39-22.png 11、在工具栏中点击“参数管理”。 image2022-1-10_18-30-45.png 12、在参数管理中新增并设置报表参数。关于参数详情请参考 电子表格-参数管理 … 。 数据选择区操作 1、资源树支持的操作:搜索、过滤空目录 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=80973037、刷新。 image2022-1-10_13-59-14.png 2、鼠标移动到维度栏上显示以下按钮: 开启维度和指标关联筛选Excel数据导入完整教程
: image2021-12-16_9-48-49.png b. 继续执行:设置为出现校验异常时,继续执行导入下一条数据,并将这条数据写入到异常日志,供后面下载查看异常原因。 数据处理模式:导入数据的时候是采取增量更新还是全量更新。 全量:把数据库中的表中原有的数据删除,重新导入数据。 增量:在数 … 的数据来源。 不绑定:执行导入时,该列不插入值。 绑定excel列:绑定excel中指定列数据。 绑定excel单元格:绑定excel中指定单元格数据。 绑定参数:绑定参数,该参数为公共设置中定义的参数,选择绑定参数后,执行导入时,导入界面会显示该参数,用户导入前需要先选择参数的值再执行导入,这样这列⬝ 使用Gbase 8S 数据库作为知识库
后面一定要加上“:INFORMIXSERVER=ol_informix1210_1;CLIENT_LOCALE=zh_cn.utf8;DB_LOCALE=zh_cn.utf8;NEWCODESET=utf8,8859-1,819” 其中 INFORMIXSERVER 后边对应的是servicename 即服务名,其他要求不变。 image2021-8-19_18-8-7.png 生成的smartbi-config.xml 文件中可以看到知识库配置信息如下: image2018-9-18 16:8:47.png 如果出现任何文字乱码或数据显示不出来,建议可去查看一下启动程序、服务器、数据源等地方的编码情况是否为UTF-8。使用GBASE 8S 数据库作为知识库
。 image2018-9-18 16:1:10.png 4、配置知识库 数据库名的格式为: dbname:INFORMIXSERVER=ol_informix1210_1;CLIENT_LOCALE=zh_cn.utf8;DB_LOCALE=zh_cn.utf8;NEWCODESET=utf8,8859-1,819 即,数据库名称后面 … 要求不变。 image2021-8-19_18-8-7.png 生成的smartbi-config.xml 文件中可以看到知识库配置信息如下: image2018-9-18 16:8:47.png 如果出现任何文字乱码或数据显示不出来,建议可去查看一下启动程序、服务器、数据源等地方的编码情况是否为UTF-8。