第77页,共184页。 显示 1,835 条结果 (0.03 秒)
数据挖掘-标准化
输入 没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用 参数设置 参数名称 说明 备注 新增列后缀 用于设置在原字段名后追加后缀生成新的列,默认后缀为:Normalized; 必填 图片17.png 单位标准差归一化 数据减去均值再除以标准差 勾选则将输出入据进行单位标准差归一化 平均数据中心化 数据减去均值 勾选则将数据进行中心化 示例 使用“鸢尾花数据”,特征选择4个特征列,勾选单位标准差归一化,输出结果如下图: image2020-6-4 10_7_49.png 标准化数据挖掘-相关性分析
概述 相关性分析是用来反映变量之间的相关关系的密切程度。相关系数的取值一般介于-1和1之间。当相关系数为正的时候,意味着变量之间是正相关的;当相关系数为负的时候,意味着变量之间是负相关。 相关性分析常用在数据探索阶段,当我们并不了解原始数据各字段之间的关系时,通过相关性分析,可以看到各个字段之间的相关性,其后进行的数据分析工作可以围绕这些相关性展开。 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出相关系数的数据集。 参数设置 参数名称 说明 备注 选择列 用于选择进行相关性分析的字段列 必填ETL的Excel数据源:文本数据是0003676 ,执行后变成3676
(本文档仅供参考) 问题说明 ETL中使用Excel数据源,上传Excel文件,excel数据是文本,数据是0003676 ,但是执行出来前面的000没有了,如下图: image2024-1-17_17-7-54.png image2024-1-17_17-8-11.png 解决方案 这是由于ETL中使用了spark自动推断数据类型,原来的0003676这种格式推断数据类型后会变成3676,若不使用自动推断类型,全部字段会被当成字符串处理,这样的逻辑就更加不合理了,暂时没办法从代码上解决这个问题。 可以通过一些操作来规避:打开excel文件,在数据行开始前插入一行,有问题的列插入字符串型数据,其他列按照原先的类型插入条件格式告警 - 对比数据,高亮显示
(本文档仅供参考) 需求: 有两个sheet页,一个sheet页是汇总页,一个sheet页是明细页,需要将明细页"管理费用合计"数据与汇总页"管理费用"数据做对比,若数据不一致则高亮显示。 表样设计如下 汇总页: 01.png 明细页: 02.png 解决方案: 关于此需求可以结合vlookup函数及条件格式实现,具体步骤如下: (1)由于两列单元格不在同一行,通过vlookup函数获取到明细页的数据,关于vlookup函数的使用,可以参考百度引擎上的相关示例,如:https://jingyan.baidu.com/article查询结果集单元格超出了系统选项设置的【内存数据库最大返回单元格数】
(本文档仅供参考) 问题现象 查询结果集单元格超出了系统选项设置的【内存数据库最大返回单元格数】 系统选项设置的内存数据库最大返回单元格数是20万,但是灵活分析设置的每页是显示100行,一共也就是200多列,不可能会超过20万的,把内存数据库最大返回单元格数设置为30万就正常不报错了,这个是为什么呢 … 会加载1000行*200多列,也就是20多万个单元格了。 针对这种现象,可以适当根据内存大小,去把内存数据库最大返回单元格数最大一些,或者将内存数据库返回最大行数调成100。数据模型如何实现先计算再汇总
列,设置num1/num2 https://s2-cs-pub-std.oss-cn-shanghai.aliyuncs.com/icon/tid8599/mceclip8_1700638550258_okos8.png https://s2-cs-pub-std.oss-cn-shanghai.aliyuncs.com/icon/tid8599/mceclip9_1700638564929_39ui5.png 2、将计算列转换为度量 https://s2-cs-pub-std.oss-cn-shanghai.aliyuncs.com/icon/tid8599透视分析(旧)的占比功能, 能否直接以最大的合计为基数来计算占比?
(本文档仅供参考) 问题说明 在使用咱们透视分析的占比功能时,发现占比显示有些混乱,有的是大项里面进行占比计算,有的是小项里面进行计算,如下图: image2018-11-23 10:46:14.png 能否直接以最大的合计为基数来计算占比? 解决方案 该效果可以将【销售量】的【值的显示方式】改为【列汇总百分比】: image2018-11-23 10:49:55.png image2018-11-23 10:50:18.png 修改占比 设置占比是所有合计的电子表格点击在新窗口打开超链接
如果想实现隐藏url,只显示超链接网站的标题,点击标题实现跳转,如下图: 打开超链接扩展.gif 电子表格制作中使用两列,然后把url所在列C列隐藏后发布电子表格 image2020-3-6 15:43:36.png 宏方案: 在电子表格中右键 编辑宏 ,新建一个服务端宏模块,宏对象及事件如下Excel融合分析工具栏引用参数、参数排版、默认参数介绍
。 image2020-7-31_10-33-40.png (3)插入一行单元格作为标题,在单元格B1输入地区销售情况,然后选中单元格A1,选择 引用参数,引用参数值“销售区域”。 06.png 引用参数值设置如下: 2021-08-25_15-43-14.png (3)调整单元格行高与列宽,优化报表展示效果 … https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=69737557 (2)拖拽“发货人”等字段到Excel融合分析中。 image2020-7-31_10-43-12.png (3)调整单元格行高和列宽,点击预览效果,查看报表基本情况Smartbi V10.5-安装部署
在线分析处理,用于存储历史数据以支撑复杂的分析操作,侧重决策支持。采用MPP架构,支持行存储与列存储,提供PB级别数据量的处理能力。拥有低成本、高性能、高可靠、支持海量数据等优点。 功能简介 新版本中,Smartbi 支持 GaussDB 200 数据库作为产品知识库。在Smartbi Config 配置界面,知识库 … 】业务库支持 MonetDB 数据库 背景介绍 MonetDB是一个开源的面向列的数据库管理系统。MonetDB被设计用来为较大规模数据(如几百万行和数百列的数据库表)提供高性能查询的支持,常用于对数据读取有高性能要求。 功能简介 新版本中,Smartbi 支持 MonetDB 数据库作为产品业务库,可在