第140页,共308页。 显示 3,076 条结果 (0.049 秒)
数据挖掘-列选择
概述 列选择节点用于从输入数据集中选取指定的数据字段。 常用于数据集中字段过多,对分析结果无用,而又影响分析效率的情况。 image2020-5-21 16:31:1.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出列选择的结果。 参数设置 设置列选择的参数: image2020-5-21 14:5:14.png 设置说明如下: 参数 说明 选择输出列 用于选择通过输入端口连接的前置节点资源输出的数据集的列: 2022-02-11_15-08-46.png 示例数据导航
对于大部分用户、尤其是业务用户来说,进行数据分析要面对的第一个问题,就是“找数据”,用户通常会有这些疑问:平台已有哪些数据?怎样快速找到我要的数据?我找到的数据到底是不是我想要的?(数据口径)。数据导航就是解决“找数据”的问题的。 数据导航的基本概念是:在安全受控的前提下开放企业数据资产给用户,业务用户可以在数 … 数据快查,确定是否是自己需要的数据。数据快查包含数据结构、数据预览、血统分析。 image2020-8-7_9-37-49.png image2020-8-7_9-39-29.png 数据申请: 用户确定了是自己需要的数据源、数据集或业务主题后,可通过数据权限申请流程快速获取需要的数据数据答疑
功能概述 用户在数据分析过程中遇到另一个比较重要的问题就是“如果我在使用过程中遇到了问题,如何及时响应并解决问题。”数据答疑就是为解决用户的困惑而诞生的。 数据答疑提供了用户和支持人员交流互动的平台。数据答疑确保用户在使用系统的过程中能随时获取多种方式的技术支持 … 快速查看有价值的问题。通过这些功能,分析的知识就能有良好的沉淀。 image2020-6-28 13_5_15.png数据挖掘-卡方特征选择
标签列字段 必填 需选择的特征数量 用于设置从待选择的特征列中输出特征列的数量 必填(范围是[1,已选择特征的数量]的整数) 示例 卡方特征选择中输入和输出的数据集结果一致。 使用“鸢尾花数据”,选择4个特征列和1个标签列以及设置需选择的特征数量为2,根据卡方特征选择的分析结果得出2个最相关的特征。分析结果如下图: 图片3.png 卡方特征选择排序
是指根据某数据列对表格区中的数据重新进行排列的一类分析方法。 系统提供如下几种排序方式: 升序:不考虑维度因素,只根据所选数据列的度量值按照从小到大排列。 降序:不考虑维度因素,只根据所选数据列的度量值按照从大到小排列。 分级升序:考虑维度因素,外层维度顺序不变,只对最内层维度根据所选数据列从小到大排列。 分级降序:考虑维度因素,外层维度顺序不变,只对最内层维度根据所选数据列从大到小排列。 取消排序:取消所有排序设置。 操作入口: 总入口:在当前多维分析表格区选中的数据列的列按钮中单击 排序 按钮,弹出排序下拉菜单。 image2019-11-1 14:8:2.png 升序:在排序下拉菜单中选电子表格⬝ 概述
电子表格是企业报表平台的解决方案专家,基于Excel创新地实现报表设计,满足各种格式的行业监管报表、内部管理报表的需求。包括:清单报表、交叉报表、分组报表、多源分片报表、分块报表、表单报表、图形报表、回写报表、假设分析报表、二次计算报表、套打报表、段落式报表、预警报表(Excel条件格式)。 下图是基于电子表格 … 函数,例如财务函数、统计函数、逻辑函数、三角函数等; 支持杜邦分析、时间序列预测等,并可以使用宏进行扩展; 支持使用第三方Excel模板,如美化大师,来对表格和图形进行美化; 报表制作充分简化,直接将数据字段拖拽到Excel模板上,发布即可; 在电子表格中制作的报表,发布后统一在Smartbi门户(或用户自己数据挖掘-列选择
概述 列选择节点用于从输入数据集中选取指定的数据字段。 常用于数据集中字段过多,对分析结果无用,而又影响分析效率的情况。 image2020-5-21 16:31:1.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出列选择的结果。 参数设置 设置列选择的参数: image2020-5-21 14:5:14.png 设置说明如下: 参数 说明 选择输出列 用于选择通过输入端口连接的前置节点资源输出的数据集的列: 2022-02-11_15-08-46.png 示例数据挖掘-LDA
概述 LDA是一种主题模型。它是一个三层贝叶斯概率模型,包含词、主题和文档三层结构。 它是一种非监督机器学习技术,可以识别出大规模文档集或语料库中的主题。 常用于做文本挖掘聚类分析。 参数设置 参数名称 说明 主题数目 主题数,或者聚类中心数。默认值为2 … 。 值越大,推断出的分布越平滑 示例 使用文本数据,分析主题词分布情况以及各词的概率权重。 image2020-9-8_10-11-22.png lda系统访问慢/卡顿的几种信息采集方式
(本文档仅供参考) 问题 客户反馈不管是通过nginx转发还是直接访问BI服务器地址,打开资源操作普遍都比较慢,但是后台的cpu和内存都是空闲的,要如何分析信息? 解决方案 正常对于问题现象进行跟进分析需要采集一些信息,这里依据于不同层面的原因提供需要采集信息的方式: 1、录制CPU验证是否是服务器端慢 录制CPU采样可参考wiki文档:https://history.wiki.smartbi.com.cn/pages/viewpage.action?pageId=44500290 https://history.wiki.smartbi.com.cn/pagesSQL查询和原生SQL查询有什么区别?
(本文档仅供参考) SQL查询 原理:对用户撰写的SQL进行一层包装,添加更多分析功能。 例如客户写的是select t.x as Fa, (t.x+t.y) as Fb from T where .... 那么封装后就变成: select Fa, Fb //可以选择显示那些字段 … 别名;用不了select * 语法;对SQL做多一层封装,对于某些数据库来说,可能效率会低一些; 原生SQL查询 原理:不对用户的SQL做任何封装,直接提交到数据库。 优势:对SQL语法没有任何限制;速度更快; 劣势:不计算总行数;如果查询结果较大,用户可能不知道结果集大小;在灵活分析的展现界面,不支持