第79页,共561页。 显示 5,604 条结果 (0.071 秒)
数据挖掘-聚合
概述 聚合可根据用户的需求对数据进行各种聚合运算,包括分组、求均值、最大值、最小值、求和、统计、去重统计等等。用户可以根据不同数据类型使用不同的聚合函数以及生成的新特征名称。 image2020-5-29 16:5:11.png 输入/输出 输入 一个输入端口,用于接收数据集 … 除重复数据。 Collect_set:将指定列转为一个数组返回,去除重复数据。 数值类型字段: Group:根据一个或多个列对结果集进行分组。 Count:对包含非空值的列进行计数。 DistinctCount:对列中的非重复值数目进行计数。 Min:返回指定列的最小值。 Max:返回指定列加载文件数据用户权限说明
数据的载体除了有库表之外,还有文件,如excel文件、txt文件等。如何将这些记录在文件中的数据转化成数据库表就是Smartbi加载文件数据要解决的。 使用加载文件数据功能导入数据表操作必须满足如下两个前提条件: 加载的文件数据的目标数据源必须支持“允许加载Excel数据”。设置详情请参见:允许加载Excel数据 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=62292818#id-%E5%8A%A0%E8%BD%BD%E6%96%87%E4%BB%B6%E6%95%B0%E6%8D%AE%E7%94%A8%E6%88%B7%E6%9D%83%E9%99隐藏菜单中的应用商店、数据答疑
(本文档仅供参考,V11验证通过) 问题说明 应用商店、数据答疑两个功能点暂时没有在操作权限进行控制,默认license有模块则所有用户都能看到功能按钮,实际使用过程中并未用到,有什么办法可以隐藏呢? 解决方案 运维设置-界面设置-自定义样式可对其进行修改,如图: li[qtp="LeftSidebar-AppStore"] { display: none; }/*隐藏应用商店*/ li[qtp="LeftSidebar-DataFaq"] { display: none; }/*隐藏数据答疑*/ 自定义样式写法及效果.png 隐藏菜单数据挖掘-PrefixSpan
,韩家炜等人提出了PrefixSpan ( 前缀投影序列模式挖掘)算法,是一种不产生候选频繁序列的算法,并且通过后续的一些工程优化,也可以达到不多次扫描数据库的效果。如下图所示序列数据,它是由若干数据项集组成的序列。比如第一个序列<a(abc)(ac)d(cf)>,它由a,abc,ac,d,cf共5个项集数据组成,并且这些项有时间上的先后关系。对于多于一个项的项集我们要加上括号,以便和其他的项集分开。 image2024-1-18_17-24-32.png 应用场景 PrefixSpan应用于购物篮分析、自然灾害的预测、DNA序列分析、疾病诊断等诸多领域。 应用示例 示例数据PrefixSpanData.xlsx 1电子表格⬝ 多数据集报表
报表简介 多数据集报表基于电子表格支持跨数据集查询基础上实现的数据查询和展现的一类报表。 作用:用于跨数据集查询数据。 适用场景:适用多数据集的分片报表,跨数据集查询的报表。 报表布局:多数据集报表的表格布局没有规律,根据实际业务需求进行规划。 示例效果 分片报表示例中列出了常用的几种分片布局,但都只是基于同一个数据结果集的,本章节中将介绍如何基于多个数据结果集来实现分片报表。 报表示例效果及报表说明请参见 分片报表-示例效果 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=83711358 内容。 本示例效果数据来源为模型查询数据挖掘-过滤
概述 根据用户需求,通过写SQL语句(片段)的方式,对数据集中指定字段进行条件筛选过滤。 image2020-9-8_9-10-20.png 10.5.15版本后,左侧资源树不再显示过滤节点,但是旧的过滤节点仍能正常使用,建议使用最新的行过滤节点完成过滤操作。 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出过滤的结果。 参数设置 设置过滤与映射的参数: image2020-5-21 13:58:29.png 设置说明如下: 参数 说明 过滤器 对数据的指定字段进行过滤数据挖掘-分词
概述 分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。它是对句子进行精确分词,在词库中进行搜索匹配,将句子根据匹配的结果分成那些常见的词组或者单词。常用于做文本挖掘分析。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出分词后 … : Ansj(默认):可直接根据系统词库分出人名、机构等信息。但多单词英文姓名无法分出,且使用自定义词典时,系统词典还是优先被使用。适用于不使用自定义词典的场景。 Hanlp:可分出多单词的英文名称,且词典数据可包含空格。添加自定义词典的速度较慢。 正向最大匹配修正 对分词后结果进行修正Excel融合分析如何处理外部数据
1. 文件上传 在业务中,经常会有上传文件保存到数据库,然后在数据表中查看数据的需求; 为方便用户做数据管理以及更方便地使用文本数据,Smartbi可加载文件数据将数据文件导入到高速缓存库或数据源. 数据源创建方式查看详情 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=44500307。 加载文件数据支持上传:数据分析包、Excel、CSV、TXT文件。其中,Excel最大100M,其他文件最大200M。 文件上传详情。 image2020-8-27_11-48-21.png 2. Excel 数据导入 在线导入 Excel 是指在Excel融合分析如何处理外部数据
1. 文件上传 在业务中,经常会有上传文件保存到数据库,然后在数据表中查看数据的需求; 为方便用户做数据管理以及更方便地使用文本数据,Smartbi可加载文件数据将数据文件导入到高速缓存库或数据源. 数据源创建方式查看详情 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=44500307。 加载文件数据支持上传:数据分析包、Excel、CSV、TXT文件。其中,Excel最大100M,其他文件最大200M。 文件上传详情。 image2020-8-27_11-48-21.png 2. Excel 数据导入 在线导入 Excel 是指在触发系统保护机制,请减少查询数据量
(本文档仅供参考) (V97及以上版本) 问题 在数据集查询预览或者报表界面上提示:“ 内存告警: 很抱歉,查询数据量超过【数据集单次查询最大单元格数】系统设置项的阈值,触发系统保护机制,请减少查询数据量或联系管理员修改设置项阈值 ”,要如何解决? image2021-3-23_10-23-20.png 原因 因为数据集单次查询最大单元格数超过了系统默认设置导致的,这时候会触发内存告警。 当前提示内存告警规则:【系统默认设置项中的数据集单次查询最大行数】* 【实际查询数据集的列数】>【系统默认设置项数据集单次查询最大单元格数】 解决方案