第26页,共35页。 显示 349 条结果 (0.034 秒)
参数缓存
一般情况下,报表中的参数被访问时,参数对象将被初始化,并根据参数定义设置参数的默认值、备选值,默认值、备选值设置通常都会是一段SQL语句,从数据库中返回数据。当启动参数缓存设置项后,报表中的参数对象在首次访问后会被缓存到服务器中,系统中的用户再次打开此报表(或其他报表)获取该参数时,将直接从服务器返回该参数对象,而无需再次进行初始化,以及获取参数的默认值、备选值等。当参数备选值的SQL语句执行查询需要花费较长时间时,参数缓存将有效提高系统性能和用户体验。 参数缓存设置项分为系统级设置项和参数级设置项。 系统级设置:在“系统导航栏”选择 系统运维,在“系统运维”界面主菜单 高级设置 中设置“参数缓存”为是或否,一般默认参数缓存
一般情况下,报表中的参数被访问时,参数对象将被初始化,并根据参数定义设置参数的默认值、备选值,默认值、备选值设置通常都会是一段SQL语句,从数据库中返回数据。当启动参数缓存设置项后,报表中的参数对象在首次访问后会被缓存到服务器中,系统中的用户再次打开此报表(或其他报表)获取该参数时,将直接从服务器返回该参数对象,而无需再次进行初始化,以及获取参数的默认值、备选值等。当参数备选值的SQL语句执行查询需要花费较长时间时,参数缓存将有效提高系统性能和用户体验。 参数缓存设置项分为系统级设置项和参数级设置项。 系统级设置:在“系统导航栏”选择 系统运维,在“系统运维”界面主菜单 高级设置 中设置“参数缓存”为是或否,一般默认数据模型-连接模式
连接模式类型 数据模型的数据连接模式有两种: 直连:连接到业务库,直接从业务库中取数。 抽取:连接到高速缓存库,从缓存库中取数;抽取模式可以保证秒级获取大级别量的数据结果,提高系统性能。 连接模式选择入口 在数据模型的“表关系区”右上角含有连接模式切换键:连接模式的选中状态以蓝底显示。 image2022-2-5_15-36-2.png 连接模式选择原则 类型 原则 直连 数据模型中的数据源表、SQL查询、即席查询,若来源于相同的数据源,则可以选择直连模式; 数据模型中仅含SQL查询,当点击保存后,若检测到连接的数据库允许该SQL查询作为子查询,则允许直连模式; 抽取Smartbi SaaS-租户管理平台
思迈特SaaS BI云平台采用云原生技术,实现Smartbi的云端部署,为用户提供云端租户,其功能和本地部署版一致。用户无需购买硬件,开通即可使用。云平台具有租户管理平台,实现租户的创建和管理。 云平台的底层是K8S容器引擎,能自动部署、启停和管理容器化应用程序。K8S管理的服务器硬件可以自动扩容,当租户数量超过阈值后,能自动的增加服务器,保障Smartbi租户的性能及用户体验。每个租户是独立的容器组,运行Smartbi所需的各个组件,租户高度隔离,互不干扰,安全性高。 相比于Smartbi本地安装,云端租户具有以下优势: 1.开通即用,无需购买硬件,无需下载,无需安装,无需申请License,无需运维。1-2分钟可创建新Spark SQL函数说明
1 什么是SparkSQL Spark SQL是Spark用于结构化数据处理的Spark模块。 SparkSQL的前身是Shark,是一个将Spark和Hive结合的框架,利用hive SQL简化的思想,将RDD进行简化。Shark的出现,是SQL-on-Hadoop的性能比Hive有了10-100倍的提高。 随着Spark的发展,Shark的发展受制于Hive,在此基础上发展出SparkSQL和Hive on Spark,SparkSQL 作为 Spark 生态的一员继续发展,而不再受限于 Hive,只是兼容 Hive。 SparkSQL可以用于简化可伸缩的分布式数据集RDD(Resilient基于绑定Excel模板的数据集创建灵活分析导出数据量较大的时候会内存溢出
,大数据量的情况下,不分页会导致浏览器渲染报表压力大;电子表格清单表导出,虽然导出性能没有灵活分析好,就是导出会比较慢,但是不会像灵活分析导出那样消耗比较大的服务器内存,具体如下截图对比测试,同样一个数据集,灵活分析导出在绑定模板的情况下,需要消耗5G多的内存,电子表格清单表只需要2G左右。说明:清单表设置可参考wiki电子表格设置过滤【数据列】无法选择到其他的数据集
,在登录状态下需要保持对已打开的Excel文件的每个单元格进行遍历,以保证电子表格的正确性,这时候会比较消耗Excel的性能。有可能会出现操作卡顿的问题,在这样的场景下,建议是可以先取消勾选【监听工作簿内容发生改变】的设置项。 过滤选不到其他数据集 过滤数据集为空 多数据集关联过滤时无法检测到其他数据集CPU采样粗略分析
(本文档仅供参考) 问题说明 常常遇到报表访问慢的时候会要求录制CPU采样,但用户能否自行先分析下,若是分析不出来,再进一步求助技术支持人员? 解决方案 在这里归整下常见的CPU采样分析。本质分为4类:1、数据库执行慢;2、smartbi代码执行慢;3、smartbi调用第三方接口的代码,第三方接口执行慢。4、里边找不到任何和smartbi相关的代码,说明和smartbi没有关系,但这样的情况极少。 1、下载下来的CPU采样导入到【系统监控】–》【性能】上展示: image2019-12-25 17:25:11.png 2、从CPU大数据量查询优化:利用数据模型分区快速过滤数据
1 概述 在数据处理与分析场景中,当数据量庞大时,查询效率成为关键问题。 当用户在数据源库中设置了分区,也想在Smartbi 查询报表时,能直接命中分区,使查询语句能快速定位到所需数据,从而大幅提升查询性能。 所以推出了新功能,该功能允许用户在数据连接和数据模型中配置分区字段相关信息,确保查询时能精准命中分区,减少数据库压力,提升系统整体运行效率。 1、使用该功能前,需确保开启 SQL 简化 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=142971944功能默认开启。需要在系统选项/高级设置: 将概述
来实现数据集市,分析应用起来更加直观、效率更高。 但是因为宽表模式的限制,存在增删分析字段不方便、数据重复膨胀口径不一、关联计算时数据量大性能慢、宽表和业务手工Excel数据关联混合分析不方便等问题,技术人员处理起来不灵活、不敏捷。 客户期望:能够实现更加敏捷的多维建模。 受限于技术,传统“数据集市”不敏