第13页,共35页。 显示 349 条结果 (0.031 秒)
产品特点
简风格的节点配置界面,支持可视化探索,轻松理解数据质量和数据并联,流程节点在线帮助,模型超参数自动调整。 可视化建模1.png 能满足大型企业数据挖掘需求: 产品采用分布式云计算,线性扩展,保证性能,一键发布挖掘模型,模型库提高知识复用,减少重复投入,支持跨库查询,统一控制数据访问权限,训练自动化、模型自学习。 跟BI平台无缝集成: 数据挖掘结果往往不容易被理解,Smartbi Mining作为Smartbi产品家族一员,能够与Smartbi的其他可视化功能无缝集成,将挖掘结果通过Smartbi多样丰富的可视化手段进行分析展现。 性能扩展: 支持机器学习算法的分布式执行,以充分利用计算资源202410产品更新说明
数据库的支持,极大增强了数据源的接入能力,能够应对更多复杂业务场景。 3、增强数据分析和提高查询效率:新版本进一步优化了数据模型部分查询场景的性能、ETL新增模型明细查询&模型汇总查询数据接入方式、即席查询的数据来源支持选择数据源的业务视图等。 4、提升用户体验:我们优化了仪表盘组件的加载动画效果,改善视觉体验 … 的catalog] 。 ^ 数据模型优化部分查询场景的性能 为了提升查询效率,增强用户体验,新版本中优化了数据模型部分查询场景的性能,包括:计算度量表达式仅涉及加(+)、减(-)、乘(*)、除(/)、计算度量使用case when或IIF函数构建的表达式、报表层表格行列上的合计小计。详情可查看:SQL引擎介绍V10 版本更新介绍
,保护报表安全 +【性能】自助仪表盘和电子表格支持滚动加载功能,减少打开报表等待时间 二. V10所有的更新点 功能模块 新增 增强 变更 安装部署 +【安装部署】产品支持PostgreSQL作为知识库 数据连接 +【数据连接】Hadoop_Hive … 显示百分比 ^【自助仪表盘】列表筛选器支持按钮风格自定义 ^【自助仪表盘】支持图形自定义指标轴最大值和最小值 ^【自助仪表盘】指标轴显示优化 ^【透视分析】多选参数值支持筛选包含逗号的数据 ^【电子表格】插件端的刷新数据与操作性能优化 ^【电子表格】回写填报权限配置操作优化 <【自助仪表盘】修改柱图ETL-节点预览数据块,但里面查询执行慢
(文档仅供参考) 问题说明 为什么etl预览窗口很快,而数据查询就很慢? image2023-12-11_18-27-55.png 数据查询—sql查询 image2023-12-11_18-26-34.png 原因: etl窗口预览取数逻辑: 1、预览数据在 引擎安装目录\data\middata 目录下以csv格式存储; 2、预览数据存储多少行数据成CSV文件,由如下配置决定; image2023-12-11_18-28-52.png 而数据查询节点查询:其对应sql查询模块的查询,对应有count全表,当全表数据量较大时,sql则较慢,对应和数据库性能相关。 注:如涉及到慢的情况,如多方面因素思考其SQL引擎V1.0介绍
优化执行计划,以提高查询效率和性能。它会考虑索引、统计信息、表大小等因素,选择最佳的查询路径和执行顺序。 数据连接:SQL引擎支持连接多个数据表或数据源,可以进行联合查询、子查询等复杂查询操作。用户可以通过SQL语句来指定数据连接方式和条件,实现数据的关联和合并。 聚合计算:SQL引擎支持常见的聚合函数,如 … 如果数据源名称是Mondrian,可以判断走的是OLAP; 如果是源库名称,判断为走SQL引擎 2)看系统监控 3.png 2.3 SQL引擎 与 多维引擎性能简单对比 服务器配置 CPU 内存 硬盘 网络 8核 4G 没有Excel融合分析如何处理超大数据量
1. 背景 一线的业务人员获取Excel明细表,原始数据量动辄几十万上百万条;虽然Excel是一款深受青睐、广泛使用的数据处理工具,但是Excel自身在处理大数据量情况下存在性能问题;并且当大数据量的Excel分析报表展现在web上会占用太多缓存,会容易撑爆内存导致宕机。 基于上述背景,本文将介绍在创建大数据量的Excel融合分析报表过程中,应该采取哪些操作方案,能够有效避免大数据量导致卡顿、提升查询性能。 2. 操作步骤 2.1 数据准备方式 在创建Excel融合分析报表前的数据准备阶段,我们可参考如下两个方式操作: 查询情况 操作要点 效果 单表查询 创建透视分析数据集Excel融合分析如何处理超大数据量
1. 背景 一线的业务人员获取Excel明细表,原始数据量动辄几十万上百万条;虽然Excel是一款深受青睐、广泛使用的数据处理工具,但是Excel自身在处理大数据量情况下存在性能问题;并且当大数据量的Excel分析报表展现在web上会占用太多缓存,会容易撑爆内存导致宕机。 基于上述背景,本文将介绍在创建大数据量的Excel融合分析报表过程中,应该采取哪些操作方案,能够有效避免大数据量导致卡顿、提升查询性能。 2. 操作步骤 2.1 数据准备方式 在创建Excel融合分析报表前的数据准备阶段,我们可参考如下两个方式操作: 查询情况 操作要点 效果 单表查询 创建透视分析数据集ETL-写入数据到阿里云部署的mysql慢
(本文档仅供参考) 问题现象 数据源连接使用MYSQL连入Aliyun ADS。(若操作系统为阿里 龙蜥操作系统,也存在性能问题,解决方案同下),在执行数据插入时平均一条数据插入15秒。 问题原因 产品使用insert into 单条value方式,jdbc驱动将sql发送给mysql去执行是每一次都需要去发请求,导致时间都消耗在请求过程中。可参考阿里云文档:https://developer.aliyun.com/article/621133 https://developer.aliyun.com/article/621133 解决方案 数据源连接参数中添加参数数据挖掘-数据的输入和输出
把表数据相对平均分成多个分区,抽取程序会尽可能一个分区分配一个线程进行并行抽取,能够极大的提高大数据量情况下的数据抽取性能。详情请参考 。 选择列 用于筛选节点输出的列,适用于大数据量情况下,提升数据导出速度。 image2021-8-18_18-6-21.png SQL语句 通过SQL语句设置where条件,过滤出表中的数据用于工作流。 分区设置 把表数据相对平均分成多个分区,抽取程序会尽可能一个分区分配一个线程进行并行抽取,能够极大的提高大数据量情况下的数据抽取性能。 如图设置分区字段“累计治愈”的分区数量为4,最小值为1,最大值为20,则系统会以(-∞,5)、[5,10Phoenix:在Apache HBase上执行SQL查询
处理器与自定义过滤器,对于简单查询来说,其性能量级是毫秒,对于百万级别的行数来说,其性能量级是秒。 Phoenix最值得关注的一些特性 http://phoenix-hbase.blogspot.com/2013/01/announcing-phoenix-sql-layer-over-hbase.html有 … /forcedotcom/phoenix/blob/master/README.md。 InfoQ:有没有性能评估呢?响应时间是否变快了?可伸缩性是否更好了? JT:可以在这里https://github.com/forcedotcom/phoenix/wiki/Performance https