第34页,共87页。 显示 869 条结果 (0.023 秒)
自助数据集-定义流程
自助数据集是一类基于个性化需求的数据集,它面向各阶层用户提供数据查询和抽取服务。 用户可以根据业务要求,通过可视化的方式,使用跨数据库、多表关联、数据转换、复杂逻辑关系计算、数据抽取ETL等功能,将数据提取到自助数据集,这些自助数据集允许被自助仪表盘、透视分析和电子表格进行数据分析应用。 自助数据集的定义流程如下: image10.png 新建自助数据集 在系统导航栏中选择 数据准备 ,在数据集的更多images.png中选择 新建>自助数据集 。 xinjianzizhushujuji.png 关于自助数据集的创建入口、资源显示和使用,统一通过V10.5 license控制。如希望在V10.5版本中继续使用自助数据执行引擎
数据是否计数 节点数据是否进行条数统计。 10 节点数据目录 指定节点数据的存储目录。 11 节点日志目录 保存实验引擎运行时产生的日志目录。 12 节点数据存储行数 保存拖拽过程中etl节点,特征工程节点,算法节点运行时预览的数据行数。 13 python插件存储目录 指定连接模式-抽取
性能慢,希望提升查询速度。 2、数据变化频率不高。 注意事项 1、导入文件、脚本查询、ETL高级查询、存储过程查询必须使用抽取模式。 2、使用了infobright作为高速缓存库的老用户,为了保证V10新功能的使用,需要重新配置高速缓存库。 3、数据模型的参数在自助仪表盘应用时,参数切换有效的前提是:连接模式使用第三方系统的用户管理
System.out.println(attr.getValue()); conn.close(); 4.同步Smartbi用户到第三方系统 实现步骤 用户同步:通过额外的系统实现用户信息定时同步,有两种方式: 方式一:使用存储过程或 ETL 定时将 Smartbi 中的用户等信息同步到外部系统中,Smartbi 的用户相关的表关于计划任务执行机制
。 注意: 计划任务设置不合理有可能会互相造成影响,并且如果本身存在频繁大数据量抽取,不建议直接通过计划任务抽取,建议是采用专业的ETL工具执行,因为计划任务频繁的执行是需要消耗服务器内存的,会对用户使用造成一些影响。 另外目前是没有办法查出当前节点此刻有多少任务正在执行从第三方系统中打开Smartbi资源
支持被集成的资源类型有:交互式仪表盘、数据模型、指标模型、即席查询、透视分析、自助ETL、数据挖掘、ETL自动化、作业流、自助数据集、多维分析、即席查询(旧)、透视分析(旧)、Web链接、电子表格、WEB电子表格、可视化查询、SQL数据集、存储过程查询、原生SQL查询,以及Excel导入模版等。 ### 1.3指标模型-事实表结构管理
表进行排序;事实表排序是对事实表结构字段进行排序。 2023-01-31_17-35-23.png 事实表搜索 事实表列表支持事实表名称关键字搜索结果。 image2022-1-1_10-42-27.png 事实表列表过滤 事实表列表支持“维度类型”、“关联ETL”过滤指标模型 ⬝ 概述
。 第一步,定义指标 定义指标包括对指标口径、属性、体系结构等定义。这些需要基于全局视角,通过指标规范限制,在平台工具上落地并维护。 zbdy.png 第二步,指标计算与存储 包括对指标对应的维表、事实表创建及数据实现,ETL调度管理,以及计算指标的创建。 zzcc03.pngwindows exe安装各组件目录说明
smartbiolap_console.log 数据模型的日志文件 smartbiEngine目录 smartbiEngine:数据挖掘或者smartbi自助ETL功能目录 目录名称 说明 conf 数据挖掘配置文件目录 engine 数据指标模型-维表结构管理
。 2023-01-31_11-12-111.png 维表搜索 维表列表支持维表名称关键字搜索结果。 2023-01-31_11-22-21.png 维表列表过滤 维表列表支持按“关联ETL”过滤。 2023-01-31_11-24-33.png