第30页,共418页。 显示 4,176 条结果 (0.049 秒)
大数据量抽取性能优化
300G+的目录上。 2.3 关系数据源节点配置 提升关系数据源节点执行性能,主要通过两个设置,分区设置跟选择列。 2.3.1 分区设置 image2024-7-18_16-59-56.png 分区设置为了把表数据相对平均分成多个分区,抽取程序会尽可能一个分区分配一个线程进行并行抽取,这样能够极大的提高 … 设置。 image2024-7-18_17-26-54.png 2.4 关系目标表节点配置 一般不需要做特别设置,根据不同场景选择不同节点。全量数据抽取,使用关系目标表(覆盖) 节点,增量数据追加,使用关系目标表(追加),增量数据更新,使用关系目标表(插入或更新)。 如果是mysql 协议的数据库,建议在数据源url 上加上数据挖掘-数据的输入和输出
数据源是指从Smartbi关系数据源中读取的库表数据。 目前支持Infobright、ClickHouse、Vertica、Oracle、MySQL、DB2、MSSQL、Presto、Hadoop_Hive、Guass100、PostgreSQL、Greenplum(V9.5目前不支持Greenplum数据库,V9.7 … 数据源的参数: image2021-8-18_18-2-1.png 设置说明如下: 参数 说明 数据源 选择数据源,这些数据源是Smartbi中连接配置好的关系数据源,必填。 SCHEMA 选择SCHEMA,必填。 表名 选择表,必填。 分区设置 把表数据相对平均数据挖掘-参数设置
在数据挖掘中,通过参数筛选用户可查询出需要的数据。 目前只有部分节点支持参数设置功能,如关系数据源、数据查询、关系目标表(追加)、关系目标表(覆盖)、关系目标表(插入或更新)、SQL脚本、源库SQL脚本。 操作步骤 1、新建实验,拖入关系数据源节点,并选择数据源、SCHEMA和表 … 参数 参数定义:在产品中定义的参数 参数值(可选):获取参数定义中的参数值。不选择参数值为动态参数,选择参数值后为静态参数值。 5、在关系数据源参数的SQL语句输入框中,只需要输入where之后的语句。可输入静态条件,如name=zs,或使用含参数的语句:CategoryName=${param模型数据行权限场景介绍
。 1、需要开启数据模型引擎V2.0才能正常使用该功能。 2 示例说明 场景描述:有4张表:客户表、贷款明细、贷款与担保关系、担保明细表 一个客户可以有零或多笔贷款,一笔贷款可以有零或多笔担保,而一笔担保可以关联到一笔或多笔贷款 客户表数据: kehubiao.png 贷款明细: image2024-8-31_13-52-56.png 贷款与担保关系: daikyudanbaogxi.png 担保明细表: daikdanbao.png 1、如果想复现示例,需要先把示例数据导入到模型中 或者把文件导入到业务库中,详细查看:文件。 2、示例下载数据: 示例.xls 。 1、把数据导入到数据模型中,并且Smartbi V10-数据挖掘
词向量节点 +【数据挖掘】新增聚类评估节点,用于呈现聚类算法常见评价指标值 ^【自助ETL/数据挖掘】关系数据源支持参数设置 ^【自助ETL/数据挖掘】关系数据源支持分区设置,提升数据抽取效率 ^【数据挖掘】关系目标表(追加)节点追加数据前支持删除表中数据 ^【自助ETL/数据挖掘】元数据编辑支持修改原 … %E6%BA%90 。 +【自助ETL/数据挖掘】目标源支持GreenPlum数据库 背景介绍 随着数据的爆炸性增长,用户对存储数据量的需求不断增加,产品在数据挖掘和自助ETL中,关系目标表(追加)和关系目标表(覆盖)节点支持使用GreenPlum数据库。 GreenPlum是一个面向数据仓库数据模型-私有查询
。 image2022-2-4_13-7-17.png 2、在“表关系区”单击主图标,弹出下级菜单,选择创建私有查询类型。 此创建的方法只有数据模型创建第一个私有查询时才能使用。 image2022-2-4_13-11-50.png 删除私有查询 已创建的私有查询允许删除。 删除方法:在“表关系区”中选择私有查询 … 。 image2021-8-10_14-0-33.png 修改私有查询 数据模型中已保存的私有查询,允许重新修改编辑。 在“表关系区”中模型表的更多菜单中选择 编辑,重新打开该模型表所对应的私有查询的编辑界面,此时该私有查询重新显示在“私有查询分页区”中: image2022-2-4_13-19-47.png 通过指标模型 ⬝ 使用指标模型
库连接不成功。 生成数据模型时,若勾选了表达式为空的计算指标,则该计算指标不会生成到数据模型中。 4、生成的数据模型中,其维表和事实表的关系自动生成,指标模型与数据模型的转化对应关系如下: 指标模型对象 数据模型对象 关联说明 指标分类 度量目录 所有要添加到数据模型中的指标对应的指标 … 的处理情况如下: 自定义内容 同步后是否会覆盖自定义内容 修改表关系在数据模型中 否,会保存自定义效果。 只有用户在数据模型中手工定义的维表和维表、事实表和事实表之间的关系不会被覆盖;维表和事实表之间的关系还是会被覆盖,同步后覆盖成在指标模型中定义的关联关系。 指标的汇总依据即席查询 ⬝ 选择数据
数据即席查询的前提是要有数据。本文将介绍即席查询如何获取数据,即选择业务数据集。 即席查询如果想一次性查询多个事实表的数据,目前只支持基数关系为“一对一”的情况。 如果数据来源于 数据源表,需要在数据连接/对应数据源下/ 表关系视图下修改对应的表基数关系。 1 操作入口 新建即席查询后,点击数据面板中的 选择 … 数据模型 和 数据源。以全部资源tab页为例,找到需要的数据模型或数据源,点击确定使用数据集。同时,还可以在操作列作中点击 编辑 ,对数据集作进一步的编辑。 目前如果选择 数据源,只能使用数据源下的 表 和业务视图下的 SQL查询 ,业务视图下的 可视化数据集 和 SQL数据集 暂不数据模型引擎V2.0
: SQL引擎:小宽表之间是join关系; 多维引擎:小宽表之间是union关系。 优势: 查询时,根据查询的度量、维度更精准的命中某一部分小宽表,不用去查包含所有数据的大宽表,理论查询速度更快。 3、计算列支持更多函数 选项 V1.0 V2.0 产品 … 没有的维度成员,并且表关系未设置假设引用完整性,查询选择维表中的维度及事实表度量时,会出现空的维度; 抽取模式:都是V2.0的展示效果。 新的变更调整更符合业务实际使用逻辑,如果想保持V1.0的效果,建议升级后设置“假设引用完整性”。 说明 V1.0 VS V2.0 V1.0,默认不显示维表中创建ETL高级查询
: 先从左侧拖入 关系数据源 节点, 设置好数据源(northwind)、SCHEMA(default)、表名(订单表),再 执行该节点。 然后复制该节点,粘贴3次,分别在关系数据源配置 选择不同的表 “订单详细表”、“产品表”、“产品类别表”,分别执行。 拖入 多表JOIN 节点,并且把 刚拖入的关系数据源与之进行连接,再点击 多表JOIN 节点 下面的 关联设置 ,设置表与表之间的关系,具体的详细设置可查看:多表JOIN。 多表JOIN 执行成功之后,连接 输出到MPP。 Snipaste_2023-06-05_18-45-28.png 3、界面上所有节点,运行成功之后,可查看输出的 大宽表 的数据