第50页,共676页。 显示 6,755 条结果 (0.414 秒)
数据挖掘-派生列
可参考 Spark SQL 内置函数 http://spark.apache.org/docs/latest/api/sql/index.html。 示例 1、原先文本数据源有1000条数据,想要获取Date字段中关于年份的信息,选择派生列节点,表达式为“year(Date)”。 image2020-6-1 … 概述 派生列节点是用于在数据集中生成可行的新特征字段。它可对现有数据的某个特征操作,允许用户自定义生成特征名称,并将生成的新特征字段添加到原数据集中。 image2020-6-1 16:1:12.png 派生列的编程语法是Spark SQL,具体可参考 Spark SQL 内置函数 http数据模型-表关系区
: “数据源表”类型:每张表对应一个目录,目录名称为数据源表的别名。 “导入文件”类型:每个sheet对应一个目录,目录名称为sheet名称。 “SQL查询”、“即席查询”、“存储过程查询”、“脚本查询”、“ETL高级查询”类型:每一个查询对应一个目录,目录名称为私有查询类型的名称(如“SQL查询”、“即席查询”等);同一 … %A5%E8%AF%A2。 ”数据源表 https://wiki10.smartbi.com.cn/pages/viewpage.action?pageId=69737361“类型不支持编辑功能,“导入文件 https://wiki10.smartbi.com.cn/pages/viewpage.action电子表格⬝ 清单报表(系统数据集)
示例效果 下表是使用系统数据集制作的清单表: image2022-2-28_10-40-51.png 数据要求 本示例直接使用数据源表“suppliers”作为清单表的数据来源: image2022-2-28_10-43-35.png 分析定制 该表比较简单明了,具体的分析及实现详情如下 … : 1、手工输入列头。 2、系统自动获取数据集字段名称定制列头,并设置列头样式。 1、在右侧数据集面板中,数据集来源选择 系统数据集 ,打开数据连接中关系数据源“northwind”下的“供应商”表: image2022-2-28_11-5-53.png 2、手工输入列头样式:字体:黑体;字号:10;字体电子表格⬝ 清单报表(系统数据集)
示例效果 下表是使用系统数据集制作的清单表: image2022-2-28_10-40-51.png 数据要求 本示例直接使用数据源表“suppliers”作为清单表的数据来源: image2022-2-28_10-43-35.png 分析定制 该表比较简单明了,具体的分析及实现详情如下 … : 1、手工输入列头。 2、系统自动获取数据集字段名称定制列头,并设置列头样式。 1、在右侧数据集面板中,数据集来源选择 系统数据集 ,打开数据连接中关系数据源“northwind”下的“供应商”表: image2022-2-28_11-5-53.png 2、手工输入列头样式:字体:黑体;字号:10;字体数据挖掘-自助机器学习
概述 机器学习的应用往往需要大量拥有专业知识的人进行人工干预,这些人工干预表现在:特征提取、模型选择、参数调节等机器学习的各个方面。AutoML可以将这些与特征、模型、优化、评价有关的重要步骤进行自动化地学习,使得机器学习模型无需人工干预即可被应用,也让更多的人可以在没有专业知识的情况下轻松使用。 创建方法 使用AutoML来创建包含算法的实验分为三个步骤: 第一步:选择数据源 image2020-12-18_16-28-50.png 选择实验需要使用的数据源、SCHEMA、表名。 第二步:算法设置 image2020-12-18_16-29-52.png 参数名称 说明 算法选择 分类算法数据挖掘-自助机器学习
概述 机器学习的应用往往需要大量拥有专业知识的人进行人工干预,这些人工干预表现在:特征提取、模型选择、参数调节等机器学习的各个方面。AutoML可以将这些与特征、模型、优化、评价有关的重要步骤进行自动化地学习,使得机器学习模型无需人工干预即可被应用,也让更多的人可以在没有专业知识的情况下轻松使用。 创建方法 使用AutoML来创建包含算法的实验分为三个步骤: 第一步:选择数据源 image2020-12-18_16-28-50.png 选择实验需要使用的数据源、SCHEMA、表名。 第二步:算法设置 image2020-12-18_16-29-52.png 参数名称 说明 算法选择 分类算法数据模型
=contextnavpagetreemode 数据源表 数据源表是指业务库中的物理表。 导入文件 导入文件是指以数据文件作为数据模型的数据来源。 SQL查询 SQL查询是通过SQL语句输出数据结果集的一类查询方式。 可视化SQL查询 即席查询是通过直接从库表或业务主题中拖拽字段,并且支持对字段进行聚合计算后输出数据结果 … 功能索引 功能 说明 概述 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=75696876&src=contextnavpagetreemode 数据模型实现了将所有查询结果归集后,基于CUBE模型以“维度”和“度量数据挖掘-Spark SQL脚本
概述 SQL脚本支持手动输入SQL语言完成对数据进行处理和查询的任务。 输入/输出 输入 有4个输入端口 输出 只有一个输出端口,用于输出通过服务获取的数据。 参数设置 参数名称 说明 备注 视图名称 显示每个端口对应的表名 表名可修改 SQL脚本 编写SQL脚本的窗口 必填 示例 1) 拖动SQL脚本节点,并连接示例数据源。 image2024-9-2_15-24-21.png 2)更改表名为t0, 编写SQL脚本并点击确定保存. image2024-9-2_15-26-13.pngSQL定义、数据集定义存储方式
-- c_viewid 视图ID varchar(255) N Y -- c_datasrcid 数据源ID varchar(255) Y N -- c_viewdesc 视图描述 varchar(255) Y N … (本文档仅供参考) 问题背景 1、有项目需要从后台统计数据集详细信息,可能会涉及sql数据集具体语句中的字段等信息,可以怎么获取? 2、有项目需要取数据模型-SQL查询里的SQL语句,想知道在知识库里的哪个表里可以查询到? 3、数据集的输出字段存在知识库哪张表里中? 解决方案 1、旧数据集信息存储数据格式
操作0.jpg,选择 打开 或双击 数据格式 ,进入“数据格式管理”界面。 入口2:在“公共设置”界面主菜单选择 数据格式 ,进入“数据格式管理”界面。 1043.png 界面介绍 image2019-8-27 14:42:38.png “数据格式管理”界面主要分为以下几个区域: 可选资源区:该区列出了所有的数据类型,用于不同数据类型之间进行切换。 设置区:该区与“可选资源区”中的数据类型关联,主要显示各数据类型的所有数据格式列表,同时可以对各数据格式行相应的操作。 管理说明 选中不同的数据格式类型,则在右侧列出对应的数据格式。我们可以添加、修改、删除这些数据格式。 image2019-8-27 14:43