第64页,共561页。 显示 5,604 条结果 (0.04 秒)
即席查询⬝ 业务主题或数据源
: 区域 说明 参考 选择面板区 以页签的形式分别显示“字段选择”和“条件选择”面板: 字段选择:用于在“业务主题”树或“数据源”树下,选择当前即席查询需要分析的字段。 条件选择:用于在条件树下选择当前即席查询需要设置的条件。 该区的“自动更新”项:用于设置选择字段后系统是否立即自动更新数据;若未勾选该项,则需要用户手工更新。 字段选择 http://wiki.smartbi.com.cn:18081/pages/viewpage.action?pageId=44500422#id-%E5%8D%B3%E5%B8%AD%E6%9F%A5%E8%AF%A2-%E5%AE%9A%E4%B9%89Smartbi V10-数据准备
注意:(新特性列表中:+表示新增;^表示增强) V10版本数据准备的改进点如下: 新增 增强 变更 +【数据准备】新增数据模型,将所有查询结果归集并基于CUBE重新构建数据结构 +【数据准备】自助ETL新增Python脚本节点 +【数据准备】新增作业流功能,实现多ETL实验之间执行依赖关系 +【数据准备】新增多表JOIN节点,支持同时接入多个数据源并设置表关系 +【数据准备】新增组合查询节点,支持去重、聚合、计新建算字段等高级功能 ^【数据准备】新建或编辑计算度量、成员、命名集支持参数设置 <【数据准备】取消支持Infobright作为高速缓存库 +【数据准备】新增Infobright数据迁移到SmartbiMPP
由于V10版本后不再支持Inforbright作为高速缓存库,因此需要更换为其它支持适配的数据库,如SmartbiMPP(即Clickhouse)。 如果用户仍然想使用Infobright作为高速缓存库,那就需要回退到V9版本。 切换高速缓存库后,如需正常访问原本基于Infobright建立的资源,请参考以下方案: ① 通过Infobright抽取其他数据连接中的数据,切换高速缓存库后,只需重新抽取数据即可。 ② 通过“Excel导入”导入的数据,可以通过参考此文档将数据迁移到Smartbi MPP。 一、升级说明 1、升级步骤 ① 导出基于Infobright为高速缓存库时,通过“Excel导入”方式导入Infobright数据迁移到SmartbiMPP
由于V10版本后不再支持Inforbright作为高速缓存库,因此需要更换为其它支持适配的数据库,如SmartbiMPP(即Clickhouse)。 如果用户仍然想使用Infobright作为高速缓存库,那就需要回退到V9版本。 切换高速缓存库后,如需正常访问原本基于Infobright建立的资源,请参考以下方案: ① 通过Infobright抽取其他数据连接中的数据,切换高速缓存库后,只需重新抽取数据即可。 ② 通过“Excel导入”导入的数据,可以通过参考此文档将数据迁移到Smartbi MPP。 一、升级说明 1、升级步骤 ① 导出基于Infobright为高速缓存库时,通过“Excel导入”方式导入Smartbi V10.5-数据挖掘
注意:(新特性列表中:+表示新增;^表示增强) 具体改进点如下: 新增 增强 +【数据挖掘】文本分析新增LSH、相似集计算(LSH)节点 +【数据挖掘】支持导出PMML模型文件 +【数据挖掘】朴素贝叶斯、决策树、多层感知机等算法支持自动调参设置 +【数据挖掘】新增ETL和挖掘实验日志 +【自助ETL/数据挖掘/ETL高级查询】数据源新增FTP数据源 ^【数据挖掘】关系目标表支持GaussDB 200数据库 ^【自助ETL/数据挖掘】关系数据源节点兼容更多数据源 ^【数据挖掘】异常值处理节点新增删除异常行功能 +【数据挖掘】文本分析新增LSH功能示例-跨库数据集
概述说明 自助数据集支持跨库查询,当用户查询数据的范围比较广,并不限于一个数据库时,可以跨多个数据库进行查询。 实现跨库查询的前提条件:保证系统中的“跨库联合数据源”和“高速缓存数据库”有效,且进行跨库查询的数据库已经同步到跨库联合数据源中。 目前支持做跨库的数据源类型包括:高速缓存库、Hadoop_Hive、星环、Vertica、CH、Greenplum、Infobright、Oracle、DB2 V9、MySQL、MS SQL Server、Spark SQL、Teradata_v12、Informix、IMPALA、PostgreSQL。 示例分析 业务需求描述 某企业的生产部门和销售部门有各自的数据信息存储库数据连接
数据源是指创建业务库和产品应用服务器的连接,拿到数据进行分析。 “数据连接”界面如图: 数据连接界面.png “数据连接”界面展示支持的数据源,用户根据需要选择相应的数据源进行连接。关于支持的数据源类型,详情请参考 系统环境要求 。 在资源目录区中选中数据源节点,点击更多操作image2019-7-13 10:54:47.png ,展开数据源菜单,支持对数据源设置数据权限,排序等操作。数据挖掘-拆分
概述 拆分是将原始样本集按照训练集和测试集的方式拆分为两个子集。拆分后各个子集的比例总和小于等于100%。 数据拆分经常作为回归或者分类算法节点的前置节点。 image2020-5-21 16:32:33.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 两个输出端口,用于输出不同的拆分结果。 参数设置 设置拆分的参数: image2020-5-29 14:11:34.png 设置说明如下: 参数 说明 数据集占比 表示用于算法模型训练的数据集占总体数据的比例,范围是[0,1]的数值,默认是0.7。 随机种子 作为随机Infobright 数据迁移到 SmartbiMppMD
由于V10版本后不再支持Inforbright作为高速缓存库,因此需要更换为其它支持适配的数据库,采用“WindowsEXE安装包”方式部署的,需要将 Inforbright 更换为 SmartbiMppMD。 如果用户仍然想使用 Infobright 作为高速缓存库,那就需要回退到V9版本。 切换高速缓存库后,如需正常访问原本基于Infobright建立的资源,请参考以下方案: ① 通过Infobright抽取其他数据连接中的数据,切换高速缓存库后,只需重新抽取数据即可。 ② 通过“Excel导入”导入的数据,可以通过参考此文档将数据迁移到SmartbiMppMD。 一、升级说明 1、升级步骤 ① 导出Infobright 数据迁移到 SmartbiMppMD
由于V10版本后不再支持Inforbright作为高速缓存库,因此需要更换为其它支持适配的数据库,采用“WindowsEXE安装包”方式部署的,需要将 Inforbright 更换为 SmartbiMppMD。 如果用户仍然想使用 Infobright 作为高速缓存库,那就需要回退到V9版本。 切换高速缓存库后,如需正常访问原本基于Infobright建立的资源,请参考以下方案: ① 通过Infobright抽取其他数据连接中的数据,切换高速缓存库后,只需重新抽取数据即可。 ② 通过“Excel导入”导入的数据,可以通过参考此文档将数据迁移到SmartbiMppMD。 一、升级说明 1、升级步骤 ① 导出