第126页,共225页。 显示 2,247 条结果 (0.028 秒)
数据挖掘-过滤
概述 根据用户需求,通过写SQL语句(片段)的方式,对数据集中指定字段进行条件筛选过滤。 image2020-9-8_9-10-20.png 10.5.15版本后,左侧资源树不再显示过滤节点,但是旧的过滤节点仍能正常使用,建议使用最新的行过滤节点完成过滤操作。 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出过滤的结果。 参数设置 设置过滤与映射的参数: image2020-5-21 13:58:29.png 设置说明如下: 参数 说明 过滤器 对数据的指定字段进行过滤产品特点
产品具有如下特点: 专业算法能力: Smartbi Mining内置50+挖掘组件,丰富机器学习成熟算法,支持文本分析处理,支持使用Python扩展挖掘算法, 支持使用SQL扩展数据处理能力。 3333.png 简单易用: 业务人员也能高度参与的数据挖掘产品,分析全程可视化。采取直观的流式建模,极简风格的节点配置界面,支持可视化探索,轻松理解数据质量和数据并联,流程节点在线帮助,模型超参数自动调整。 可视化建模1.png 能满足大型企业数据挖掘需求: 产品采用分布式云计算,线性扩展,保证性能,一键发布挖掘模型,模型库提高知识复用,减少重复投入,支持跨库查询,统一控制数据访问权限,训练自动化、模型自学习Smartbi V10-安装部署
注意:(新特性列表中:+表示新增;^表示增强) V10版本中重点对【安装部署】的性能进行优化和完善,详细改进情况如下: 新增 +【安装部署】产品支持PostgreSQL作为知识库 +【安装部署】产品支持PostgreSQL作为知识库 背景介绍 PostgreSQL的市场占有率在逐年增长,目前已经排到了第四位,项目中使用PostgreSQL知识库的需求也更迫切,因此新版本知识库增加了对PostgreSQL的支持。 PostgreSQL是一种特性非常齐全的自由软件的对象-关系型数据库管理系统(ORDBMS),PostgreSQL支持大部分的SQL标准并且提供了很多其他现代特性本地数据源加载文件数据时只能选择高速缓存库
:Oracle、MySQL、DB2、Sql Server、Sybase IQ、GaussDB 200 ,详情可查看此wiki文档:文件 image2022-7-19_16-31-40.pngMySQL查询结果中如何增加行号列
我们在执行 SQL 语句时,有时候会希望在返回的结果集中增加一列,其值为每一行的顺序号。比如 Oracle http://baike.baidu.com/view/1685727.htm 数据库,就提供了 rownum 伪列,可以实现这样的效果。在 MySQL 数据库上,我们该如何实现该效果,显示每一条记录的行号呢。 其实 MySQL http://www.mysql.com/ 查询结果条数编号的方法并不复杂,下面就以实例的形式为您介绍 MySQL http://www.mysql.com/ 查询结果条数编号实现过程,我们先来了解一下 MySQL 查询结果条数编号的语句写法: SELECT @row := @row + 1自主排查方案
image2021-3-30_10-18-43.png 2. docker服务不存在 查看对应的log文件,保存在<install-path>/logs 里。 3. docker 服务跑到一半挂掉,同时也没有留存下logs在服务器里 这种一般是nl2sql 或者nl2table 的问题,当服务还处于活动中的时: 采用 docker产品特点
产品具有如下特点: 专业算法能力: Smartbi Mining内置50+挖掘组件,丰富机器学习成熟算法,支持文本分析处理,支持使用Python扩展挖掘算法, 支持使用SQL扩展数据处理能力。 3333.png 简单易用: 业务人员也能高度参与的数据挖掘产品,分析全程可视化。采取直观的流式建模,极简风格的节点配置界面,支持可视化探索,轻松理解数据质量和数据并联,流程节点在线帮助,模型超参数自动调整。 可视化建模1.png 能满足大型企业数据挖掘需求: 产品采用分布式云计算,线性扩展,保证性能,一键发布挖掘模型,模型库提高知识复用,减少重复投入,支持跨库查询,统一控制数据访问权限,训练自动化、模型自学习创建时间层次结构和标记为时间层次两者有什么区别
问题 V10版本是新增了数据模型功能,可以进行快速的时间计算,但选中时间字段右键时有时候会提示【创建时间层次结构】有时候则会提示为【标记为时间层次】,这两者有什么区别。 说明: 此提示会依据字段的数据类型不同而提示不同。 1、【创建时间层次结构】 当字段的数据类型为日期/日期时间时,由于日期/日期时间的格式包含年-月-日 ,所以提供了设置界面 快速把日期/日期时间 转换成 年、年季、年月、年周、年月日5种不同的格式。 此转换的本质是通过sql语句,把年-月-日,转换成不同的时间层次。 image2023-10-13_17-33-54.png image2023-10-13_17-36-47.png 2、【标记星环使用date() 函数报错:Could not initialize class org.apache.hadoop.hive.common.type.HiveDate
(本文档仅供参考) 问题说明 基于星环数据源,创建原生SQL数据集,执行语句中含有date()函数报错,如下图所示 image2023-10-27_14-37-57.png 解决方案 方式一: 在现有的动态驱动的目录下新建properties文件,文件内容 loadFromParentPackages=org.apache.commons.logging,文件名称smartbi.properties,然后重启Smartbi服务。 方式二: 新建一个驱动目录,将数据库驱动和properties文件一起放入,数据源选择这个新的驱动目录,无需重启Smartbi服务ETL上传线下excel文件读取excel之后0不见了
2、当识别第1行为字符串类型时,则判断字段为字符串类型,后续内容也就将0保留了下来。 image2023-7-25_11-2-48.png 3、在经过其他处理如sql脚本处理等,将第1行去掉即可得到前面带0的字符串数值内容