第106页,共606页。 显示 6,060 条结果 (0.112 秒)
MySQL知识库迁移至其它数据库
说明 Smartbi目前支持MySQL、HSQL、Oracle、DB2_V9、MS SQL Server、Sybase和kingbase 等类型的数据库作为知识库。 Smartbi默认使用MySQL作为知识库,可以通过知识库备份等操作,配置其他的数据库为知识库。 配置步骤 1、备份知识库 a)启动 … 。 3.png 2、建立新知识库 a) 在目标数据库中新建一个空的库,比如名称是Smartbi; b) 要求:所创建的数据库,必须支持中文字符集,比如GBK 或 UTF-8;另外要求分配给Smartbi连接这个库的用户,必须具有建表的权限,因为后面Smartbi会向这个空库中自动创建它所需要的表。 3、配置数据挖掘-特征工程
特征工程指的是把原始数据转变为模型的训练数据的过程,它的目的就是获取更好的训练数据特征,使得机器学习模型逼近这个上限。特征工程中包括常见特征工程方法节点。 通过特征工程,能够最大限度地从原始数据中提取特征,以供算法和模型使用。 特征工程简介数据挖掘-特征工程
特征工程指的是把原始数据转变为模型的训练数据的过程,它的目的就是获取更好的训练数据特征,使得机器学习模型逼近这个上限。特征工程中包括常见特征工程方法节点。 通过特征工程,能够最大限度地从原始数据中提取特征,以供算法和模型使用。 特征工程简介Java数据集字段支持分类
需求背景 项目中可能出现Java数据集字段比较多的情况,数量可能达到几百或几千个,这样在Java数据集对象定义界面中显示参数及结果集字段时,浏览器界面可能无法响应,另外新建Java数据集界面的资源树中显示太多的字段也不方便查找与使用。因此,需要Java数据集能够支持数据集字段按分类显示。 实现方案 在Java数据集的接口(smartbi.freequery.metadata.IJavaQueryData)中添加支持字段分类的相关接口,如下所示: /** * 返回分类资源 * * @param parentId * 父资源ID,当父ID为null则返回顶级分类资源 * @return跳转 - 电子表格修改跳转规则代码,实现某列数据为空时,不允许跳转
(本文档仅供参考) 需求描述 电子表格中某字段设置了跳转规则,实现某列数据为空时,不允许跳转。而目前直接在跳转规则中写不等于null,其实是判断数据在数据库中字符串是否为4个字符的null字符串,而不是判断是否为空。 需求效果 效果.png 解决方案 可通过修改跳转规则中服务端宏代码实现。具体步骤如下: 1、设置值不等于null 步骤1.png 2、将服务端模块的代码修改如下(注意修改为对应的单元格) if (getCellValue(cell.getRelativeCells("E2"))!= '') { 步骤2.png 如果有两个条件,参考如下代码: 两个条件-步骤2.png 当值为空的时候数据挖掘-评分预测
概述 评分预测使用训练好的评分卡模型对具体数据进行预测,用于输出最终的信用评分。 输入/输出 输入 两个输入端口,输入1接收训练好的评分卡模型,输入2接收训练数据 输出 一个输出端口,用于输出预测结果 示例 图片1.png 查看输出可看到具体的预测结果: 图片2.png 注意事项 评分预测接入的数据必须为WOE编码之前的数据,且选取的特征应与进行WOE编码的特征相同。数据挖掘-评分预测
概述 评分预测使用训练好的评分卡模型对具体数据进行预测,用于输出最终的信用评分。 输入/输出 输入 两个输入端口,输入1接收训练好的评分卡模型,输入2接收训练数据 输出 一个输出端口,用于输出预测结果 示例 图片1.png 查看输出可看到具体的预测结果: 图片2.png 注意事项 评分预测接入的数据必须为WOE编码之前的数据,且选取的特征应与进行WOE编码的特征相同。数据挖掘-去除重复值
概述 去除重复值是用于删除数据集中的重复行(假如有两行相同,保留其中一行)。 image2020-5-29 14:4:51.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出去除重复值的结果。 参数设置 设置去除重复值的参数: image2021-9-23_15-33-52.png 设置说明如下: 参数 说明 选择列 用于选择进行去除重复值设置的列: image2021-9-23_15-34-14.png 示例 1、原先关系数据源的输出结果有12条数据,对其进行去除数据挖掘-去除重复值
概述 去除重复值是用于删除数据集中的重复行(假如有两行相同,保留其中一行)。 image2020-5-29 14:4:51.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出去除重复值的结果。 参数设置 设置去除重复值的参数: image2021-9-23_15-33-52.png 设置说明如下: 参数 说明 选择列 用于选择进行去除重复值设置的列: image2021-9-23_15-34-14.png 示例 1、原先关系数据源的输出结果有12条数据,对其进行去除BI笔记之---合理处理SSAS数据库的几点建议
今天又有朋友遇到SSAS数据库处理速度慢的情况,主要是由于数据聚合量确实很大,每次处理都要超过三十分钟,有没有什么方法能让处理的时间少一些呢? 从事BI工作有七个年头了,这样类似的问题绝对可以排在职业圈内TOP 10的FAQ当中。这样的问题往往都略有复杂,在此根据遇到过的一些场景,罗列一些自己的经验。 由于篇幅限制,这里只介绍遇到问题时的解决思路,详细的操作我会链接到我的其它随笔供大家实际操作的时候参考,还有很多建议上的细节都尽量标出官方文档的出处供大家获取更多内容。 提升数据仓库层相关表的查询效率 SSAS数据库在处理时,要向数据仓库层抛SQL查询。所以对相应的维表和事实表进行优化是这一步的关键。 我先前