第114页,共562页。 显示 5,611 条结果 (0.046 秒)
数据挖掘-文本分析
文本分析是对文字类型的数据进行处理的方法,即从大量文本数据中抽取出有价值的知识,并且利用这些知识重新组织信息的过程。 文本分析数据挖掘-文本分析
文本分析是对文字类型的数据进行处理的方法,即从大量文本数据中抽取出有价值的知识,并且利用这些知识重新组织信息的过程。 文本分析安装SmartbiUnionServer跨库联合数据源
Smartbi跨库联合数据源(SmartbiUnionServer)是一个分布式SQL查询引擎,处在Smartbi的SQL引擎层,为不同的数据源提供统一的SQL解析、跨库查询能力。 1、设置系统环境 ① 关闭防火墙。 CentOS 6.X/Redhat 6.X service iptables stop … 4)测试验证 使用 Smartbi 连接跨库联合数据源验证,详情请参考 跨库联合数据源 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=111758116。电子表格报表输出数据报DataRows>20000
(本文档仅供参考) 问题: 在使用smartbi的打开电子表格报表的时候提示“数据集超出最大行数:DataRows>20000 ”,要如何解决? image2019-12-26 15:24:18.png 解决方案: 当前版本的电子表格的输出单元格进行了控制,最大 … 的不仅仅是报表最终的单元格数量,而是代码在运行时,实际创建的单元格数量,一般报表上大部分会有单元格扩展计算等需求,需要使用的单元格数据会大于最终报表展示的单元格数量。在内存充足的情况下,建议设置大小:实际的报表单元格数量 * 2。 V6以下的版本方案说明: 若是列表式清单报表建议如按下方法进行【仪表盘】根据时间频度动态展示该频度下指定时间段的数据
该宏示例在 V10.5上 验证通过 本文档的示例代码仅适用于本文档中的示例报表/场景。若实际报表/场景与示例代码无法完全适配(如使用功能不一致,或多个宏代码冲突等),需根据实际需求开发代码。 1. 示例效果 筛选器选择"年月日",图表的数据范围发生改变。 当选择频度为“日”时,图表显示区间为 [ "当前设置的'日期'往前 num 天" , "当前设置的'日期'" ]。例如宏代码内“num”的预设值为40,则显示当前日期前40天内的数据。设置“日期”筛选器的值为“2017-05-06”(截止日期),则图表显示区间为[ "2017-03-27", "2017-05-06" ] 。 当选择频度为“月”时,图表【仪表盘】根据时间频度动态展示该频度下指定时间段的数据
该宏示例在 V10.5上 验证通过 本文档的示例代码仅适用于本文档中的示例报表/场景。若实际报表/场景与示例代码无法完全适配(如使用功能不一致,或多个宏代码冲突等),需根据实际需求开发代码。 1. 示例效果 筛选器选择"年月日",图表的数据范围发生改变。 当选择频度为“日”时,图表显示区间为 [ "当前设置的'日期'往前 num 天" , "当前设置的'日期'" ]。例如宏代码内“num”的预设值为40,则显示当前日期前40天内的数据。设置“日期”筛选器的值为“2017-05-06”(截止日期),则图表显示区间为[ "2017-03-27", "2017-05-06" ] 。 当选择频度为“月”时,图表挖掘-元数据编辑成date类型输出为null
(本文档仅供参考) 问题说明 数值类型是string,通过元数据编辑改成date,但是输出都是null,如下图: image2024-1-17_17-26-20.png 解决方案 元数据编辑节点并不能实现字符串转日期,字符串转日期得用:数据挖掘-日期时间 。 date输出位null了ETL任务执行数据追加慢
(本文档仅供参考) 问题说明 客户使用v10.5版本,在查询的时候还是比较快,但是数据抽取的非常慢 image2023-12-29_10-57-14.png 解决方案 查看了后以日志,确认客户数据库为:阿里adb3.0,发现数据库连接参数没有添加rewriteBatchedStatements=true 造成了。 添加此参数即可解决数据源管理添加表报"排除重复成员"错误
(本文档仅供参考) 问题现象 数据源管理添加表报“排除重复成员”错误: image2018-10-25 18:56:2.png 解决方案 这个是因为数据库里面的表名注释有重复导致的,需要去数据库里面检查,对应的表的注释,如果有一样的话,要修改成不重复的。 添加表报错 添加表重复成员数据挖掘-随机森林特征选择
。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出增加了离散后的字段的数据集。 参数设置 参数名称 说明 备注 选择特征列 选择需要的特征列,必须是数值列 必填(特征列中不能含有null … 导致过拟合。 树的个数 取值范围:>=1的整数;默认值为20。 随机森林中决策树的棵数。 衡量准则 gini 裂分标准,entropy表示熵值,gini表示基尼指数; entropy 示例 使用“鸢尾花数据”,预测鸢尾花类别。选取4个特征列和1个标签列