搜索

Help

第136页,共273页。 显示 2,725 条结果 (0.029 秒)

  1. 数据挖掘-最大绝对值归一化

    概述 最大绝对值归一化通过除以每个特征内的最大绝对值将每个特征映射到[-1,1]的范围;它不会移动和中心化数据,因此不会破坏任何的稀疏性。 输入/输出 输入 没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用 参数设置 参数名称 说明 备注 新增列后缀 用于设置在原字段名后追加后缀生成新的列,默认后缀为:Normalized; 必填 图片3.png 示例 使用“鸢尾花数据”,特征选择4个特征列,最大绝对值归一化为[-1,1]范围的数据,输出结果如下图: 图片4.png 最大绝对值归一化
  2. 数据挖掘-假设检验

    概述 通过特征变量与目标变量之间的偏差来检验数据之间的相关性或回归分析中的拟合结果。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出假设检验结果数据集 参数设置 参数名称 说明 备注 选择特征列 用于选择需要检验的字段列 必填 选择标签列 用于选择做为标签列的字段(必须为数值型) 示例 使用“鸢尾花数据”,选择4个特征列和1个标签列,输出结果如下图: 图片6.png 鼠标点击右键查看分析结果: 图片7.png 以上图知:已挑选的特征列的P值都趋近于0
  3. 数据挖掘-词袋

    概述 词袋是为了对句子进行分词,根据分隔符将句子分割开来,分成一个个独立的词语或者单词。常用于英文文本分割语句。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出分隔后的结果 参数设置 参数配置 说明 备注 选择文本项 选择需要分割的文本列 必填 分隔符 输入指定的分隔符 必填 示例 使用“垃圾短信识别”数据,选择需要分割的文本列,设置”/”分隔符进行分割,输出结果如下图: image2020-6-4 11_11_16.png 词袋
  4. 数据挖掘-停用词处理

    概述 停用词处理是由于有些词频很高,但对文章却没有太多意义的语气词和助词等等,比如这、我、你们、吗等等,对这些词进行去掉处理以便能够更好的分析语义。常用于关键词提取分析。 输入/输出 输入 一个输入端口,用于需要过滤停用词的字段。 输出 一个输出端口,用于输出去掉停用词之后的结果。 参数设置 参数名称 说明 备注 字段选择 选择需要去除停用词的列 必填 停用词列表 在对话框填写停用词,每行填写一个停用词 必填 示例 使用“深圳企业信息”示例数据,选择分词后去除停用词的列(企业名称
  5. 存储过程预览数据报错:Data Duration

    (本文档仅供参考) 问题现象  存储过程数据集点击预览数据集,报错:获取总行数sql错误,Data Duration,而通过参数筛选缩小选择范围,则成功查询。 image2021-4-9_13-59-47.pngimage2021-4-9_14-0-1.png 问题原因 部分数据长度范围超过了数据库表字段设定的长度限制。 解决方案 排查查询的数据是否在数据库表字段的长度范围内,若数据量较大,建议可通过二分法或者添加参数值过滤的方式锁定有问题的数据范围,加大字段长度或更改有问题的数据,确保数据长度不超过字段长度即可解决此问题。
    FAQ中心八月 13, 2021
  6. Shell脚本节点

    1概述 Shell脚本节点通过ssh方式登陆远程服务器并运行该服务器上指定路径下的脚本文件。 2节点参数说明 image2023-12-19_16-33-4.png image2023-12-19_16-33-32.png 参数说明: 1.主机:必填项,可以是远程主机主机名或ip,需保证挖掘引擎能访问该主机名或ip 2.端口:必填项,ssh登陆的端口 3.用户名:必填项,ssh登陆用户名 4.密码:必填项,ssh登陆密码 5.脚本路径:必填项,在远程主机上的可运行的脚本文件绝对路径,需注意登陆用户要有该文件运行权限。
    Smartbi Insight V11帮助中心十二月 19, 2023
  7. 自助数据集抽取mysql数据出现服务器无响应

    (本文档仅供参考) 问题说明         使用smartbi高性能版本部署的mpp和smartbi,再使用smartbi进行mysql抽数过程中,数据量2000W,smartbi直接内存很快上到一个临界点,导致服务器出现无响应的现象。 解决方案          这是因为进行mysql大数据量抽取的时候,需要在JDBC的连接上添加 useCursorFetch=true&defaultFetchSize=10000 参数,具体如下:         image2018-11-15 17:38:32.png         v856新版本也在数据源设置上增加了设置项,直接勾选后就会在连接字符串上添加对应的参数
    FAQ中心八月 06, 2021
  8. Oracle作为知识库启动报:Locale not recognized

    在应用服务器上设置JVM参数,添加 -Duser.language=en -Duser.country=US ( PS:相关网上文档:https://blog.csdn.net/andylieonian/article/details/39227661 https://blog.csdn.net/andylieonian/article/details/39227661)          如何添加JVM参数可参考wiki文档:https://history.wiki.smartbi.com.cn/pages/viewpage.action?pageId=35751396 https
    FAQ中心八月 13, 2021
  9. 安装SmartbiOLAP数据模型服务

    : olap.png Smartbi OLAP Server服务设置最大JVM内存,可以通过修改startup_olap.sh脚本文件设置,参考下图: Xmx最大内存参数配置值建议不超过服务器总内存的70%。 建议增加以下jvm参数: export JAVA_OPTS="-Dfile.encoding
  10. 知识库迁移方案

    源环境知识库 目标环境知识库 1 数据库类型* Oracle SelectDB 2 数据库字符集* UTF-8 UTF-8 3 数据库表数据大小写敏感* 是 是 4 数据库是否有全局参数控制表数据大小写敏感* 是 是 5 数据库存在兼容模式* 否 否 … 4 数据库是否有全局参数控制表数据大小写敏感* ... 否 1) 将附件中的资源使用“导入资源”功能导入到源环境中。该资源提供了一个知识库数据诊断的数据模型,用于诊断知识库中数据大小写情况。 诊断资源:知识库诊断资源_migrate.xml;“导入资源”功能请参考:导入资源 zsk-09.png