第49页,共108页。 显示 1,077 条结果 (0.024 秒)
数据挖掘-词袋
概述 词袋是为了对句子进行分词,根据分隔符将句子分割开来,分成一个个独立的词语或者单词。常用于英文文本分割语句。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出分隔后的结果 参数设置 参数配置 说明 备注 选择文本项 选择需要分割的文本列 必填 分隔符 输入指定的分隔符 必填 示例 使用“垃圾短信识别”数据,选择需要分割的文本列,设置”/”分隔符进行分割,输出结果如下图: image2020-6-4 11_11_16.png 词袋数据挖掘-停用词处理
概述 停用词处理是由于有些词频很高,但对文章却没有太多意义的语气词和助词等等,比如这、我、你们、吗等等,对这些词进行去掉处理以便能够更好的分析语义。常用于关键词提取分析。 输入/输出 输入 一个输入端口,用于需要过滤停用词的字段。 输出 一个输出端口,用于输出去掉停用词之后的结果。 参数设置 参数名称 说明 备注 字段选择 选择需要去除停用词的列 必填 停用词列表 在对话框填写停用词,每行填写一个停用词 必填 示例 使用“深圳企业信息”示例数据,选择分词后去除停用词的列(企业名称数据挖掘-评分卡输出
概述 评分卡输出用于查看已训练的评分卡模型中,各个变量离散后各分箱的WOE值,iv值及其对评分分数的贡献,可作为对评分卡模型的分析。 输入/输出 输入 一个输入端口,接收训练好的评分卡模型 输出 一个输出端口,用于输出评分卡分析结果 示例 图片3.png 评分卡输出节点的输出结果具体如下: 图片4.png 其中,前三列为各个变量的分箱信息;woe值和IV值反映了该变量分箱的预测偏向和能力;最后两列为该变量分箱对应的转换前和转换后的评分分数,由评分卡模型输出。如何在作业流成使用“参数输出"节点
概念 将取到的数据输出为参数,供下游分支条件判断时使用。 应用场景:将取到的数据输出为参数,供下游分支条件判断时使用。 输入/输出 输入 一个输入端口,用于连接节点。 输出 一个输出端口,将取到的数据输出为参数,供下游分支条件判断时使用。 示例 1、拖入参数输出节点,用于输出参数,控制执行分支 2、配置参数输出节点 图片2.png 3、参看执行参数 图片3.png 图片4.png 4、设置分支条件 image2024-4-25_11-20-6.png 图片5.png 5、运行,不满足条件的分支将不会执行,同时整个作业流不会因为不满足条件而执行报错计算节点配置时提示“Cannot assign requested address: Service 'sparkDriver' failed after 16 retries (starting from 7777)!”
” image2022-4-20_10-59-3.png 解决方案: 1.检查端口是否被占用,使用netstat -an|grep driver监听端口。 image2022-4-20_11-7-7.png 2.查看引擎所在物理机主机名,是否包含特殊符号。 image2022-4-20_11-6-4.pngShell脚本节点
1概述 Shell脚本节点通过ssh方式登陆远程服务器并运行该服务器上指定路径下的脚本文件。 2节点参数说明 image2023-12-19_16-33-4.png image2023-12-19_16-33-32.png 参数说明: 1.主机:必填项,可以是远程主机主机名或ip,需保证挖掘引擎能访问该主机名或ip 2.端口:必填项,ssh登陆的端口 3.用户名:必填项,ssh登陆用户名 4.密码:必填项,ssh登陆密码 5.脚本路径:必填项,在远程主机上的可运行的脚本文件绝对路径,需注意登陆用户要有该文件运行权限。Oracle作为知识库时如何支持SERVICE_NAME(服务名)的连接
(本文档仅供参考) 问题现象 部署知识库为oracle数据库时会提示连接不可用,但是在其他工具上测试连接可用,在smartbi中连接时会出现如下提示: image2018-10-23 10:37:7.png 解决方案 这是由于在smartbi中默认的连接方式是 192.168.1.10:1521:oracl 的方式进行连接(即端口号和实例是用冒号分开的),而有时候oracle需要用service_name的方式进行连接,即端口号和服务是用斜杠分开的,此时在smartbi中如需支持service_name,数据库名称需以/开头: image2018-10-23 10:52打开即席查询或透视分析直接进入浏览模式
(本文档仅供参考) 问题描述 目前直接打开报表进入的是编辑模式,需求需要打开报表即为浏览模式 解决方案: 1.将报表发布到数据门户,默认打开数据门户处的报表即为浏览模式。如下图: image2025-5-30_17-46-44.png 2.对于从第三方系统打开分析展现处smartbi资源,采用openresource.jsp连接时,可直接在用户名用户密码后添加参数&mode=preview。例如格式:http://ip:实际端口/smartbi/vision/openresource.jsp?re sid=资源id&user=用户账号&password=用户密码&mode=preview 3.新建web链接【跨版本升级变更】V10.5➜V11
库联合数据源。 数据源 星环数据源 数据源改名为星环Inceptor: 1.更改背景logo图片 2.仅支持星环Inceptor的hive 星环Inceptor数据连接 高速缓存库 高速缓存库默认是SmartbiMPP,不能指定为其他Schema 连接支持指定Schema 在V11最新版本中,高速缓存库连接支持指定Schema: 1、企业部署了多套BI系统,且系统间知识库相互独立。在旧版本中需要部署多个高速缓存库对应不同BI系统,增加运维成本。在新版本中,高速缓存库连接可直接在连接字符串中指定Schema。 2、若旧环境升级至 V11 版本,系统将默认启用 SmartbiMPP,数据会自动抽取调用远程方法出现错误,报表已经被删除
(本文档仅供参考) 问题说明 api调报表导出接口,报错“调用远程方法出现错误:报表已经被删除:xxx”。但根据id查找,资源是存在的。 image2024-10-22_15-37-27.png 另导出excel文件内容为ReportHTML 缓存丢失的异常信息。 image2024-10-22_15-40-34.png 问题原因 资源id存在,但调用接口导出时提示此类型信息时,需确认导出报表id与对应调用方法指向的报表资源类型是否一致。 导出excel内容出现ReportHTML 缓存丢失的异常信息时,需确认导出调用方法所传参数是否正确。如:电子表格导出excel文件,方法中所传类型参数值excel和