第100页,共466页。 显示 4,651 条结果 (0.047 秒)
数据挖掘-停用词处理
概述 停用词处理是由于有些词频很高,但对文章却没有太多意义的语气词和助词等等,比如这、我、你们、吗等等,对这些词进行去掉处理以便能够更好的分析语义。常用于关键词提取分析。 输入/输出 输入 一个输入端口,用于需要过滤停用词的字段。 输出 一个输出端口,用于输出去掉停用词之后的结果。 参数设置 参数名称 说明 备注 字段选择 选择需要去除停用词的列 必填 停用词列表 在对话框填写停用词,每行填写一个停用词 必填 示例 使用“深圳企业信息”示例数据,选择分词后去除停用词的列(企业名称原生SQL数据集抽取失败:字段与查询列表字段不匹配
(本文档仅供参考) 问题现象 原生SQL数据集可以预览,但抽取失败。看系统日志存在报错:字段与查询列表字段不匹配:field size :33; head size :34 image2024-6-5_10-9-51.png image2024-6-5_10-14-4.png 解决方案 一般是因为原生SQL数据集修改了语句,但没有检测输出字段,导致右侧输出字段列表与实际返回的字段列表不一致导致。只要有修改原生SQL数据集中的SQL语句,记得重新检测输出字段确保字段列表一致。 image2024-6-5_10-13-47.png数据源管理时,sql server数据库中的表的别名(注释)为什么同步不过来
(本文档仅供参考) 问题 mysql ,oracle的数据库表字段注释中有内容,smartbi通过数据库管理将表添加进来时能获取到并生成字段的别名,客户这边用的sql server ,添加的注释并不能获取到,这是什么原因呢? 解决方案 SQL server 数据库自身是没有注释的概念,只是通过数据库自身定义的一个属性来作为注释,但对于jdbc驱动来说,并不具备注释调用的接口,若是需要对此数据库提获取到作为注释的属性,需单独定制扩展包进行处理。 无法获取注释 注释获取不了ETL节点不能执行该节点
(仅供参考) 问题描述: 在使用ETL过程中,发现有些etl不能执行对应的节点,对应是灰色的,可以执行到此处。另外新建的资源就能正常点击操作。 image2023-8-27_21-25-28.png 问题原因: ETL资源设置了不缓存。在不缓存的情况下,由于执行该节点,需要基于上一节点的缓存进行执行,如没有上一节点的结果缓存,则该功能不单独支持。如需要执行该节点功能,则设置etl缓存功能即可,见下图设置: image2023-8-27_21-26-48.png image2023-8-27_21-30-12.png资源id大小写变化导致字段缺失报错
(本文档仅供参考) 问题描述 客户做了切换数据库类型的操作,切换后报表看起来是没有问题可以查询,但是操作同步表后,报表直接报错,提示字段缺失 问题原因 两个数据库中,表名区分了大小写,系统内保存的节点id不同,导致字段缺失 解决方案 资源创建都是依赖于资源id的,如果大小写变化了,就关联不上,建议原数据源不要动,有需求要同步表可以新建一个数据源使用 数据库大小写区分 数据库切换区分大小写 数据库切换不区分大小写SQL中如何获取用户角色?
(本文档仅供参考) V9以下版本参考如下方式实现,V9以上版本系统已内置了相关系统函数。 问题说明 如果想根据用户所拥有的角色判断数据的使用权限,现在产品没有该函数,如何获取当前登陆用户的所属角色? 解决方案 选择【增加自定义函数】,然后把CurrentUserAllRoleIDs和CurrentUserAllRoleNames直接填写进去,具体如下: 1、【公共设置】--》【函数列表】--》【系统函数】--》【字符串】--》右键--》【增加自定义函数】: image2018-11-16 10:13:2.png运行任务或者计划时会报"连接服务器异常:用户"XXX"登录应用服务器失败。"错误
(本文档仅供参考) 问题说明 运行任务或者计划时,没有执行成功,系统日志会报"连接服务器异常:用户"XXX"登录应用服务器失败。"错误 1.png 解决方案 1.确认计划配置-执行设置-执行用户,是否设置为计划创建者。 image2020-10-22_14-40-1.png 2.如执行用户为计划创建者,去知识库检查t_user表是否有该用户。 如该用户不存在,可通过以下两种方式解决: (1)修改执行用户为特定用户 (2)补全该用户的信息 如该用户存在,烦请发送系统日志,这边做进一步分析。计划任务以邮件附件形式发送报表,报表文件过大的处理机制
(本文档仅供参考) 问题描述: 计划任务以邮件附件形式发送报表,报表文件过大的话有什么办法处理? 文件过大,是否会影响发送?若是超过普通附件大小限制,是否自动以超大附件的形式发送? 解决方案: 计划任务以邮件附件形式发送的报表的附件处理机制,均由发件方的邮件服务器进行处理。故文件过大的处理能力或由于文件过大需自动转换为超大附件形式,都是视乎发件的邮件服务器本身这方面的能力,产品并没有特殊处理。 一般来说,报表以附件的形式进行邮件发送,附件即为excel报表或图片等形式文件,对应的是一个Smartbi中的报表资源,且都以压缩包的形式进行打包并上传附件进行邮件发送,Smartbi中的报表Linux服务器不能正常运行并且连进程都消失了
(本文档仅供参考) 问题说明 在使用smartbi的过程中,有时候服务器运行出现问题,比如说宕机现象,这时候实际连服务器进程都退出了,一般是什么原因? 解决方案 首先smartbi并不会导致服务器进程都退出,因为smartbi不会发起这些命令。通常这类问题是因为服务器上没有添加 -Djava.awt.headless=true 的jvm参数导致的,需要将此JVM参数 ( 如:JAVA_OPTS="$JAVA_OPTS -Djava.awt.headless=true )添加到对应的服务器配置文件中,以保证服务器进程的正常运行,具体可如何配置JVM参数可参考wiki文档:配置服务器自助数据集数据权限迁移问题
(本文档仅供参考) 问题 在环境A中对自助数据集设置了数据行权限,然后勾选包含数据行权限后导出,再导入到环境B中,右键打开自助数据集的数据权限界面,发现数据权限没有同步过来。 image2023-10-27_16-34-11.png image2023-10-27_16-34-48.png 问题原因 目前不支持自助数据集的数据行权限导出,因为自助数据集只有抽取了以后,才能设置数据权限,而这个数据权限是设置在高速缓存库表上的,通常情况下,两个环境是不会共用一个高速缓存库的,所以资源迁移后是需要重新抽取,并且重新设置数据行权限的。