第8页,共87页。 显示 865 条结果 (0.021 秒)
ETL上传excel文件日期格式异常变化
(仅供参考) 问题描述: 上传的excel 内容格式如下: image2023-8-29_16-57-57.png 上传excel读取之后,为什么日期格式excel识别后会变成 yyyy-mm-dd呢? image2023-8-29_16-59-13.png 问题原因: 考虑到日期这种类型的重要性和多样性,所以产品ETL的设计思路是在元数据中无法识别日期时间格式的情况下,一律按字符串处理,可通过相关节点【日期时间】【日期计算】进行相关格式的转换处理。 image2023-8-29_17-2-36.png自助ETL中使用SQL脚本函数报错
(本文档仅供参考) 问题: 在自助ETL中想在SQL脚本中对字段四舍五入处理,但是一用函数就报错:Attribute name "round(UnitPrice, 0)" contains invalid character(s) among " ,;{}()\n\t=". Please use alias to rename it.如下图所示。 image2022-10-11_9-42-13.png image2022-10-11_9-41-41.png 解决方案: 这是因为函数中可能会包含一些特殊字符,作为字段名输出的时候会有问题,需要使用as重命名输出ETL中处理含有大字段(BLOB,CLOB)的数据,导致OOM的处理办法
: 由于ETL在开启了缓存后,会生成和读取parquet文件,而这个异常是Spark读写parquet文件抛出的异常,因此可以用如下方案规避: 1、关闭ETL缓存 image2024-1-17_9-45-36.png 2、设置目标的优化参数WRITE_JDBC_BATCHSIZE为1ETL节点报错信息:out of excel limit columns, colCnt: 16380(excel数据内容超出限制)
(本文仅供参考) 问题描述: 用户在使用ETL数据源节点《EXCEL文件》执行过程中报错out of excel limit columns, colCnt: 16380(excel数据内容超出限制),具体如下图; image2023-10-12_17-4-20.png image2023-10-12_17-4-30.png 解决方案: 通过日志判断EXCEL数据文件的内容,用户反馈数据量一共20列和1000多行,并不会出现数据内容超限的情况,通过远程查看用户的EXCEL使用的数据内容,发现EXCEL表里面包含几十个SHEET页,且用户只需要使用第一个SHEET页,将其他无用的SHEET页删除后,可以正常的执行ETL自助ETL执行报错:ORA-00604:error occurred at recursive SQL level 1 ORA-01882:timezone region not found
(本文档仅供参考) 问题描述 关系数据源连接测试通过,但是在自助ETL中,选择该数据源节点执行报错,报错内容如下,经监控发现ETL执行时所用驱动并非数据源指定的驱动。 image2023-9-19_16-28-49.png 解决方案 将数据库驱动的jar包放到数据挖掘引擎的目录下一份\SmartbiEngine\conf\lib\oracle,并重启数据挖掘引擎服务。 bi数据源那里的驱动和数据挖掘引擎这里的驱动是两份,如果是自定义驱动,都需要这样操作。通过存储过程或 ETL 同步用户
可以通过存储过程或 ETL 定时将第三方系统的用户信息同步到 Smartbi 知识库相关的用户表中。 1. 知识库相关用户表 1.1 说明 同步数据库时涉及到的表如下: 数据表 含义说明 t_group 用户组表,记录用户组(机构)的信息。 t_user 用户表,记录所有用户信息。 t_group_user 用户组与用户对应表。相关字段:t_user.c_userid、t_group. c_groupid t_role 角色表,记录系统所有角色的信息。相关字段:t_group. c_groupid部署ETL实验引擎报错:’.bash_profile‘:不是有效的标识符
(本文档仅供参考) 问题: 部署ETL实验引擎报错:’.bash_profile‘:不是有效的标识符: image2022-11-30_17-26-59.png 解决方案: bash_profile文件中存在空格,检查文件内容; 建议将jvm相关配置放在文件最后,规避该问题。Windows下部署的ETL实验引擎出现IO异常的规避办法
Windows下以非管理员用户启动挖掘引擎,导致ETL出现IO相关的运行时异常,一般与执行权限、目录文件权限有关; 包括但不限于与如下异常: image2024-1-22_11-7-20.png image2024-1-22_11-6-53.png 规避办法: 1、使用administrator组中的用户启动服务。 image2024-1-22_11-20-37.png 2、用管理员身份启动bat 文件。 image2024-1-22_11-24-45.png PS: 在windows上部署Smartbi最佳实践: 1、用管理员安装。 2、用管理员启动服务。 WindowsETL/数据挖掘如何配置组合分析tuna数据源
(文档仅供参考) 问题说明 ETL或挖掘中当需要第一次使用组合查询时,需要配置Tuna数据源,否则提示【当前系统中不存在Tuna数据源,清联系管理员在如下位置配置:系统运维=>数据挖掘配置=>引擎设置=>配置Tuna数据源】,具体该怎么配置呢? image2024-1-11_21-7-3.png 解决方案 在【系统运维->数据挖掘配置->引擎设置->配置Tuna数据源->配置数据源】,直接点击【确定】,系统即会自动在数据源处生成 SmartbiMining_Tuna 注:只有Smartbi管理员才能设置tuna密码,并且不需要验证以前的密码; 当前配置是为了ETL上传线下excel文件读取excel之后0不见了
(本文档仅供参考) 问题描述 客户场景:通过etl上传线下excel文件,经过读取excel节点后,前面的0不见了! 解决方案 问题原因:由于使用了spark自动推断数据类型,原来的000001这种格式推断数据类型后会变成1,若不使用自动推断类型,全部字段会被当成字符串处理(这样子更不合理!!!),暂时没办法从代码上解决这个问题。可以通过一些操作来规避: 1、打开excel文件,在数据行开始前插入一行测试数据,如示例中插入对应字符串型的值,其他的按照原先的类型插入数据。如: (下图) 在第一行中插入aa image2023-7-25_11-2-16.png