页面树结构
转至元数据结尾
转至元数据起始

(本文档仅供参考)

问题说明

ETL中使用Excel数据源,上传Excel文件,excel数据是文本,数据是0003676 ,但是执行出来前面的000没有了,如下图:

解决方案

这是由于ETL中使用了spark自动推断数据类型,原来的0003676这种格式推断数据类型后会变成3676,若不使用自动推断类型,全部字段会被当成字符串处理,这样的逻辑就更加不合理了,暂时没办法从代码上解决这个问题。

可以通过一些操作来规避:打开excel文件,在数据行开始前插入一行,有问题的列插入字符串型数据,其他列按照原先的类型插入数据,然后通过过滤,把自己加的那行数据移除掉,比如行选择或者sql脚本节点。

  • 无标签