...
参数 | 说明 |
---|---|
关系数据源表 * | 从已经连接配置好的关系数据源中选择一张用于抽取数据的表。必填。 |
输出字段 | 默认抽取所有字段数据。如果数据量特别大,而表中很多字段又没有用处,建议在这里只选择需要的字段,其他无用字段删除,可以有效提高数据抽取速度。 |
过滤条件 | 默认抽取所有数据。可以在这里设置过滤条件,只抽取满足条件的部分数据。如果需要增量抽取数据,必须利用此功能,在“过滤条件”中可以使用“参数管理”中配置的参数,从而控制动态的数据过滤条件。 请参考:如何进行数据的增量抽取 |
分区设置 | 把表数据相对平均分成多个分区,抽取程序会尽可能一个分区分配一个线程进行并行抽取,能够极大的提高大数据量情况下的数据抽取性能。详情请参考 分区设置 。 |
优化参数 | 用于配置 JDBC 读取数据时的 connection 以及 fetchsizes 等属性。 QUERY_JDBC_FETCHSIZE 为引擎内读取一次数据的批次( jdbc的 fetchsize 可以参考网上类似的文档说明 jdbc_fetchsize 说明 )、对性能有较大影响,若需要根据数据库不同环境配置 JDBC 连接属性,需要带上 connprop. 前缀(注意后面有 . 并大小写严格区分)。 |
...