页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。

1.什么是SparkSQL

Spark SQL是Spark用于结构化数据处理的Spark模块。

...

SparkSQL可以用于简化可伸缩的分布式数据集RDD(Resilient Distributed Dataset)的开发,提高开发效率,且执行效率飞快。

2.哪些组件用到了SparkSQL哪些组件用到了SparkSQL

自助ETL\ETL高级查询中的【派生列】、【过滤】以及【SQL脚本】(即将更名为Spark SQL)组件,支持输入spark SQL语法或语句,完成对数据进行处理或查询的任务。

序号功能模块组件
1自助ETL【派生列】【过滤】以及【SQL脚本】
2数据模型-ETL高级查询【派生列】、【过滤】以及【SQL脚本】

3.SparkSQL语法说明

序号分类链接

1

数学和统计运算符、函数

数学和统计运算符、函数

2

逻辑运算符、条件判断函数

逻辑运算符、条件判断函数

3

日期时间函数

日期时间函数

4

数据类型转换函数

数据类型转换函数

5

转换和格式化函数

转换和格式化函数

6

字符串处理函数

字符串处理函数

7其他函数其他函数

...