页面树结构
转至元数据结尾
转至元数据起始


本文档介绍Smartbi及其各个组件的的功能。

名称说明组件是否可选
SmartbiSmartbi 主体应用。必选
知识库用于存储Smartbi系统相关的数据信息,是必不可少的重要组件。必选
Smartbi-MPP高速缓存库,分布式的数据缓存库,分析人员在遇到大数据量查询场景下,可将数据抽取到Smartbi-Mpp进行加速,使用亿级数据查询。必选
Smartbi OLAP ServerSmartbi数据模型引擎,用于为数据模型提供多维分析能力,可将所有查询结果归集后,基于CUBE模型重新构建数据结构。必选

数据挖掘-实验引擎

负责接收 Smartbi 发送实验执行请求,为自助ETL提供基础服务。

通过解析实验定义,生成Spark 计算任务或Python计算任务,分别发送给Spark集群或Python集群。

本身并不承担计算任务,只负责计算任务的调度跟分发。

必选
数据挖掘-服务引擎提供模型预测服务给第三方系统调用。可选
Smartbi-UnionServer跨库联合查询,分布式SQL查询引擎,处在Smartbi的SQL引擎层,为不同的数据源提供统一的SQL解析、跨库查询能力。可选
Smartbi-Proxy负载均衡服务器。用于Smartbi集群代理转发。可选
导出引擎主要用于自助仪表盘等场景导出图片或者pdf等。可选
Python执行节点

Python 执行环境,主要承担实验引擎发送过来的Python计算任务。

可以横向扩张,实验引擎会根据负载均衡策略把Python计算任务分发到不同节点。

可选
Spark分布式计算平台,主要承担实验引擎发送过来的Spark计算任务,其中Worker实例可以横向扩展可选
Hadoop分布式系统基础平台,主要存储计算任务的中间结果数据可选
Zookeeper用于实现数据挖掘实验引擎和数据挖掘服务引擎的高可用。可选
RedisRedis 高性能的键值数据库,主要存储Smartbi会话信息。

可选

自然语言分析主要用于为 Smartbi 提供自然语言分析能力。可选
Smartbi License Server在Smartbi所在服务器的IP和MAC无法固定时,可通过Smartbi的LicenseServer来统一管理授权,Smartbi从licenseserver上获取授权许可。可选
  • 无标签