1、访问地址:http://IP:端口/aiweb/
2、输入用户名和密码(此处的用户名和密码同smartbi登录的一致)
3、选择对应的smartbi地址(此处地址是在管理界面中新增服务器配置后的),然后点击登录
Smartbi AIChat的操作界面设计简洁明了,采用了大量的白色背景和鲜明的颜色来突出重要的元素。同时,界面提供了丰富的功能和选项,方便用户进行数据查询、分析与洞察。无论是数据分析新手还是资深专家,都能通过Smartbi AIChat轻松实现数据驱动的业务决策。
AIChat前端主要分为如下6个区域:辅助功能区、创建对话区、我的收藏区、历史对话区、对话区、数据模型展示区。
辅助功能区位于操作界面的左侧,为用户提供一系列辅助工具和设置选项。主要功能包括: 当前对话区展示。
使用帮助入口,点击后跳转到AIChat白泽帮助中心。
运维设置对话管理,可以查看到所有问句的对话信息
系统设置入库,鼠标在该图标上悬停,即展示其二级设置菜单:包含"官网入口"、"个性设置"、"操作指引"、"关于白泽"以及"退出登录"功能。其中个性设置又包含"显示代码"、"显示数据面板功能。
创建对话区是用户开始新对话的起点,可以创建两种方式的对话:分析模式和专家模式。
分析模式:可以做数据查询、图表生成、数据分析、趋势预测、归因分析等,帮助业务用户提供工作效率。
专家模式:通过挖掘和分析用户提供的业务数据,生成包含关键业务洞察的详细报告,旨在帮助管理者发现潜在的业务问题或机遇,辅助决策。
我的收藏区收藏了用户之前的问句结果,用户可点击相关问句,在对话区快速复原结果查看。用户也可以通过问句后面的按钮 ,进行取消收藏。
主要功能包括:
收藏管理:用户可以将自己感兴趣的问句添加到收藏区中,方便日后查看和使用。
快速访问:通过我的收藏区,用户可以快速访问自己收藏的内容,提高工作效率。
历史对话区记录了用户一段时间以来的历史问句及当时的结果,用户可点击相关问题,在对话区快速复原结果查看。用户也可通过问句后方的按钮
,为问句定义容易识别的别名或者从历史对话中删除和收藏改问句。
对话区是系统完成问答的核心区域,包括"对话模式"、"产品LOGO"、"快捷帮助"、"推荐问句"、"问句功能区域"、"问句输入区"等部分。
"对话模式"的"查询模式",会显示处理过程的pyhton代码展示区。如:
答复区下方有一排功能按钮 ,从左到右依次为:导出、AI分析报告、赞一下、踩一下、调试。
在对话区下方,如上图,是一个快捷输入功能组及问题输入区域,输入问题后点击右下方的发送问题按钮,获取答复。快捷输入功能组从左到右依次为:
a、单轮对话、多轮对话切换,默认为多轮对话。
b、快捷帮助输入(在问题输入区域输入 "/"符号获取快捷帮助 )。
c、模型切换按钮,方便用户快捷在多个模型建切换,完成业务问答。
d、历史对话:当前模型下的历史对话的问题展示。
e、推荐问句:当前模型下,系统给与的推荐问句。
数据模型展示区位于界面右侧,用于展示当前数据模型及其维度和度量信息,方便用户清楚当前模型有那些相关的数据可以查询或者分析。主要功能包括:
模型列表:展示当前可用的数据模型列表,用户可以根据需要在不同的数据模型之间进行切换,以适应不同的分析需求。与"对话区"的【模型切换按钮】作用一致
维度与度量:在模型列表中,系统会显示每个模型的维度和度量信息,帮助用户了解模型的结构和内容。
数据准备地址:http://xxxx/smartbi/vision/index.jsp
在Smartbi AIChat中,数据准备是一个至关重要的环节,它决定了后续数据分析的准确性和有效性。进行数据准备时,主要涉及到一系列步骤和工具,以确保数据的质量、可用性和适用性,为后续的数据分析和可视化提供坚实基础。以下是数据准备过程中涉及的主要步骤:
在开始数据准备之前,首先要明确分析的目标和需求。确定需要分析的数据维度和度量,以及可能涉及的数据源。
首先,需要建立与数据源的连接。Smartbi支持多种数据源,包括关系数据库(如MySQL、Oracle等)、Excel文件、CSV文件等。
在Smartbi界面上,通过填写数据源的相关信息(如数据库名称、驱动程序类型、连接字符串、用户名和密码等),建立与数据源的连接。
在成功建立数据连接后,可以将数据源中的数据导入到Smartbi平台中。导入的数据可以包括表、视图、存储过程等。
对导入的数据进行清洗,包括处理缺失值、异常值、重复值等。
可以使用Smartbi提供的清洗工具,如数据过滤、数据替换、数据填充等功能。
根据业务需求,对数据进行转换,如数据类型转换、数据格式转换等。还可以使用计算列、派生列等功能,基于原始数据生成新的数据列。
在Smartbi中,可以创建数据模型来组织和管理数据。
数据模型可以包括多个表或视图,并通过表关系(如主键-外键关系)来定义它们之间的联系。
在数据模型中,需要设置维度和度量。维度是描述数据的属性或分类的字段(如日期、地区、产品等),而度量是用于量化分析的字段(如销售额、利润等)。可以通过拖拽点选的方式,在Smartbi界面上轻松设置维度和度量。
如果数据源的性能不够好,或者需要创建复杂的数据分析模型,那么数据抽取就变得非常必要。
在Smartbi中,可以定义抽取规则,包括定时抽取、立刻抽取、全量抽取、增量抽取等。
对于需要定期更新的数据,可以设置增量更新规则,以确保数据模型的时效性和准确性。
进入构建界面:运维设置->自然语言配置->图谱管理。
点击 按钮,选择需要构建知识图谱的数据模型或业务主题(例如给数据模型"订单模型"构建模型图谱。),接着点击下一步。
选择需要训练的维度,点击训练 开始构建知识图谱。
某些毫无意义的维度字段(例如ID、描述、详情等长字符串并且对模型训练和查询毫无意义的字段),会严重影响查询的准确率和模型训练效率,需要手动将其在训练维度中排除掉。
上一步:如果选择错误的数据模型或业务主题,可点上一步进行重新选择;
知识图谱构建成功后会提示显示"操作成功",并且能在模型管理的列表内查看到新增的模型知识图谱。
产品预置了部分数据模型,供用户体验快速问答。如果用自己的数据进行分析,可参见《2.2 数据准备》,上传自己的数据,进行建模及问答体验。
地址:{+}https://aichat.cloud.smartbi.com.cn/aiweb+ 本地或线上登录地址,输入账号\密码,选择默认服务器,进行登录。
登录成功后,用户可通过以下三种方式之一快速开始试用(内置已训练好的模型)。
在"对话区"的"问句输入区",输入具体问句(问句要求参见:《2.5 问句指南》),点击【发送问句】按钮,获取回答。
点击"对话区"中【推荐问句】,获取AI回答。
用户提交问句后,AI会将问句转换为数据模型的查询,并返回结果。
点击"数据模型展示区"相关具体维度成员及度量下具体指标后,点击【发送问句】按钮 ,获取回答。
图形使用:系统答复数据默认以表格展示,如需以其他图形方式展示,需在问题中明确以何种图形展示,例如下图展示:
支持的图形有:
图形 | 功能说明 |
表格 | 切换为表格 |
清单 | 切换为清单表 |
柱图 | 切换为柱状图 |
饼图 | 切换为饼图 |
线图 | 切换为线图 |
双Y联合图 | 切换为双Y联合图 |
雷达图 | 切换为雷达图 |
散点图 | 切换为散点图 |
图形扩展 | 极坐标、热力图、漏斗图、瀑布图等 |
支持的多种无需预先计算查询种类有:
计算关键词 | 功能说明 |
同比 | 同比增长率,计算公式:(本期 - 同期)/本期*100% |
同期 | 同期值 |
同期增量 | 同期增加值,计算公式:本期-同期 |
年/季/月累计 | 从上一个时间单位的开始到目前的累加值 |
年/季/月累计同期 | 从上一个时间单位开始到目前的累加的同期值 |
年/季/月累计同比 | 从上一个时间单位开始到目前的累加的同期增长率 |
年/季/月累计同期增量 | 从上一个时间单位开始到目前的累加的同期增加量 |
环比 | 环比增长率。计算公式:(本期 - 前期)/本期 *100% |
前期值 | 上一个时间单位的值 |
环比增量 | 环比增加值。计算公式:本期 - 前期 |
前N/后N | 排名 |
地址:{+}https://aichat.cloud.smartbi.com.cn/aiweb+ 本地或线上登录地址,输入账号\密码,选择默认服务器,进行登录。
点击新建对话下拉框,选择专家模式。
说明:该示例使用的数据模型非预置模型,用自己的数据进行分析,可参见2.2 数据准备。
序号 | 问句 |
1 | 大学专业与员工离职率的关系? |
2 | 只看京沪粤苏浙闽皖这几个省份的 |
3 | 按照部门对工作升级容易性进行评价? |
问句1:大学专业与员工离职率的关系?
问句2:只看京沪粤苏浙闽皖这几个省份的
问句3:按照部门对工作升级容易性进行评价?
说明:数据模型请先选择"经营分析模型-精简版"。
请按照以下顺序向AIChat提问,用户可以通过自然语言轻松创建出高质量的图表,并对图表的各种配置项进行设置和调整。AIChat会在多轮对话中保持回复的连贯性、准确性和深入性。
序号 | 问句 |
1 | 看一下近3年各个省份的合同金额 |
2 | 只看京沪粤苏浙闽皖这几个省份的 |
3 | 作图 |
4 | 省份在X轴 |
5 | 只看业绩排名前5的省份。 |
6 | 添加红色平均线,并标注。 |
问句1:看一下近3年各个省份的合同金额。
问句2:只看京沪粤苏浙闽皖这几个省份的。
AI会理解上述省份的简称,并用上一个输出结果进一步过滤。
问句3:作图。
AI会自动选择图形类型。
问句4:省份在X轴
可以通过自然语言设置图形的属性。
问句5:只看业绩排名前5的省份。
问句6:添加红色平均线,并标注。场景2:数据计算能力
体验同比、环比、累计等时间智能计算。
序号 | 问句 |
1 | 看一下近3年各个季度的商机个数 |
2 | 添加同比 |
3 | 添加年累计 |
4 | 作图,柱线双Y联合图,不包含同比字段 |
5 | 图例显示在图形上方,顶部,居中 |
问句1:看一下近3年各个季度的商机个数。
问句2:添加同比
问句3:添加年累计
问句4:作图,柱线双Y联合图,不包含同比字段。
问句5:图例显示在图形上方,顶部,居中
AIChat内置了多种机器学习算法,并且还和Smartbi挖掘平台打通,能够调用挖掘平台的算法,实现复杂深入的分析。
序号 | 问句 |
1 | 看一下去年各月份的合同金额、同比,并作图 |
2 | 为什么2023年10月份合同金额大幅下降了? |
3 | 预测一下未来3个月的合同金额趋势。 |
问句1:看一下去年各月份的合同金额、同比,并作图。
问句2:为什么2023年10月份合同金额大幅下降了?
问句3:预测一下未来3个月的合同金额趋势。
在上一步查出的数据基础上,一步步查出更复杂的业务场景,实现嵌套式查询。
序号 | 问句 |
1 | 看2022年1月到2023年3月的合同额 |
2 | 找出合同额连续3个月增长的销售分部 |
3 | 查找出这几个分部,每个分部在2023年合同额最高的3个销售姓名 |
问句1:看2022年1月到2023年3月的合同额
问句2:找出合同额连续3个月增长的销售分部
问句3:查找出这几个分部,每个分部在2023年合同额最高的3个销售姓名
在通常的分析场景中,我们会通过各种维度去查询数据,或者通过时间计算查询指标的同环比增长等情况,亦或是希望图表结合的方式呈现数据,下表是我们总结归纳的可满足大部分使用场景的查询常用词,接下来我们将一一为您例举示例。
类别 | 关键字 |
实体 | 指标名:销售额 维度名:年、月(份)、季(度)、品牌、媒体类型 成员名:美的、海尔、电视、广播、报纸 |
图形 | 表格、柱图、线图、饼图 |
聚合 | 总计、求和、金额、数量、计数、平均值、最多、最少、最大、最小、最高、最大值、最大(值)、最低、最小值、最小(值)、中位数、方差 |
连词 | 和、或、各、每个、与、对比、比较、和、但是、也不、加之、除了 |
日期 | 年、上半年、下半年、季、季度、Q1、月份 |
相对日期 | 今天、今年、本年、本月、当前、当前季度、当前月份、昨天、明天 上个月、上个季度、前N个月、近N个月、过去N天、N 天前、N 天后 早于、之后、晚于、从...到...、2024年1-7月、今后、以后、超过 |
时间智能 | 前期、同期、同期增长、环比、同比、年累、月累、年累同比、月累同比 |
等式(范围) | 在…中、等于、=、晚于、超过、在…内、在…之间、N1-N2 |
示例:2012 年以前的订单年份? 价格在 10 和 20 之间? John 的年龄大于 40 岁吗? 总销售额在 200 - 300? | |
等式(值) | 是、为、等于、在…中、…的…、在…内、在…中、在…上 |
示例:哪些产品是绿色的? 订单日期为 2012 年。 John 的年龄是 40 岁? 总销售额不等于 200? 订购日期为 2016/1/1。 价格是 10? 颜色是绿色? | |
查询命令 | 排列、排列方式、方向、组、分组方式、按、显示、列出、显示、给我、命名、只、仅、排列、排名、比较、要、与、针对、按字母顺序、按升序、按降序、顺序 |
逻辑 | 大于、超过、小于、少于、等于、大于等于、小于等于、不超过 区间(100万-200万) 所有、全部、包含、每个、以...开头、以...结尾 并且、或者、同时、既....又... |
前 N 个 | 前...名、后...名、最高、最低、第一、最后、下个、最早、最新、最旧、最新的、最近的、下一个 |
疑问词(关系、限定) | 时间、哪里、哪个、谁、多少、多少次、多久一次、金额、数字、数量、多久、什么 |
首先我们需了解何为"实体"?
实体是信息世界和现实世界中的基本单元,是构建数据模型、进行信息抽取、语义理解和知识表示的基础元素。
实体在不同领域有着不同的含义,但通常来说,实体是指具有独立存在意义且可以相互区别的事物、对象或概念。在计算机科学、人工智能、数据库、知识图谱等领域中,实体常常用来指代现实世界或抽象概念中的具体项目,比如一个人、一个地点、一个组织、一个事件或者是某个具体的数据对象。实体可以作为信息存储、处理和分析的基本单位。
进行实体罗列的时候需要包含维度和指标,否则无结果反馈。以下是罗列合同相关实体,包括合同名称、行业名称、商机类型、合同类型、合同金额
以下是错误示例,罗列的实体中仅包含维度不包含指标,此时是无结果返回的。
2023年1-9月与2024年1-9月销售额对比
将图形的X轴,统一用月份表示,同一个月份不同年份的柱子放到一起对比
查询各省份的销售额;用柱图显示,显示数值;并加上中位数线,显示标线名字和数值
各省份的销售额、中位数、平均值、最大值、最小值、方差
广东省2024年上半年各月份销售额 、同期值、同比、前期值、环比
用双Y图展示,柱图展示销售额 、同期值、前期值;线图展示同比、环比
在本示例中我们可以发现:两个问句是有连贯的,第一个问句的结果是第二个问句的基础,也就是说当我们在向AIChat提问题的时候可以直接基于同一个分析需求进行拓展延伸。
金融行业销售额大于100万并且制造业小于50万的城市 金融行业销售额大于100万或者制造业小于50万的城市
今年每个区域销售额最高的三个品牌
合同均价等于合同金额除以合同个数;各省份的合同均价,保留两位小数
广州和深圳销售额之和大于50万的行业 增加两列:广州销售额, 深圳销售额
将去年的销售额按行业分组,分组为:300万以上、200万到300万、100万到200万、100万以下,显示个分组销售额以及各分组包含的行业
广州分部在金融行业的销售额;显示所有销售名称,没有销售额的显示0
2022年上半年每月都有销售额的分部,线图显示
Y轴使用对数轴
有哪些是采购自助分析的合同,合同金额多少
销售额连续5个月增长的行业有哪些? 请列出他们分别是哪几个月出现了连续增长
看一下2022年各月销售额同比情况,并作图 为什么2022年5月合同金额同比大幅下降
同时,若是想让AI直观的给出结论,我们可以使用【AI数据解释】,让AI全面分析问题后告诉我们造成这个结果的原因以及对此有什么建议。
通常,我们在做趋势预测的时候需要有前置条件,即要先查询一个时间范围的结果,然后基于这个时间范围做预测分析,不过这里我们需要注意的是为了确保预测结果的相对准确,尽可能预测的时间不要超过3个月。
示例问句:2021年到2023年各月的销售额并预测未来3个月的销售额。