页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。

1.概述

对话式分析又称为NLA、自然语言分析、自然语言查询,本文档旨在指导Smartbi AIChat用户写出意图明确、语义清晰的问句,帮助用户快速精准的获取到想要的数据。

用户写出意图明确、语义清晰的问句,能够帮助 Smartbi AIChat 精准的理解问句,从而得到想要的数据结果。

2. 数据分析查询常用词

在通常的分析场景中,我们会通过各种维度去查询数据,或者通过时间计算查询指标的同环比增长等情况,亦或是希望图表结合的方式呈现数据,下表是我们总结归纳的可满足大部分使用场景的查询常用词,接下来我们将一一为您例举示例。在通常的分析场景中,我们会通过各种维度去查询数据,或者通过时间计算查询指标的同环比增长等情况,亦或是希望图表结合的方式呈现数据,下表是我们总结归纳的可满足大部分使用场景的查询常用词,接下来我们将逐一举例说明。

类别

关键字

实体

指标名:销售额
维度名:年、月(份)、季(度)、品牌、媒体类型
成员名:美的、海尔、电视、广播、报纸

图形

表格、柱图、线图、饼图

聚合

总计、求和、金额、数量、计数、平均值、最多、最少、最大、最小、最高、最大值、最大(值)、最低、最小值、最小(值)、中位数、方差

连词

和、或、各、每个、与、对比、比较、和、但是、也不、加之、除了

日期

年、上半年、下半年、季、季度、Q1、月份

相对日期

今天、今年、本年、本月、当前、当前季度、当前月份、昨天、明天
上个月、上个季度、前N个月、近N个月、过去N天、N 天前、N 天后
早于、之后、晚于、从...到...、2024年1-7月、今后、以后、超过

时间智能

前期、同期、同期增长、环比、同比、年累、月累、年累同比、月累同比

等式(范围)

在…中、等于、=、晚于、超过、在…内、在…之间、N1-N2


|示例:2012 年以前的订单年份? 价格在 10 和 20 之间? John 的年龄大于 40 岁吗? 总销售额在 200 - 300?

等式(值)

是、为、等于、在…中、…的…、在…内、在…中、在…上


示例:哪些产品是绿色的? 订单日期为 2012 年。 John 的年龄是 40 岁? 总销售额不等于 200? 订购日期为 2016/1/1。 价格是 10? 颜色是绿色?

查询命令

排列、排列方式、方向、组、分组方式、按、显示、列出、显示、给我、命名、只、仅、排列、排名、比较、要、与、针对、按字母顺序、按升序、按降序、顺序

逻辑

大于、超过、小于、少于、等于、大于等于、小于等于、不超过
区间(100万-200万)
所有、全部、包含、每个、以...开头、以...结尾
并且、或者、同时、既....又...

前 N 个

前...名、后...名、最高、最低、第一、最后、下个、最早、最新、最旧、最新的、最近的、下一个

疑问词(关系、限定)

时间、哪里、哪个、谁、多少、多少次、多久一次、金额、数字、数量、多久、什么

3. 问句示例

3.1 实体罗列

首先我们需了解何为“实体”?

实体是信息世界和现实世界中的基本单元,是构建数据模型、进行信息抽取、语义理解和知识表示的基础元素。

实体在不同领域有着不同的含义,但通常来说,实体是指具有独立存在意义且可以相互区别的事物、对象或概念。在计算机科学、人工智能、数据库、知识图谱等领域中,实体常常用来指代现实世界或抽象概念中的具体项目,比如一个人、一个地点、一个组织、一个事件或者是某个具体的数据对象。实体可以作为信息存储、处理和分析的基本单位。

进行实体罗列的时候需要包含维度和指标,否则无结果反馈。以下是罗列合同相关实体,包括合同名称、行业名称、商机类型、合同类型、合同金额首先我们需了解何为“实体”?实体是信息世界和现实世界中的基本单元,是构建数据模型、进行信息抽取、语义理解和知识表示的基础元素。实体在不同领域有着不同的含义,但通常来说,实体是指具有独立存在意义且可以相互区别的事物、对象或概念。在计算机科学、人工智能、数据库、知识图谱等领域中,实体常常用来指代现实世界或抽象概念中的具体项目,比如一个人、一个地点、一个组织、一个事件或者是某个具体的数据对象。实体可以作为信息存储、处理和分析的基本单位。

进行实体罗列的时候需要包含维度和指标,否则无结果反馈。以下是罗列合同相关实体,包括合同名称、行业名称、商机类型、合同类型、合同金额。

Image Modified


以下是错误示例,罗列的实体中仅包含维度不包含指标,此时是无结果返回的。

Image Modified

3.2 不同年份的相同月份进行对比

2023年1-9月与2024年1-9月销售额对比。

Image Added


将图形的X轴,统一用月份表示,同一个月份不同年份的柱子放到一起对比。

Image Added

3.3 指标再聚合

查询各省份的销售额;用柱图显示,显示数值;并加上中位数线,显示标线名字和数值查询各省份的销售额;用柱图显示,显示数值;并加上中位数线,显示标线名字和数值。

Image Modified

各省份的销售额、中位数、平均值、最大值、最小值、方差
// TODO

  • 各省份的销售额、中位数、平均值、最大值、最小值、方差。

3.4 时间智能

广东省2024年上半年各月份销售额 、同期值、同比、前期值、环比 、同期值、同比、前期值、环比。

Image Modified


用双Y图展示,柱图展示销售额 、同期值、前期值;线图展示同比、环比、同期值、前期值;线图展示同比、环比。

Image Modified

// TODO 补充联系上文提问的说明

在本示例中我们可以发现:两个问句是有连贯的,第一个问句的结果是第二个问句的基础,也就是说当我们在向AIChat提问题的时候可以直接基于同一个分析需求进行拓展延伸。

3.5 条件的逻辑组合

金融行业销售额大于100万并且制造业小于50万的城市制造业小于50万的城市。
Image Modified


金融行业销售额大于100万或者制造业小于50万的城市制造业小于50万的城市。
Image Modified

TOPN

...

3.6 TOP N

今年每个区域销售额最高的三个品牌。
Image Modified

3.7 生成计算度量

合同均价等于合同金额除以合同个数;各省份的合同均价,保留两位小数合同均价等于合同金额除以合同个数;各省份的合同均价,保留两位小数。

Image Modified


广州和深圳销售额之和大于50万的行业广州和深圳销售额之和大于50万的行业。

Image Modified


增加两列:广州销售额, 深圳销售额深圳销售额。
Image Modified

3.8 生成分组字段

将去年的销售额按行业分组,分组为:300万以上、200万到300万、100万到200万、100万以下,显示个分组销售额以及各分组包含的行业将去年的销售额按行业分组,分组为:300万以上、200万到300万、100万到200万、100万以下,显示个分组销售额以及各分组包含的行业。

Image Modified

3.9 对全部、所有的理解

广州分部在金融行业的销售额;显示所有销售名称,没有销售额的显示0
Image Modified


2022年上半年每月都有销售额的分部,线图显示2022年上半年每月都有销售额的分部,线图显示。

Image Modified


Y轴使用对数轴Y轴使用对数轴。

Image Modified

3.10 中英文实体模糊匹配

有哪些是采购自助分析的合同,合同金额多少有哪些是采购自助分析的合同,合同金额多少。
Image Modified
媒体类型中同时包含广播和电视的活动有哪些?按活动排序
Image Removed

连续增长

...

归因

看一下去年各月销售额同比情况,并作图
Image Removed
为什么2023年10月合同金额同比大幅下降
Image Removed
Image Removed

趋势预测

2023至今各月的合同金额
Image Removed
预测未来3个月合同金额趋势
Image Removed

3.11 连续增长

销售额连续5个月增长的行业有哪些?
Image Added


请列出他们分别是哪几个月出现了连续增长
Image Added

3.12 指定输出列

简单的行转列:

各商店2023年上半年各月销售额,输出列:品牌,每个月份都显示成1列

Image Added

3.13 归因分析

看一下2022年各月销售额同比情况,并作图。
Image Added


为什么2022年5月合同金额同比大幅下降
Image Added
Image Added


同时,若是想让AI直观的给出结论,我们可以使用【AI数据解释】,让AI全面分析问题后告诉我们造成这个结果的原因以及对此有什么建议。

Image Added

3.14 趋势预测

通常,我们在做趋势预测的时候需要有前置条件,即要先查询一个时间范围的结果,然后基于这个时间范围做预测分析,不过这里我们需要注意的是为了确保预测结果的相对准确,尽可能预测的时间不要超过3个月。

示例问句:2021年到2023年各月的销售额并预测未来3个月的销售额。
Image Added

更多新发现,期待您的探索~