页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。

1.概述

用户写出意图明确、语义清晰的问句,能够帮助 Smartbi AIChat 精准的理解问句,从而得到想要的数据结果。

2. 数据分析查询常用词

在通常的分析场景中,我们会通过各种维度去查询数据,或者通过时间计算查询指标的同环比增长等情况,亦或是希望图表结合的方式呈现数据,下表是我们总结归纳的可满足大部分使用场景的查询常用词,接下来我们将逐一举例说明。

类别

关键字

实体

指标名:销售额
维度名:年、月(份)、季(度)、品牌、媒体类型
成员名:美的、海尔、电视、广播、报纸

图形

表格、柱图、线图、饼图

聚合

总计、求和、金额、数量、计数、平均值、最多、最少、最大、最小、最高、最大值、最大(值)、最低、最小值、最小(值)、中位数、方差

连词

和、或、各、每个、与、对比、比较、和、但是、也不、加之、除了

日期

年、上半年、下半年、季、季度、Q1、月份

相对日期

今天、今年、本年、本月、当前、当前季度、当前月份、昨天、明天
上个月、上个季度、前N个月、近N个月、过去N天、N 天前、N 天后
早于、之后、晚于、从...到...、2024年1-7月、今后、以后、超过

时间智能

前期、同期、同期增长、环比、同比、年累、月累、年累同比、月累同比

等式(范围)

在…中、等于、=、晚于、超过、在…内、在…之间、N1-N2


|示例:2012 年以前的订单年份? 价格在 10 和 20 之间? John 的年龄大于 40 岁吗? 总销售额在 200 - 300?

等式(值)

是、为、等于、在…中、…的…、在…内、在…中、在…上


示例:哪些产品是绿色的? 订单日期为 2012 年。 John 的年龄是 40 岁? 总销售额不等于 200? 订购日期为 2016/1/1。 价格是 10? 颜色是绿色?

查询命令

排列、排列方式、方向、组、分组方式、按、显示、列出、显示、给我、命名、只、仅、排列、排名、比较、要、与、针对、按字母顺序、按升序、按降序、顺序

逻辑

大于、超过、小于、少于、等于、大于等于、小于等于、不超过
区间(100万-200万)
所有、全部、包含、每个、以...开头、以...结尾
并且、或者、同时、既....又...

前 N 个

前...名、后...名、最高、最低、第一、最后、下个、最早、最新、最旧、最新的、最近的、下一个

疑问词(关系、限定)

时间、哪里、哪个、谁、多少、多少次、多久一次、金额、数字、数量、多久、什么

3. 问句示例

3.1 实体罗列

首先我们需了解何为“实体”?实体是信息世界和现实世界中的基本单元,是构建数据模型、进行信息抽取、语义理解和知识表示的基础元素。实体在不同领域有着不同的含义,但通常来说,实体是指具有独立存在意义且可以相互区别的事物、对象或概念。在计算机科学、人工智能、数据库、知识图谱等领域中,实体常常用来指代现实世界或抽象概念中的具体项目,比如一个人、一个地点、一个组织、一个事件或者是某个具体的数据对象。实体可以作为信息存储、处理和分析的基本单位。首先我们需了解何为“实体”?实体是信息世界和现实世界中的基本单元,是构建数据模型、进行信息抽取、语义理解和知识表示的基础元素。实体在不同领域有着不同的含义,但通常来说,实体是指具有独立存在意义且可以相互区别的事物、对象或概念。在计算机科学、人工智能、数据库、知识图谱等领域中,实体常常用来指代现实世界或抽象概念中的具体项目,比如一个人、一个地点、一个组织、一个事件或者是某个具体的数据对象。实体可以作为信息存储、处理和分析的基本单位。

进行实体罗列的时候需要包含维度和指标,否则无结果反馈。以下是罗列合同相关实体,包括合同名称、行业名称、商机类型、合同类型、合同金额。


以下是错误示例,罗列的实体中仅包含维度不包含指标,此时是无结果返回的。

3.2 不同年份的相同月份进行对比

2023年1-9月与2024年1-9月销售额对比。


将图形的X轴,统一用月份表示,同一个月份不同年份的柱子放到一起对比。

...

销售额连续5个月增长的行业有哪些?


请列出他们分别是哪几个月出现了连续增长

3.12 指定输出列

简单的行转列:

各商店2023年上半年各月销售额,输出列:品牌,每个月份都显示成1列

Image Added

3.13 归因分析

看一下2022年各月销售额同比情况,并作图。


为什么2022年5月合同金额同比大幅下降

...

同时,若是想让AI直观的给出结论,我们可以使用【AI数据解释】,让AI全面分析问题后告诉我们造成这个结果的原因以及对此有什么建议。

3.

...

14 趋势预测

通常,我们在做趋势预测的时候需要有前置条件,即要先查询一个时间范围的结果,然后基于这个时间范围做预测分析,不过这里我们需要注意的是为了确保预测结果的相对准确,尽可能预测的时间不要超过3个月。

...