页面树结构
转至元数据结尾
转至元数据起始

概述

用户写出意图明确、语义清晰的问句,能够帮助Smartbi AIChat精准的理解问句,从而得到想要的数据。

数据分析查询常用词

在通常的分析场景中,我们会通过各种维度去查询数据,或者通过时间计算查询指标的同环比增长等情况,亦或是希望图表结合的方式呈现数据,下表是我们总结归纳的可满足大部分使用场景的查询常用词,接下来我们将一一为您例举示例。

类别

关键字

实体

指标名:销售额
维度名:年、月(份)、季(度)、品牌、媒体类型
成员名:美的、海尔、电视、广播、报纸

图形

表格、柱图、线图、饼图

聚合

总计、求和、金额、数量、计数、平均值、最多、最少、最大、最小、最高、最大值、最大(值)、最低、最小值、最小(值)、中位数、方差

连词

和、或、各、每个、与、对比、比较、和、但是、也不、加之、除了

日期

年、上半年、下半年、季、季度、Q1、月份

相对日期

今天、今年、本年、本月、当前、当前季度、当前月份、昨天、明天
上个月、上个季度、前N个月、近N个月、过去N天、N 天前、N 天后
早于、之后、晚于、从...到...、2024年1-7月、今后、以后、超过

时间智能

前期、同期、同期增长、环比、同比、年累、月累、年累同比、月累同比

等式(范围)

在…中、等于、=、晚于、超过、在…内、在…之间、N1-N2


|示例:2012 年以前的订单年份? 价格在 10 和 20 之间? John 的年龄大于 40 岁吗? 总销售额在 200 - 300?

等式(值)

是、为、等于、在…中、…的…、在…内、在…中、在…上


示例:哪些产品是绿色的? 订单日期为 2012 年。 John 的年龄是 40 岁? 总销售额不等于 200? 订购日期为 2016/1/1。 价格是 10? 颜色是绿色?

查询命令

排列、排列方式、方向、组、分组方式、按、显示、列出、显示、给我、命名、只、仅、排列、排名、比较、要、与、针对、按字母顺序、按升序、按降序、顺序

逻辑

大于、超过、小于、少于、等于、大于等于、小于等于、不超过
区间(100万-200万)
所有、全部、包含、每个、以...开头、以...结尾
并且、或者、同时、既....又...

前 N 个

前...名、后...名、最高、最低、第一、最后、下个、最早、最新、最旧、最新的、最近的、下一个

疑问词(关系、限定)

时间、哪里、哪个、谁、多少、多少次、多久一次、金额、数字、数量、多久、什么

问句示例

实体罗列

首先我们需了解何为“实体”?

实体是信息世界和现实世界中的基本单元,是构建数据模型、进行信息抽取、语义理解和知识表示的基础元素。

实体在不同领域有着不同的含义,但通常来说,实体是指具有独立存在意义且可以相互区别的事物、对象或概念。在计算机科学、人工智能、数据库、知识图谱等领域中,实体常常用来指代现实世界或抽象概念中的具体项目,比如一个人、一个地点、一个组织、一个事件或者是某个具体的数据对象。实体可以作为信息存储、处理和分析的基本单位。

进行实体罗列的时候需要包含维度和指标,否则无结果反馈。以下是罗列合同相关实体,包括合同名称、行业名称、商机类型、合同类型、合同金额

以下是错误示例,罗列的实体中仅包含维度不包含指标,此时是无结果返回的。

指标再聚合

查询各省份的销售额;用柱图显示,显示数值;并加上中位数线,显示标线名字和数值

各省份的销售额、中位数、平均值、最大值、最小值、方差

时间智能

广东省2024年上半年各月份销售额 、同期值、同比、前期值、环比 

用双Y图展示,柱图展示销售额 、同期值、前期值;线图展示同比、环比

在本示例中我们可以发现:两个问句是有连贯的,第一个问句的结果是第二个问句的基础,也就是说当我们在向AIChat提问题的时候可以直接基于同一个分析需求进行拓展延伸。

条件的逻辑组合

金融行业销售额大于100万并且制造业小于50万的城市

金融行业销售额大于100万或者制造业小于50万的城市

TOPN

今年每个区域销售额最高的三个品牌

生成计算度量

合同均价等于合同金额除以合同个数;各省份的合同均价,保留两位小数

广州和深圳销售额之和大于50万的行业


增加两列:广州销售额, 深圳销售额

生成分组字段

将去年的销售额按行业分组,分组为:300万以上、200万到300万、100万到200万、100万以下,显示个分组销售额以及各分组包含的行业

对全部、所有的理解

广州分部在金融行业的销售额;显示所有销售名称,没有销售额的显示0

2022年上半年每月都有销售额的分部,线图显示

Y轴使用对数轴

中英文实体模糊匹配

有哪些是采购自助分析的合同,合同金额多少


连续增长

销售额连续5个月增长的行业有哪些?

请列出他们分别是哪几个月出现了连续增长

归因

看一下2022年各月销售额同比情况,并作图

为什么2022年5月合同金额同比大幅下降

同时,若是想让AI直观的给出结论,我们可以使用【AI数据解释】,让AI全面分析问题后告诉我们造成这个结果的原因以及对此有什么建议。

趋势预测

通常,我们在做趋势预测的时候需要有前置条件,即要先查询一个时间范围的结果,然后基于这个时间范围做预测分析,不过这里我们需要注意的是为了确保预测结果的相对准确,尽可能预测的时间不要超过3个月。

示例问句:2021年到2023年各月的销售额并预测未来3个月的销售额。

更多新发现,期待您的探索~


  • 无标签