页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。

...

  1. 行业术语(名词):当行业业务领域有特定的术语或缩写时,需要配置业务知识来帮助模型理解这些术语的含义。例如,在金融领域“ROI”代表“投资回报率”,在电力行业“公线公变”是指“公变客户”。”代表“投资回报率”。
  2. 业务逻辑:当业务逻辑复杂且不易通过简单的自然语言描述时,配置业务知识可以帮助模型更好地理解并生成正确的SQL。例如,专家模式-催收场景。
  3. 多义词:当自然语言问句中的词汇有多重含义时,配置业务知识可以帮助大模型选择正确的解释。例如,“电量”可以“售电量”,也可以指“计费电量”,还可以指代其他电量。当自然语言问句中的词汇有多重含义时,配置业务知识可以帮助大模型选择正确的解释。例如,股票“交易量”可以“交易数量”,也可以指“交易金额”。
  4. 业务规则:当业务有特定的规则或约束时,配置业务知识可以确保生成的SQL符合这些规则。例如,某些维度只能取特定的值,模型维度要剔除一些值。
  5. 专有词库:若问句无法命中知识,分析后是分词的原因,比如“电能表检定情况”分词为:电能表、检定、情况。如果想要“检定情况”作为key,必须把“检定情况”作为专有词库,否则就要调整key为“电能表检定”。

...

  1. 若问句无法命中知识,分析后是分词的原因,需要提供自定义专有词库。

知识分类参考:

序号

知识类型

分类描述

细分分类

细分描述

1

业务知识

代表业务术语、业务含义、业务同义词,业务转换等

专业术语与定义类

指定义业务术语含义等业务知识,用于统一专业知识,便于大模型理解匹配指标;

公线公变、三个档次指的是什么

2

业务基础指标类

指针对核心业务指标计算公式(如比率类、汇总类)提供的统计逻辑;

3

用户与设备统计类

指用户类别、设备类型、行业分类的划分要求及统计规则用于数据筛选和分组统计;

4

组织架构转换类

指明确组织层级映射规则(如一级=网级单位)、名称转换规则(如“市”转“供电局”)及层级过滤条件(如组织层级=三级)

5

定制知识

除却包含业务含义之外,需要按照制定逻辑执行业务需求。

数据清洗与填充类

指对数据质量条件的预处理:如空值填充(如空值转0)、数据去重(如剔除空用户编号)等;

6

4

关键词执行规则类

1.       7
  1. 指出现特定关键词后执行计算的步骤或需指定的返回的内容:(如""触发乘100);

2.       模糊匹配逻辑(如"电价代码名称"匹配)。

  1. 模糊匹配逻辑。

5

时间维度类

1.      
  1. 指定义时间范围(如“本月”指上个月)(如近半年推7个月)及时间相关时间字段(如实收时间)的过滤逻辑;
2.      
  1. 上周:当统计上周指标时,时间条件设置“年周”=上周
8

6

系统知识

代表系统默认配置的一些知识。

开发约束与规范类

指规定代码实现的边界条件(如禁止返回JSON_SQL)、表关联方式(仅LEFT JOIN)及字段严格匹配要求,以及其他系统需要默认配置的知识。


4.2 配置方法

  1. 知识名称:key,能否命中知识与key高度相关,可用分号分隔key,如:(抄表员;抄表人员;客户经理),避免出现“情况”、“明细”、特殊字符(_%?*等)。
  2. 知识内容:即知识涵盖的详细信息,知识也是提示词的来源,该部分内容如果问句命中知识,会纳入提示词,由大模型进行理解学习。一般采用句式:
    • XXX”是指“XXXX”:,
    • 当问句涉及或问到“XXX”,进行如下处理:xxx
    • 具体写法可参照1配置原则;
  3. 是否启用:分三个状态
    • 启用:常用状态,知识默认启用。
    • 禁用:弃用知识可选择禁用,或者删除。
    • 必选:设置必须,该知识优先级高于启用。
  4. 嵌入问句:
    • 是:嵌入问句是每个问句都会带上该知识,一般不用嵌入问句;
    • 否:正常业务知识不用嵌入问句;

...