1.概要

我们使用AI大模型开发程序时,比如我需要查一下平台中有多少个客户。这个时候大模型肯定时不知道的,如果大模型不知道,他可能会回答不知道或者胡乱回答,这个时候就需要借助函数时调用来解决这些问题。

大模型胡乱回答实际是大模型幻觉的问题,解决幻觉问题有以下方案

  1. 模型微调

    这种情况一般公司不用做,因为需要自己训练,费用比较贵效果不一定好。
  2. 检索增强生成 (RAG)
  • 使用外部的知识库,作为大模型知识的来源
  • 使用向量的相似性查找相关文档
  • 相关的文档作为大模型的一部分
  1. 方法调用 (function calling)
  • 将问题和函数作为问题一起发给大模型
  • 大模型解析出函数的参数
  • 应用调用函数返回结果
  • 将结果和上下文的数据丢给大模型,由大模型返回结果

2.函数调用过程

  1. 应用构造用户的问题和我们定义的函数的信息提交给大模型。

    请求信息
{
"model": "qwen-plus",
"input": {
"messages": [
{
"role": "user",
"content": "广州有多少叫张三的人"
}
]
},
"parameters": {
"temperature": 0,
"result_format": "message",
"tools": [
{
"function": {
"name": "add",
"description": "add two numbers",
"parameters": {
"$schema": "https://json-schema.org/draft/2020-12/schema",
"type": "object",
"properties": {
"v1": {
"type": "integer",
"format": "int32"
},
"v2": {
"type": "integer",
"format": "int32"
}
}
}
},
"type": "function"
},
{
"function": {
"name": "loation",
"description": "某地区有多少叫什么名字的人",
"parameters": {
"$schema": "https://json-schema.org/draft/2020-12/schema",
"type": "object",
"properties": {
"address": {
"type": "string"
},
"name": {
"type": "string"
}
}
}
},
"type": "function"
}
]
}
}

我们将问题和配置的函数一起发给大模型,如果大模型判断当前的问题是否需要调用函数,它会返回是否需要函数调用,并同时计算出函数的参数。

  1. 大模型解析出是否需要调用函数,如果不需要则直接返回
{
"choices": [
{
"finish_reason": "tool_calls",
"message": {
"role": "assistant",
"tool_calls": [
{
"function": {
"name": "loation",
"arguments": "{\"address\": \"广州\", \"name\": \"张三\"}"
},
"id": "",
"type": "function"
}
],
"content": ""
}
}
]
}
  1. 如果需要 那么应用则调用函数。

    spring ai 框架会去调用函数,获取函数名和参数,调用我们定义的参数。
  2. 函数返回结果,并将返回结果组成提示词再次发给大模型
  3. 大模型获取数据后得到完整的输出。

3.主要代码如下

3.1 定义函数

public class LocationFunction implements Function<LocationRequest, LocationResponse> {

    private final Logger LOGGER = LoggerFactory.getLogger(getClass());

    @Override
public LocationResponse apply(LocationRequest locationRequest) {
LOGGER.info("调用某个地方有多少叫什么的人 {}", locationRequest);
int amount=10;
if(locationRequest.name().equals("张三")){
amount=5;
}
return new LocationResponse(amount);
}
}

请求参数定义

public record LocationRequest(String name, String address) {
}

返回数据定义

public record LocationResponse (int amount){
}

配置函数

@Bean
@Description("某地区有多少叫什么名字的人")
public Function<LocationRequest, LocationResponse> loation() {
return new LocationFunction();
}

定义 chatclient

@Bean
public ChatClient chatClient(
FunctionCallbackContext functionCallbackContext) {
return new DashscopeChatClient(new DashscopeApi(),
DashscopeChatOptions.builder()
//使用千问plus 数据
.withModel(DashscopeModelName.QWEN_PLUS)
.withTemperature(0.0f)
//定义函数
.withFunction("add")
//定义第二个函数
.withFunction("loation")
.build(),
functionCallbackContext);
}

这里我们可以定义多个函数,但是还是不要定义太多的函数,这样发送给大模型的包太大,会需要消耗更多的token ,会影响大模型收费。

spring ai 函数调用的更多相关文章

  1. 完全自制的五子棋人机对战游戏(VC++实现)

    五子棋工作文档 1说明: 这个程序在创建初期的时候是有一个写的比较乱的文档的,但是很可惜回学校的时候没有带回来……所以现在赶紧整理一下,不然再过一段时间就忘干净了. 最初这个程序是受老同学所托做的,一 ...

  2. Spring AOP详解

    一.前言 在以前的项目中,很少去关注spring aop的具体实现与理论,只是简单了解了一下什么是aop具体怎么用,看到了一篇博文写得还不错,就转载来学习一下,博文地址:http://www.cnbl ...

  3. Artificial intelligence(AI)

    ORM: https://github.com/sunkaixuan/SqlSugar 微软DEMO: https://github.com/Microsoft/BotBuilder 注册KEY:ht ...

  4. spring的AOP

    最近公司项目中需要添加一个日志记录功能,就是可以清楚的看到谁在什么时间做了什么事情,因为项目已经运行很长时间,这个最初没有开来进来,所以就用spring的面向切面编程来实现这个功能.在做的时候对spr ...

  5. JPA in Spring

    JPA(Java Persistence API):Sun官方提出的Java持久化规范,定义了对象-关系映射(ORM)以及实体对象持久化的标准接口.Sun引入JPA出于两个原因:一.简化现有Java ...

  6. Spring Bean

    一.Spring的几大模块:Data access & Integration.Transcation.Instrumentation.Core Spring Container.Testin ...

  7. 非Spring下的Quartz

    转自:Nick Huang.    http://www.cnblogs.com/nick-huang/ 阅读目录 > 参考的优秀资料 > 版本说明 > 简单的搭建 > 在We ...

  8. Spring AOP在函数接口调用性能分析及其日志处理方面的应用

    面向切面编程可以实现在不修改原来代码的情况下,增加我们所需的业务处理逻辑,比如:添加日志.本文AOP实例是基于Aspect Around注解实现的,我们需要在调用API函数的时候,统计函数调用的具体信 ...

  9. Struts2、Spring MVC4 框架下的ajax统一异常处理

    本文算是struts2 异常处理3板斧.spring mvc4:异常处理 后续篇章,普通页面出错后可以跳到统一的错误处理页面,但是ajax就不行了,ajax的本意就是不让当前页面发生跳转,仅局部刷新, ...

  10. 【五子棋AI循序渐进】——开局库

    首先,对前面几篇当中未修复的BUG致歉,在使用代码时请万分小心…………尤其是前面关于VCF\VCT的一些代码和思考,有一些错误.虽然现在基本都修正了,但是我的程序还没有经过非常大量的对局,在这之前,不 ...

随机推荐

  1. webpack笔记-webpack之模块module、路径解析、resolve 配置(三)

    module webpack 的初衷是让 js 支持模块化管理,并且将前端中的各种资源都纳入到对应的模块管理中来,所以在 webpack 的设计中,最重要的部分就是管理模块和模块之间的关系. 在 we ...

  2. Figma 学习笔记 – Auto Layout

    用途 Auto Layout 有点像 CSS 的 Flex, 它还带有 responsive 的概念.使用它以后可以替代掉不少 constraints 的写法. 用法 一个 parent 抱着多个 c ...

  3. 5G网络架构的演进趋势

    5G网络架构的演进趋势 概述 5G移动通信网络系统包括5GC(5G Core Network,5G核心网)和NG-RAN(Next Generation Radio Access Network,5G ...

  4. Web前端技术丛书代码下载

    我是清华社编辑,这些下载资源供读者个人学习使用,禁止商用. IE/Chrome下载,或者微信扫描二维码,按提示发邮箱下载. 二维码用微信扫码,可填写邮箱,把链接转发邮箱下载. <微信小程序开发从 ...

  5. c++中的读写锁

    读写锁是一种特殊的锁机制,允许多个线程同时读取共享数据,但在写入共享数据时,只有一个线程可以进行写操作,其他线程必须等待. 这种机制对于读多写少的场景非常有效,可以提高并发性能.以下是通过 share ...

  6. ZRAM的Swap功能和 SWAP分区有什么区别

    ZRAM(压缩内存块设备)和传统的SWAP分区都是Linux系统中用来增加可用内存的方法,但它们的工作原理和实现方式有很大的区别: ZRAM 压缩内存:ZRAM使用压缩算法将数据存储在内存中.这样,当 ...

  7. Linux 提高cache命中率方法

    提高缓存命中率是优化系统性能的关键策略之一.以下是一些提高缓存命中率的有效方法: 数据局部性优化: 空间局部性:优化数据访问模式,使得数据访问在空间上连续,比如通过循环展开和数据重排. 时间局部性:确 ...

  8. Lazy TLB Mode 的工作原理

    Lazy TLB (Translation Lookaside Buffer) mode 是操作系统和处理器在管理虚拟内存时的一种优化技术,旨在提高处理器的性能.要理解 Lazy TLB mode,需 ...

  9. Linux如何使用trim命令保持SSD的读写速度

    随着硬盘技术的不断发展何固态硬盘的大量使用,你肯定听说过或者使用过固态硬盘,固态硬盘(或固态硬盘)能够达到比传统硬盘更快的读取和写入数据的速度,您可能不知道的是,随着时间的推移,当磁盘写满时,SSD硬 ...

  10. CF102411 ICPC 2019-2020 North-Western Russia Regional Contest题解

    A Accurate Movement 签到 M Managing Difficulties 签到 B Bad Treap 已知\(y=\sin(x)\),要求给出数组\(a[n]\),满足\(\fo ...