Spring AI 初学

Spring AI 官方地址

”spring 不生产 AI,只是 AI 工具的搬运工“

项目可以查看gitee

Open AI

前期准备

Open AI官方地址,需要使用魔法才能打开,同时购买很麻烦,建议淘宝进行购买,只需要购买 open ai 的 apikey 即可。

apikey 形如 sk-xxxxxxxxxxxxxxxxx

项目创建

Idea 创建 SpringBoot Maven 项目(基于1.0-SNAPSHOT版本,SpringBoot 3.2.6),依赖选择Spring Web、 OpenAI。其他可以自行选择

修改项目仓库地址,中央仓库暂时还没 Spring AI 相关 jar 包。仓库地址改成快照仓库地址,官方说明

    <repository>
<id>spring-snapshots</id>
<name>Spring Snapshots</name>
<url>https://repo.spring.io/snapshot</url>
<releases>
<enabled>false</enabled>
</releases>
</repository>

项目中找到 pom.xml 文件,将 <spring-ai.version>0.8.1</spring-ai.version> 改为 <spring-ai.version>1.0.0-SNAPSHOT</spring-ai.version>

yaml 配置文件中添加,openai 更多配置可以查看 org.springframework.ai.autoconfigure.openai.OpenAiAutoConfiguration。

spring:
ai:
openai:
# 购买的 api-key
api-key: sk-xxxx
# 如果是官方地址,则可以不填,默认为 https://api.openai.com
base-url:

聊天

基础使用

主要类 org.springframework.ai.openai.OpenAiChatModel,快照版本不同,可能名字不一样,可以查看 org.springframework.ai.autoconfigure.openai.OpenAiAutoConfiguration 中的聊天类是哪个。

import jakarta.annotation.Resource;
import org.junit.jupiter.api.Test;
import org.springframework.ai.openai.OpenAiChatModel;
import org.springframework.boot.test.context.SpringBootTest; @SpringBootTest
public class ChatTest { @Resource
private OpenAiChatModel chatModel; @Test
public void chat1(){
String msg = "你是谁?";
//返回string数据
String res = chatModel.call(msg);
System.out.println(res);
} @Test
public void chat2(){
String msg = "你是谁?";
//返回对象
ChatResponse res = chatModel.call(new Prompt(msg));
System.out.println(res);
//获取对话返回结果
System.out.println(res.getResult().getOutput().getContent());
} }

配置属性

    @Test
public void test3(){
String msg = "你是谁";
//采用 gpt-4-turbo 模型
ChatResponse res = chatModel.call(new Prompt(msg, OpenAiChatOptions.builder()
.withModel("gpt-4-turbo")
.build()));
System.out.println(res);
//获取对话返回结果
System.out.println(res.getResult().getOutput().getContent());
}

聊天模型配置属性可以查看 org.springframework.ai.autoconfigure.openai.OpenAiChatProperties,也可以在官网查看更详细的信息。配置属性也可以放在 yml 配置文件中,如 OpenAiChatProperties 的注解,需要以 spring.ai.openai.chat 开头,例如将 gpt-4-turbo 配置在配置文件中,就是 OpenAiChatProperties 中 options 中的属性。

spring:
ai:
openai:
chat:
options:
model: gpt-4-turbo

多模型

可以配合图片等让聊天模型进行回答。

    //给图片来进行聊天
@Test
public void test4() {
//获取图片资源
ClassPathResource resource = new ClassPathResource("2024052701.png");
UserMessage userMessage = new UserMessage("说说你看到了什么",
List.of(new Media(MimeTypeUtils.IMAGE_PNG, resource)));
ChatResponse res = chatModel.call(new Prompt(userMessage, OpenAiChatOptions.builder()
.withModel("gpt-4-turbo")
.build()));
System.out.println(res);
//获取回答
System.out.println(res.getResult().getOutput().getContent());
}

图像

基础使用

主要类 org.springframework.ai.openai.OpenAiImageModel,快照版本不同,可能类不一样。可以查看 org.springframework.ai.autoconfigure.openai.OpenAiAutoConfiguration 中具体的图像类是哪个。

import jakarta.annotation.Resource;
import org.junit.jupiter.api.Test;
import org.springframework.ai.image.ImagePrompt;
import org.springframework.ai.image.ImageResponse;
import org.springframework.ai.openai.OpenAiImageModel;
import org.springframework.boot.test.context.SpringBootTest; @SpringBootTest
public class ImageTest { @Resource
private OpenAiImageModel imageModel; @Test
public void test(){
//调用 image 模型的 call 方法获取图片
ImageResponse res = imageModel.call(new ImagePrompt("山水画"));
//AI 绘制的图片路径
String url = res.getResult().getOutput().getUrl();
System.out.println(url);
} }

配置属性

    @Test
public void test2(){
//使用 dall-e-2 绘画
OpenAiImageOptions options = OpenAiImageOptions.builder()
.withModel(OpenAiImageApi.ImageModel.DALL_E_2.getValue())
.build();
ImageResponse res = imageModel.call(new ImagePrompt("山水画", options));
//获取 AI 绘画路径
String url = res.getResult().getOutput().getUrl();
System.out.println(url);
}

图像模型属性配置可以查看 org.springframework.ai.autoconfigure.openai.OpenAiImageProperties,也可以查看官网获取更详细的信息。当然配置属性也可以在 yml 中定义,如 OpenAiImageProperties 上的注解,需要以 spring.ai.openai.image 开头,例如使用 dall-e-2 模型进行绘画

 spring:
ai:
openai:
image:
options:
model: dall-e-2

语音

语音转文字

基础使用

主要类 org.springframework.ai.openai.OpenAiAudioTranscriptionModel,快照版本不同,可能名字不一样,可以查看 org.springframework.ai.autoconfigure.openai.OpenAiAutoConfiguration 中的语音转文字翻译类是哪个。

import jakarta.annotation.Resource;
import org.junit.jupiter.api.Test;
import org.springframework.ai.openai.OpenAiAudioTranscriptionModel;
import org.springframework.boot.test.context.SpringBootTest;
import org.springframework.core.io.ClassPathResource; @SpringBootTest
public class AudioTest { //语音转文字
@Resource
private OpenAiAudioTranscriptionModel transcriptionModel; @Test
public void testTranscription1(){
String res = transcriptionModel.call(new ClassPathResource("2024052702.mp3"));
System.out.println(res);
} }
配置属性
    @Test
public void testTranscription2(){
//创建模型属性,采用 whisper-1 语音模型
OpenAiAudioTranscriptionOptions options = new OpenAiAudioTranscriptionOptions().builder()
.withModel(OpenAiAudioApi.WhisperModel.WHISPER_1.getValue())
.build();
AudioTranscriptionResponse res = transcriptionModel.call(
new AudioTranscriptionPrompt(new ClassPathResource("2024052702.mp3"), options));
//获取翻译内容
String output = res.getResult().getOutput();
System.out.println(output);
}

语音转文字模型属性可以查看 org.springframework.ai.autoconfigure.openai.OpenAiAudioTranscriptionProperties,也可以在官网查看更详细信息。当然可以在 yml 配置中配置属性,如 OpenAiAudioTranscriptionProperties 上的注解,以 spring.ai.openai.audio.transcription 开头,例如采用 whisper-1 模型

spring:
ai:
openai:
audio:
transcription:
options:
model: whisper-1

文字转语音

基础使用

主要类 org.springframework.ai.openai.OpenAiAudioSpeechModel,快照版本不同,可能名字不一样,可以查看 org.springframework.ai.autoconfigure.openai.OpenAiAutoConfiguration 中的文字转语音类是哪个。

import jakarta.annotation.Resource;
import org.junit.jupiter.api.Test;
import org.springframework.ai.openai.OpenAiAudioSpeechModel;
import org.springframework.boot.test.context.SpringBootTest;
import java.io.FileOutputStream;
import java.io.IOException; @SpringBootTest
public class AudioTest2 { @Resource
private OpenAiAudioSpeechModel speechModel; //byte数组转文件
private void byteArrayToFile(byte[] byteArray, String filePath) throws IOException {
FileOutputStream fos = new FileOutputStream(filePath);
fos.write(byteArray);
fos.close();
} @Test
public void testSpeech() throws IOException {
byte[] res = speechModel.call("我爱北京");
byteArrayToFile(res,"D:\\project\\AI\\openai\\speech\\1.mp3");
} }
属性配置
    @Test
public void testSpeech2() throws IOException {
//采用 tts-1-hd 模型
OpenAiAudioSpeechOptions options = new OpenAiAudioSpeechOptions().builder()
.withModel(OpenAiAudioApi.TtsModel.TTS_1_HD.getValue())
.build();
SpeechPrompt prompt = new SpeechPrompt("我爱北京", options);
SpeechResponse res = speechModel.call(prompt);
byte[] bytes = res.getResult().getOutput();
byteArrayToFile(bytes,"D:\\project\\AI\\openai\\speech\\1-hd.mp3");
}

文字转语音模型属性可以查看 org.springframework.ai.autoconfigure.openai.OpenAiAudioSpeechProperties,也可以在官网查看更详细信息。当然可以在 yml 配置中配置属性,如 OpenAiAudioSpeechProperties 上的注解,以 spring.ai.openai.audio.speech 开头,例如采用 tts-1-hd 模型

spring:
ai:
openai:
audio:
speech:
options:
model: tts-1-hd

Ollama

随机推荐

  1. HarmonyOS开发案例分享:万能卡片也能用来玩游戏

    一.前言 作为一名开发爱好者,从大了讲,我学习并进行HarmonyOS相关开发是为了能为鸿蒙生态建设尽一份绵薄之力,从小了讲,就是为了自己的兴趣.而万能卡片是一个让我非常感兴趣的东西. 很多时候我跟别 ...

  2. 安装CentOS-6.3-i386-minimal

    服务器开发者都离不开linux,这里一步步讲下linux安装和开发环境部署 一.下载安装镜像文件 这里以安装CentOS-6.3-i386-minimal为例,这个自带安装软件最少,简单而小巧,偏于你 ...

  3. 自己diy一个smi(可以监控gpu,cpu,memory)

    diy-smi 1.0(DIY System management interface) 在我们训练自己深度学习模型时,我们想看GPU信息,也想看CPU和内存信息.我常用的是nvidia-smi和ht ...

  4. CPVT:美团提出动态位置编码,让ViT的输入更灵活 | ICLR 2023

    论文提出了一种新的ViT位置编码CPE,基于每个token的局部邻域信息动态地生成对应位置编码.CPE由卷积实现,使得模型融合CNN和Transfomer的优点,不仅可以处理较长的输入序列,也可以在视 ...

  5. 探索Kimi智能助手:如何用超长文本解锁高效信息处理新境界

    目前,Kimi备受瞩目,不仅在社交平台上引起了广泛关注,而且在解决我们的实际问题方面也显示出了巨大潜力.其支持超长文本的特性使得我们能够更加灵活地配置信息,避免了频繁与向量数据库进行交互以及编写提示词 ...

  6. 力扣445(java&python)-两数相加Ⅱ(中等)

    题目: 给你两个 非空 链表来代表两个非负整数.数字最高位位于链表开始位置.它们的每个节点只存储一位数字.将这两数相加会返回一个新的链表. 你可以假设除了数字 0 之外,这两个数字都不会以零开头. 示 ...

  7. 力扣405(java)-数字转换为十六进制(简单)

    题目: 给定一个整数,编写一个算法将这个数转换为十六进制数.对于负整数,我们通常使用 补码运算 方法. 注意: 十六进制中所有字母(a-f)都必须是小写.十六进制字符串中不能包含多余的前导零.如果要转 ...

  8. 一站式云原生智能告警运维平台——SLS新版告警发布!

    简介: 本文介绍什么是云原生可观测性需求以及告警限制,介绍一站式云原生智能告警运维平台--SLS新版告警. 前言 本篇是SLS新版告警系列宣传与培训的第一篇,后续我们会推出20+系列直播与实战培训视频 ...

  9. ICBU可控文本生成技术详解

    ​简介: 文本生成(Text Generation)是自然语言处理(Natural Language Processing,NLP)领域的一项重要且具有挑战的任务.顾名思义,文本生成任务的目的是生成近 ...

  10. 居然之家:核心业务系统全面上云,采用PolarDB替代传统商业数据库

    ​简介: 国内家居零售龙头企业居然之家完成7大核心业务系统全面上云工作,并实现ERP等核心业务系统从传统商业数据库向阿里云PolarDB云数据库的替换,助力业务系统整体处理能力提升50%以上,弹性能力 ...