LangChain4j系列：带你入门LangChain4j框架

本文所有示例均在 langchain4j 0.31.0 版本之上进行，langchain4j也是在快速发展的阶段。

LangChain4j 框架是什么？

LangChain4j 于 2023 年初在 ChatGPT 的炒作中开始开发。思想来源于 Python 和 JavaScript LLM 库，并加入创新思想，开发一款Java语言版本的 LLMs 库。

LangChain4j 的目标是简化Java 应用程序集成LLMs

所以 LangChain4j 就是一个通过抽象统一API、提供便捷可用的工具箱来简化 Java 应用程序集成LLMs的框架。

统一的API：LangChain4j 目前支持 15+ 热门LLM提供商和 15+ 嵌入商店。

目前市面上存在多种大模型、嵌入模型。模型使用的接口并不统一，当接入时需要对其API细节进行了解。所以LangChain4j统一API，封装内部细节，无缝从一个模型替换为另外一个模型而无需修改代码。
全面的工具箱：工具箱包括各种工具，从低级提示模板、聊天记忆管理和输出解析到高级模式，如 AI 服务和 RAG。

通过识别常见的抽象、模式和技术，LangChain4j 已将这些提炼成一个现成的工具包。
大量的示例：LangChain4j提供大量的使用示例，与 Quarkus 和 Spring Boot 的集成等。

LangChain4j 与 Spring AI 的宗旨基本一致，都是为简化 Java 应用快速接入 LLMs 而生，只是其各自侧重点、框架的能力有所不同而已。

LangChain4j 能干什么？

集成了 15+个语言大模型 15+ LLM providers
集成了 15+个向量数据库 15+ embedding (vector) stores
集成了 10+个嵌入模型 10+ embedding models
集成了 4个图片大模型 4 cloud and local image generation models
集成了 2个评分重排名模型 2 scoring (re-ranking) models
集成 1个 OpenAI 审核模型
支持文本和图像作为输入（多模态）
更高层次的抽象 AI Services
支持提示词模板、持久性和内存中聊天记忆算法的实现：消息窗口和令牌窗口 chat memory
支持同步/流式响应，支持常见 Java 类型和自定义 POJO 的输出解析器
支持工具（函数调用）Tools (function calling), 动态工具（执行动态生成LLM的代码）
支持检索增强生成技术 RAG (Retrieval-Augmented-Generation):
- 数据导入/索引:
  - 从多个来源（文件系统、URL、GitHub、Azure Blob 存储、Amazon S3 等）导入各种类型的文档（TT、PDF、DOC、PPT、XLS 等）。
  - 使用多种算法将文档拆分为更小的片段。
  - 对文档和片段进行后处理
  - 使用嵌入模型生成嵌入片段
  - 将嵌入保存到向量数据库
- （简单/高级）检索
  - 查询转换（扩展、压缩）「 expansion, compression 」
  - 查询路由「 Routing of queries 」
  - 从向量存储或任何自定义源中检索
  - 重排名「 Re-ranking 」
  - 倒数排名融合「 Reciprocal Rank Fusion 」
  - 自定义 RAG 流程中的每个步骤
支持文本分类
用于标记化和估计标记计数的工具

从LangChain4j这些特性来看，目前（2024/07/02）比 Spring AI 框架稍强。

LangChain4j 框架有什么？

组件

LangChain4j 包含如下组件

基础组件
- 大语言模型
- 提示词模板
- 格式化解析
- 上下文记忆
RAG
- 文档加载
- 文档切分
- 嵌入模型
- 向量存储向量数据库
Chains
Ai Services 高层次抽象模块

类库

LangChain4j采用模块化设计，包括：

langchain4j-core 模块，用于定义核心抽象。如ChatLanguageModel和EmbeddingStore及其 API。
langchain4j 模块，包含有用的工具，如 ChatMemory、OutputParser 以及高级功能，如 AiServices。
langchain4j-{integration} 模块，每个模块都提供与各种LLM提供商的集成，以及嵌入存储集成到LangChain4j中。也可以单独使用这些模块。
langchain4j-spring-{integration}-spring-boot-starter 模块，与Spring boot项目集成，开箱即用。「 目前支持的还不完善 」。langchain4j-spring，从模块的划分看，langchain4j略微混乱，应该像Spring AI 分别划分模块，如Models模块、Embeddings模块。

API抽象层级

在 API 抽象分为 Low Level 和 High Level 两种；

Low Level：在这个级别上，您可以最自由地访问所有低级组件，例如 ChatLanguageModel 、 UserMessage 、 AiMessage 、 EmbeddingStore 等 Embedding。我们称之为胶水代码，可以任何组合使用。
High Level：在此级别，您可以使用高级 API 进行交互LLMs，例如 AiServices ，它向您隐藏了所有复杂性和样板。

LangChain4j 入门示例

在集成 OpenAI 经测试出现问题，无法解析返回的json数据报错，已经提交了issue，所以暂时无法演示接入OpenAI了，那我们演示接入Ollama本地大模型qwen:7b。

引入依赖

pom
复制代码
<dependency>
    <groupId>dev.langchain4j</groupId>
    <artifactId>langchain4j-ollama-spring-boot-starter</artifactId>
    <version>${langchain4j.version}</version>
</dependency>

yml配置

yml
复制代码
langchain4j:
  ollama:
    chat-model:
      base-url: http://localhost:11434
      model-name: qwen:7b

代码实现

java
复制代码
package org.ivy.controller;

import dev.langchain4j.model.chat.ChatLanguageModel;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

@RequestMapping("/ll/")
@RestController
public class ChatController {

    private final ChatLanguageModel chatLanguageModel;

    public ChatController(ChatLanguageModel chatLanguageModel) {
        this.chatLanguageModel = chatLanguageModel;
    }

    @GetMapping("chat")
    public String chat(String prompt) {
        return chatLanguageModel.generate(prompt);
    }
}

在 langchain4j 0.31.0 版本，提供Spring boot集成的Starter仅支持OpenAI和Ollama两个。其它还是的使用传统的方式进行。

验证效果

代码示例

Github 示例代码：github.com/Fj-ivy/lang…

源代码以及官方文档说明；

Github 地址
官方文档

总结说明

对LangChain4j整体进行学习，总体感觉LangChain4j官方文档以及源码组织形式比Spring AI框架会混乱一些。一旦摸清门路，使用起来也是相当方便的。

LLM__189">如何系统的去学习大模型 LLM ？

作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

所有资料 ⚡️ ，朋友们如果有需要全套《LLM 大模型入门+进阶学习资源包》，扫码获取~

👉CSDN大礼包🎁：全网最全《LLM 大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）👈

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

在这里插入图片描述

四、AI大模型商业化落地方案

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
  - L1.4.1 知识大模型
  - L1.4.2 生产大模型
  - L1.4.3 模型工程方法论
  - L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
  - L2.1.1 OpenAI API接口
  - L2.1.2 Python接口接入
  - L2.1.3 BOT工具类框架
  - L2.1.4 代码示例
- L2.2 Prompt框架
  - L2.2.1 什么是Prompt
  - L2.2.2 Prompt框架应用现状
  - L2.2.3 基于GPTAS的Prompt框架
  - L2.2.4 Prompt框架与Thought
  - L2.2.5 Prompt框架与提示词
- L2.3 流水线工程
  - L2.3.1 流水线工程的概念
  - L2.3.2 流水线工程的优点
  - L2.3.3 流水线工程的应用
- L2.4 总结与展望

阶段3：AI大模型应用架构实践

目标：深入理解AI大模型的应用架构，并能够进行私有化部署。
内容：
- L3.1 Agent模型框架
  - L3.1.1 Agent模型框架的设计理念
  - L3.1.2 Agent模型框架的核心组件
  - L3.1.3 Agent模型框架的实现细节
- L3.2 MetaGPT
  - L3.2.1 MetaGPT的基本概念
  - L3.2.2 MetaGPT的工作原理
  - L3.2.3 MetaGPT的应用场景
- L3.3 ChatGLM
  - L3.3.1 ChatGLM的特点
  - L3.3.2 ChatGLM的开发环境
  - L3.3.3 ChatGLM的使用示例
- L3.4 LLAMA
  - L3.4.1 LLAMA的特点
  - L3.4.2 LLAMA的开发环境
  - L3.4.3 LLAMA的使用示例
- L3.5 其他大模型介绍

阶段4：AI大模型私有化部署

目标：掌握多种AI大模型的私有化部署，包括多模态和特定领域模型。
内容：
- L4.1 模型私有化部署概述
- L4.2 模型私有化部署的关键技术
- L4.3 模型私有化部署的实施步骤
- L4.4 模型私有化部署的应用场景

学习计划：

阶段1：1-2个月，建立AI大模型的基础知识体系。
阶段2：2-3个月，专注于API应用开发能力的提升。
阶段3：3-4个月，深入实践AI大模型的应用架构和私有化部署。
阶段4：4-5个月，专注于高级模型的应用和部署。

LLM_CSDNCSDN100_291">这份完整版的所有 ⚡️ 大模型 LLM 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

全套《LLM 大模型入门+进阶学习资源包》↓↓↓ 获取~

👉CSDN大礼包🎁：全网最全《LLM 大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）👈