HuggingFacexLangChain:全新LangChain合作伙伴包

转载作者：撒哈拉更新时间：2024-05-29 21:05:17

62

4

我们很高兴官宣发布 langchain_huggingface ，这是一个由 Hugging Face 和 LangChain 共同维护的 LangChain 合作伙伴包。这个新的 Python 包旨在将 Hugging Face 最新功能引入 LangChain 并保持同步.

源自社区，服务社区

目前，LangChain 中所有与 Hugging Face 相关的类都是由社区贡献的。虽然我们以此为基础蓬勃发展，但随着时间的推移，其中一些类在设计时由于缺乏来自 Hugging Face 的内部视角而在后期被废弃.

通过 Langchain 合作伙伴包这个方式，我们的目标是缩短将 Hugging Face 生态系统中的新功能带给 LangChain 用户所需的时间.

langchain-huggingface 与 LangChain 无缝集成，为在 LangChain 生态系统中使用 Hugging Face 模型提供了一种可用且高效的方法。这种伙伴关系不仅仅涉及到技术贡献，还展示了双方对维护和不断改进这一集成的共同承诺.

起步

langchain-huggingface 的起步非常简单。以下是安装该软件包的方法

pip install langchain-huggingface

现在，包已经安装完毕，我们来看看里面有什么吧！。

LLM 文本生成

HuggingFacePipeline

transformers 中的 Pipeline 类是 Hugging Face 工具箱中最通用的工具。LangChain 的设计主要是面向 RAG 和 Agent 应用场景，因此，在 Langchain 中流水线被简化为下面几个以文本为中心的任务: 文本生成、文生文、摘要、翻译等.

用户可以使用 from_model_id 方法直接加载模型

from langchain_huggingface import HuggingFacePipeline

llm = HuggingFacePipeline.from_model_id(
    model_id="microsoft/Phi-3-mini-4k-instruct",
    task="text-generation",
    pipeline_kwargs={
        "max_new_tokens": 100,
        "top_k": 50,
        "temperature": 0.1,
    },
)
llm.invoke("Hugging Face is")

也可以自定义流水线，再传给 HuggingFacePipeline 类

from transformers import AutoModelForCausalLM, AutoTokenizer,pipeline

model_id = "microsoft/Phi-3-mini-4k-instruct"
tokenizer = AutoTokenizer.from_pretrained(model_id)

model = AutoModelForCausalLM.from_pretrained(
    model_id,
    load_in_4bit=True,
    #attn_implementation="flash_attention_2", # if you have an ampere GPU
)
pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, max_new_tokens=100, top_k=50, temperature=0.1)
llm = HuggingFacePipeline(pipeline=pipe)
llm.invoke("Hugging Face is")

使用 HuggingFacePipeline 时，模型是加载至本机并在本机运行的，因此你可能会受到本机可用资源的限制.

HuggingFaceEndpoint

该类也有两种方法。你可以使用 repo_id 参数指定模型。也可以使用 endpoint_url 指定服务终端，这些终端使用无服务器 API，这对于有 Hugging Face 专业帐户或企业 hub 的用户大有好处。普通用户也可以通过在代码环境中设置自己的 HF 令牌从而在免费请求数配额内使用终端.

from langchain_huggingface import HuggingFaceEndpoint

llm = HuggingFaceEndpoint(
    repo_id="meta-llama/Meta-Llama-3-8B-Instruct",
    task="text-generation",
    max_new_tokens=100,
    do_sample=False,
)
llm.invoke("Hugging Face is")

llm = HuggingFaceEndpoint(
    endpoint_url="<endpoint_url>",
    task="text-generation",
    max_new_tokens=1024,
    do_sample=False,
)
llm.invoke("Hugging Face is")

该类在底层实现时使用了 InferenceClient，因此能够为已部署的 TGI 实例提供面向各种用例的无服务器 API.

ChatHuggingFace

每个模型都有最适合自己的特殊词元。如果没有将这些词元添加到提示中，将大大降低模型的表现.

为了把用户的消息转成 LLM 所需的提示，大多数 LLM 分词器中都提供了一个名为 chat_template 的成员属性.

要了解不同模型的 chat_template 的详细信息，可访问我创建的 space！。

ChatHuggingFace 类对 LLM 进行了包装，其接受用户消息作为输入，然后用 tokenizer.apply_chat_template 方法构造出正确的提示.

from langchain_huggingface import ChatHuggingFace, HuggingFaceEndpoint

llm = HuggingFaceEndpoint(
    endpoint_url="<endpoint_url>",
    task="text-generation",
    max_new_tokens=1024,
    do_sample=False,
)
llm_engine_hf = ChatHuggingFace(llm=llm)
llm_engine_hf.invoke("Hugging Face is")

上述代码等效于

# with mistralai/Mistral-7B-Instruct-v0.2
llm.invoke("<s>[INST] Hugging Face is [/INST]")

# with meta-llama/Meta-Llama-3-8B-Instruct
llm.invoke("""<|begin_of_text|><|start_header_id|>user<|end_header_id|>Hugging Face is<|eot_id|><|start_header_id|>assistant<|end_header_id|>""")

嵌入

Hugging Face 里有很多非常强大的嵌入模型，你可直接把它们用于自己的流水线.

首先，选择你想要的模型。关于如何选择嵌入模型，一个很好的参考是 MTEB 排行榜.

HuggingFaceEmbeddings

该类使用 sentence-transformers 来计算嵌入。其计算是在本机进行的，因此需要使用你自己的本机资源.

from langchain_huggingface.embeddings import HuggingFaceEmbeddings

model_name = "mixedbread-ai/mxbai-embed-large-v1"
hf_embeddings = HuggingFaceEmbeddings(
    model_name=model_name,
)
texts = ["Hello, world!", "How are you?"]
hf_embeddings.embed_documents(texts)

HuggingFaceEndpointEmbeddings

HuggingFaceEndpointEmbeddings 与 HuggingFaceEndpoint 对 LLM 所做的非常相似，其在实现上也是使用 InferenceClient 来计算嵌入。它可以与 hub 上的模型以及 TEI 实例一起使用，TEI 实例无论是本地部署还是在线部署都可以.

from langchain_huggingface.embeddings import HuggingFaceEndpointEmbeddings

hf_embeddings = HuggingFaceEndpointEmbeddings(
    model= "mixedbread-ai/mxbai-embed-large-v1",
    task="feature-extraction",
    huggingfacehub_api_token="<HF_TOKEN>",
)
texts = ["Hello, world!", "How are you?"]
hf_embeddings.embed_documents(texts)

总结

我们致力于让 langchain-huggingface 变得越来越好。我们将积极监控反馈和问题，并努力尽快解决它们。我们还将不断添加新的特性和功能，以拓展该软件包使其支持更广泛的社区应用。我们强烈推荐你尝试 langchain-huggingface 软件包并提出宝贵意见，有了你的支持，这个软件包的未来道路才会越走越宽.

英文原文: https://hf.co/blog/langchain 。

原文作者: Joffrey Thomas，Kirill Kondratenko，Erick Friis 。

译者: Matrix Yao (姚伟峰)，英特尔深度学习工程师，工作方向为 transformer-family 模型在各模态数据上的应用及大规模模型的训练推理.

最后此篇关于HuggingFacexLangChain:全新LangChain合作伙伴包的文章就讲到这里了,如果你想了解更多关于HuggingFacexLangChain:全新LangChain合作伙伴包的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

62

4

0

文章推荐： LlamaFS自组织文件管理器

文章推荐： NumPy泊松分布模拟与Seaborn可视化技巧

文章推荐： golangerrgroup的超时检测

文章推荐：数据分析---pandas模块

python - “langchain”不是一个包
尝试运行 langchain 的基本教程脚本时遇到此错误: ModuleNotFoundError: No module named 'langchain.llms'; 'langchain' is
python - “langchain”不是一个包
尝试运行 langchain 的基本教程脚本时遇到此错误: ModuleNotFoundError: No module named 'langchain.llms'; 'langchain' is
langchain:Prompt在手,天下我有
目录简介好的prompt 什么是prompt template 在langchain中创建prompt temp
python - 如何为使用 Langchain 的代理按特定顺序选择正确的工具？
我想我不明白代理如何选择工具。我有一个矢量数据库(Chroma)，其中嵌入了我希望代理首先查看的所有内部知识。然后，如果答案不在 Chroma 数据库中，它应该使用 OpenAI 用于训练的信息(外部
openai-api - Langchain 使用人工工具抛出解析响应错误
我正在尝试使用 langchain 代理为软件工程师生成一个月的面试计划。期望代理应该询问用户几个问题并制定计划。 import os from langchain.memory import Con
python - 如何将 langchain 文档转换回字符串？
我用 langchain 库构建了一个分割器函数，可以分割一系列 python 文件。在代码中的另一点，我需要将这些文档转换回 python 代码。只是我不知道该怎么做 def index_repo(
python - 如何在文本分割器(langchain)之后将代码分配给文件？
我正在使用 Langchain 的 RecursiveCharacterTextSplitter 来分割 python 文件。这样做我会丢失哪个 block 属于哪个文件的信息。之后如何跟踪各个 bl
chatbot - 如何使用 langchain 创建多用户聊天机器人
希望你做得很好。我根据以下 langchain 文档准备了一个聊天机器人: Langchain chatbot documentation 在上面的langchain文档中，提示模板有两个输入变量——
python - 如何在 Langchain 中传输代理的响应？
我在Python中使用带有Gradio接口(interface)的Langchain。我制作了一个对话代理，并尝试将其响应传输到 Gradio 聊天机器人界面。我查看了 Langchain 文档，但找
python - 如何使用 Langchain 获得更详细的结果来源
我正在尝试使用 Langchain 和特定 URL 作为源数据来整理一个简单的“带有来源的问答”。该 URL 由一个页面组成，其中包含大量信息。问题是 RetrievalQAWithSourcesC
chatbot - 如何使用 langchain 创建多用户聊天机器人
希望你做得很好。我根据以下 langchain 文档准备了一个聊天机器人: Langchain chatbot documentation 在上面的langchain文档中，提示模板有两个输入变量——
python - 如何在 Langchain 中传输代理的响应？
我在Python中使用带有Gradio接口(interface)的Langchain。我制作了一个对话代理，并尝试将其响应传输到 Gradio 聊天机器人界面。我查看了 Langchain 文档，但找
python - 如何使用 Langchain 获得更详细的结果来源
我正在尝试使用 Langchain 和特定 URL 作为源数据来整理一个简单的“带有来源的问答”。该 URL 由一个页面组成，其中包含大量信息。问题是 RetrievalQAWithSourcesC
python - 如何为使用 Langchain 的代理按特定顺序选择正确的工具？
我想我不明白代理如何选择工具。我有一个矢量数据库(Chroma)，其中嵌入了我希望代理首先查看的所有内部知识。然后，如果答案不在 Chroma 数据库中，它应该使用 OpenAI 用于训练的信息(外部
openai-api - Langchain 使用人工工具抛出解析响应错误
我正在尝试使用 langchain 代理为软件工程师生成一个月的面试计划。期望代理应该询问用户几个问题并制定计划。 import os from langchain.memory import Con
python - 如何将 langchain 文档转换回字符串？
我用 langchain 库构建了一个分割器函数，可以分割一系列 python 文件。在代码中的另一点，我需要将这些文档转换回 python 代码。只是我不知道该怎么做 def index_repo(
python - 如何在文本分割器(langchain)之后将代码分配给文件？
我正在使用 Langchain 的 RecursiveCharacterTextSplitter 来分割 python 文件。这样做我会丢失哪个 block 属于哪个文件的信息。之后如何跟踪各个 bl
SvelteKit:显示来自 Langchain 的聊天流 token
我正在开发一个使用 SvelteKit 和 Langchain 的项目。我想实现一个功能，我可以按下按钮并让 UI 在聊天流进入时显示它们的标记。但是，我当前使用表单操作的实现遇到了一些困难。这是我
python - 尝试跟踪 Langchain 中的代币使用情况时出现 ValueError
我正在关注langchain官方文档here中的本教程我是否尝试在使用时跟踪 token 的数量。但是，我想使用 gpt-3.5-turbo 而不是 text-davinci-003，因此我将使用的
python - 使用Vicuna + langchain + llama_index 创建自托管LLM模型
我想创建一个自托管的 LLM 模型，该模型将能够拥有我自己的自定义数据的上下文(就此而言，Slack 对话)。我听说 Vicuna 是 ChatGPT 的一个很好的替代品，所以我编写了以下代码: f

首页

博学

6Ren·AI

商城