Microsoft
LangChain 与 Microsoft Azure 以及其他 Microsoft 产品的全部集成。
聊天模型(Chat Models)
Microsoft 提供三种主要方式来通过 Azure 访问聊天模型:
Azure OpenAI
提供访问 OpenAI 的强大模型(如 o3、4.1 等),并通过 Microsoft Azure 的企业安全平台运行。Azure AI
可通过统一 API 访问来自不同提供商(如 Anthropic、DeepSeek、Cohere、Phi、Mistral)的多种模型。Azure ML
支持通过 Azure 机器学习部署和管理自定义模型或微调的开源模型。
Azure OpenAI
Microsoft Azure,简称
Azure,是由 Microsoft 运营的云计算平台,可通过全球数据中心提供应用和服务的访问、管理和开发。
它提供 SaaS(软件即服务)、PaaS(平台即服务)和 IaaS(基础设施即服务)等多种能力,并支持多种编程语言、工具和框架(包括 Microsoft 自家和第三方软件系统)。
Azure OpenAI 是一个集成 OpenAI 模型(包括
GPT-3、Codex和 Embeddings 模型系列)的 Azure 服务,可用于内容生成、摘要、语义搜索和自然语言代码转换。
pip install langchain-openai或:
uv add langchain-openai设置环境变量以访问 Azure OpenAI 服务:
import os
os.environ["AZURE_OPENAI_ENDPOINT"] = "https://<your-endpoint>.openai.azure.com/"
os.environ["AZURE_OPENAI_API_KEY"] = "your AzureOpenAI key"参见 使用示例:
from langchain_openai import AzureChatOpenAIAzure AI
Azure AI Foundry
提供来自 Azure OpenAI、DeepSeek R1、Cohere、Phi 和 Mistral 等提供商的多种模型,可通过AzureAIChatCompletionsModel类访问。
pip install -U langchain-azure-ai或:
uv add langchain-azure-ai配置你的 API Key 和 Endpoint:
export AZURE_AI_CREDENTIAL=your-api-key
export AZURE_AI_ENDPOINT=your-endpointfrom langchain_azure_ai.chat_models import AzureAIChatCompletionsModel
llm = AzureAIChatCompletionsModel(
model_name="gpt-4o",
api_version="2024-05-01-preview",
)参见 使用示例
Azure ML 聊天端点
可参见 文档,了解如何访问托管在 Azure Machine Learning 上的聊天模型。
大语言模型(LLMs)
Azure ML
参见 使用示例。
from langchain_community.llms.azureml_endpoint import AzureMLOnlineEndpointAzure OpenAI
参见 使用示例。
from langchain_openai import AzureOpenAI向量嵌入模型(Embedding Models)
Microsoft 提供两种主要方式通过 Azure 访问嵌入模型:
Azure OpenAI
参见 使用示例
from langchain_openai import AzureOpenAIEmbeddingsAzure AI
pip install -U langchain-azure-ai或:
uv add langchain-azure-ai配置环境变量:
export AZURE_AI_CREDENTIAL=your-api-key
export AZURE_AI_ENDPOINT=your-endpointfrom langchain_azure_ai.embeddings import AzureAIEmbeddingsModel
embed_model = AzureAIEmbeddingsModel(
model_name="text-embedding-ada-002"
)文档加载器(Document Loaders)
Azure AI Data
Azure AI Foundry(原 Azure AI Studio)
支持将数据资产上传到云存储,并注册以下来源的数据:
- Microsoft OneLake
- Azure Blob Storage
- Azure Data Lake gen 2
安装必要的 Python 包:
pip install azureml-fsspec azure-ai-generative或:
uv add azureml-fsspec azure-ai-generative参见 使用示例。
from langchain.document_loaders import AzureAIDataLoaderAzure AI Document Intelligence
Azure AI Document Intelligence(原名
Azure Form Recognizer)
是一项基于机器学习的服务,可从数字或扫描的 PDF、图片、Office 文件和 HTML 文件中提取文本(包括手写体)、表格、文档结构以及键值对等内容。Document Intelligence 支持以下格式:
JPEG/JPG、PNG、BMP、TIFF、HEIF、DOCX、XLSX、PPTX和HTML。
首先,你需要安装对应的 Python 包。
pip install azure-ai-documentintelligence或:
uv add azure-ai-documentintelligence查看 使用示例。
from langchain.document_loaders import AzureAIDocumentIntelligenceLoaderAzure Blob Storage
Azure Blob Storage
是 Microsoft 提供的云端对象存储解决方案。
Blob Storage 专为存储海量的非结构化数据而优化,所谓非结构化数据,是指不符合特定数据模型或定义的数据,如文本或二进制数据。
Azure Blob Storage 的典型用途包括:
- 直接向浏览器提供图片或文档。
- 存储供分布式访问的文件。
- 流式传输音频和视频。
- 写入日志文件。
- 存储用于备份、恢复、灾难恢复和归档的数据。
- 存储供本地或 Azure 托管服务进行分析的数据。
pip install langchain-azure-storage或:
uv add langchain-azure-storage查看 Azure Blob Storage Loader 使用示例。
from langchain_azure_storage.document_loaders import AzureBlobStorageLoaderMicrosoft OneDrive
Microsoft OneDrive(原名
SkyDrive)
是由 Microsoft 运营的文件托管服务。
首先,你需要安装对应的 Python 包。
pip install o365或:
uv add o365查看 使用示例。
from langchain_community.document_loaders import OneDriveLoaderMicrosoft OneDrive File
Microsoft OneDrive(原名
SkyDrive)
是由 Microsoft 运营的文件托管服务。
首先,你需要安装对应的 Python 包。
pip install o365或:
uv add o365from langchain_community.document_loaders import OneDriveFileLoaderMicrosoft Word
Microsoft Word
是由 Microsoft 开发的文字处理软件。
查看 使用示例。
from langchain_community.document_loaders import UnstructuredWordDocumentLoaderMicrosoft Excel
Microsoft Excel
是一款由 Microsoft 为 Windows、macOS、Android、iOS 和 iPadOS 开发的电子表格软件。
它具备计算、绘图工具、数据透视表,以及基于 VBA(Visual Basic for Applications)的宏编程功能。
Excel 是 Microsoft 365 办公套件的一部分。
UnstructuredExcelLoader 用于加载 Microsoft Excel 文件,支持 .xlsx 和 .xls 格式。
页面内容会是 Excel 文件的原始文本。
如果使用 "elements" 模式,文档元数据中 text_as_html 键下会包含 Excel 文件的 HTML 表示形式。
查看 使用示例。
from langchain_community.document_loaders import UnstructuredExcelLoaderMicrosoft SharePoint
Microsoft SharePoint
是一个基于网站的协作系统,使用工作流应用、“列表”数据库以及其他网页组件和安全特性,帮助企业团队高效协作。
该平台由 Microsoft 开发。
查看 使用示例。
from langchain_community.document_loaders.sharepoint import SharePointLoaderMicrosoft PowerPoint
Microsoft PowerPoint 是由 Microsoft 开发的演示文稿程序。
查看 使用示例。
from langchain_community.document_loaders import UnstructuredPowerPointLoaderMicrosoft OneNote
首先,安装依赖项:
pip install bs4 msal或:
uv add bs4 msal查看 使用示例。
from langchain_community.document_loaders.onenote import OneNoteLoaderPlaywright URL Loader
Playwright 是由
Microsoft开发的开源自动化工具,
可用于以编程方式控制和自动化网页浏览器。
它专为端到端测试、网页抓取以及跨浏览器自动化任务设计,支持Chromium、Firefox和WebKit等浏览器。
首先,安装依赖项:
pip install playwright unstructured或:
uv add playwright unstructured查看 使用示例。
from langchain_community.document_loaders.onenote import OneNoteLoader向量存储(Vector Stores)
Azure Cosmos DB
AI 代理可以将 Azure Cosmos DB 作为统一的记忆系统,
实现高速、可扩展且简单的存储体验。该服务成功支持了 OpenAI 的 ChatGPT 服务,
实现了高可靠性与低维护的动态扩展。
Azure Cosmos DB 基于原子记录序列引擎,是全球首个同时支持 NoSQL、关系型 和 向量数据库 的全球分布式数据库服务,并提供无服务器模式。
以下是两种可用于向量存储的 Azure Cosmos DB API。
Azure Cosmos DB for MongoDB (vCore)
Azure Cosmos DB for MongoDB vCore
使您能够轻松创建具有原生 MongoDB 支持的数据库。
您可以使用熟悉的 MongoDB 驱动、SDK 和工具,通过连接字符串直接访问该服务。
通过在 Azure Cosmos DB for MongoDB vCore 中使用向量搜索,
您可以无缝地将 AI 应用与 Cosmos DB 中的数据集成。
安装与设置
查看 详细配置说明。
安装 pymongo Python 包:
pip install pymongo或:
uv add pymongo在 Microsoft Azure 上部署 Azure Cosmos DB
Azure Cosmos DB for MongoDB vCore 提供完全托管的、与 MongoDB 兼容的数据库服务,
帮助开发者构建现代化应用。
它支持原生 Azure 集成、低 TCO(总体拥有成本)以及熟悉的 vCore 架构,
便于迁移或构建新应用。
免费注册 以立即开始使用。
查看 使用示例。
from langchain_community.vectorstores import AzureCosmosDBVectorSearchAzure Cosmos DB NoSQL
Azure Cosmos DB for NoSQL
现已支持向量索引与搜索(预览版)。
此功能可处理高维向量,实现任意规模下的高效向量搜索。
现在可以将向量与数据一起直接存储在文档中,
每个文档既可包含传统的无模式数据,也可包含高维向量。
这种数据与向量共存的方式使索引与搜索更高效,
同时简化了 AI 应用架构与数据管理。
安装与设置
查看 详细配置说明。
安装 azure-cosmos Python 包:
pip install azure-cosmos或:
uv add azure-cosmos在 Microsoft Azure 上部署 Azure Cosmos DB
Azure Cosmos DB 为现代应用与智能工作负载提供了高响应性和弹性扩展能力。
它可在所有 Azure 区域中使用,并可自动将数据复制到更接近用户的区域,
具备 SLA 级别的低延迟与高可用性。
免费注册 以开始使用。
查看 使用示例。
from langchain_community.vectorstores import AzureCosmosDBNoSQLVectorSearchAzure Database for PostgreSQL
Azure Database for PostgreSQL - Flexible Server
是基于开源 Postgres 数据库引擎的关系型数据库服务。
它是一种完全托管的数据库即服务(DBaaS),能够在高安全性、高可用性和可预测性能下运行关键业务负载。
查看 设置说明。
直接使用来自 Azure Portal 的 连接字符串。
Azure Database for PostgreSQL 基于开源 Postgres,
可通过 LangChain 的 Postgres 集成 进行连接。
Azure SQL Database
Azure SQL Database
是一个具有可扩展性、安全性和高可用性的数据库服务。
它支持专用的向量数据类型与内置函数,可直接在关系数据库中存储与查询向量嵌入,
无需单独的向量数据库,从而提升安全性并降低复杂度。
利用现有 SQL Server 数据库执行向量搜索,可提升数据能力、减少迁移成本并避免系统切换风险。
安装与设置
查看 详细配置说明。
安装 langchain-sqlserver Python 包:
!pip install langchain-sqlserver==0.1.1在 Microsoft Azure 上部署 Azure SQL DB
免费注册 以立即开始使用。
查看 使用示例。
from langchain_sqlserver import SQLServer_VectorStoreAzure AI Search
Azure AI Search
是一项云端搜索服务,
为开发者提供基础设施、API 和工具,用于在大规模下执行向量、关键词或混合查询。
查看 使用示例。
from langchain_community.vectorstores.azuresearch import AzureSearchAzure 认知服务(Azure Cognitive Services)
我们需要安装以下几个 Python 包:
pip install azure-ai-formrecognizer azure-cognitiveservices-speech azure-ai-vision-imageanalysis或使用:
uv add azure-ai-formrecognizer azure-cognitiveservices-speech azure-ai-vision-imageanalysis查看使用示例。
from langchain_community.agent_toolkits import AzureCognitiveServicesToolkitAzure AI 服务独立工具
azure_ai_services 工具包包含以下可以调用 Azure Cognitive Services 的工具:
AzureCogsFormRecognizerTool:表单识别 APIAzureCogsImageAnalysisTool:图像分析 APIAzureCogsSpeech2TextTool:语音转文字 APIAzureCogsText2SpeechTool:文字转语音 APIAzureCogsTextAnalyticsHealthTool:健康文本分析 API
from langchain_community.tools.azure_cognitive_services import (
AzureCogsFormRecognizerTool,
AzureCogsImageAnalysisTool,
AzureCogsSpeech2TextTool,
AzureCogsText2SpeechTool,
AzureCogsTextAnalyticsHealthTool,
)Microsoft Office 365 邮件与日历
我们需要安装 O365 Python 包:
pip install O365或使用:
uv add O365查看使用示例。
from langchain_community.agent_toolkits import O365ToolkitOffice 365 独立工具
你可以使用来自 Office 365 工具包的单独工具:
O365CreateDraftMessage:创建邮件草稿O365SearchEmails:搜索邮件O365SearchEvents:搜索日历事件O365SendEvent:发送日历事件O365SendMessage:发送电子邮件
from langchain_community.tools.office365 import O365CreateDraftMessage
from langchain_community.tools.office365 import O365SearchEmails
from langchain_community.tools.office365 import O365SearchEvents
from langchain_community.tools.office365 import O365SendEvent
from langchain_community.tools.office365 import O365SendMessageMicrosoft Azure PowerBI
我们需要安装 azure-identity Python 包:
pip install azure-identity或使用:
uv add azure-identity查看使用示例。
from langchain_community.agent_toolkits import PowerBIToolkit
from langchain_community.utilities.powerbi import PowerBIDatasetPowerBI 独立工具
你可以使用来自 Azure PowerBI 工具包的单独工具:
InfoPowerBITool:获取 PowerBI 数据集的元数据ListPowerBITool:获取表名QueryPowerBITool:查询 PowerBI 数据集
from langchain_community.tools.powerbi.tool import InfoPowerBITool
from langchain_community.tools.powerbi.tool import ListPowerBITool
from langchain_community.tools.powerbi.tool import QueryPowerBIToolPlayWright 浏览器工具包
Playwright 是由微软开发的开源自动化工具,
允许你通过代码控制和自动化网页浏览器。它被设计用于端到端测试、网页抓取和跨浏览器自动化任务,
支持 Chromium、Firefox 和 WebKit 等浏览器。
我们需要安装以下 Python 包:
pip install playwright lxml或使用:
uv add playwright lxml查看使用示例。
from langchain_community.agent_toolkits import PlayWrightBrowserToolkitPlayWright 浏览器独立工具
你可以使用来自 PlayWright 浏览器工具包的单独工具:
from langchain_community.tools.playwright import ClickTool
from langchain_community.tools.playwright import CurrentWebPageTool
from langchain_community.tools.playwright import ExtractHyperlinksTool
from langchain_community.tools.playwright import ExtractTextTool
from langchain_community.tools.playwright import GetElementsTool
from langchain_community.tools.playwright import NavigateTool
from langchain_community.tools.playwright import NavigateBackTool图数据库(Graphs)
Azure Cosmos DB for Apache Gremlin
我们需要安装一个 Python 包:
pip install gremlinpython或使用:
uv add gremlinpython查看使用示例。
from langchain_community.graphs import GremlinGraph
from langchain_community.graphs.graph_document import GraphDocument, Node, Relationship实用工具(Utilities)
Bing 搜索 API
Microsoft Bing,简称 Bing 或 Bing Search,
是微软拥有并运营的网页搜索引擎。
查看使用示例。
from langchain_community.utilities import BingSearchAPIWrapper其他(More)
Microsoft Presidio
Presidio(来源于拉丁语 praesidium,意为“保护”)
是一款用于确保敏感数据得到妥善管理和治理的工具。
它提供了快速的识别和匿名化模块,用于检测和隐藏文本或图像中的私密信息,
如信用卡号、姓名、地址、社会保障号、比特币钱包、电话号码、财务数据等。
首先,你需要安装以下 Python 包并下载 SpaCy 模型:
pip install langchain-experimental openai presidio-analyzer presidio-anonymizer spacy Faker
python -m spacy download en_core_web_lg或使用:
uv add langchain-experimental openai presidio-analyzer presidio-anonymizer spacy Faker
python -m spacy download en_core_web_lg查看使用示例。
from langchain_experimental.data_anonymizer import PresidioAnonymizer, PresidioReversibleAnonymizer