当前位置: 首页 > news >正文

wordpress可视化编辑短视频seo代理

wordpress可视化编辑,短视频seo代理,易企网站建设公司,什么网站可以做TCGA病理分期5. 查询构建 — Ragatouille 用户用自然语言提出问题并被路由到特定数据源(例如,向量存储、图形数据库等)后,该问题需要被转换为结构化查询,以便从选定的数据源检索信息(例如,文本到SQL、文本到…

5. 查询构建 — Ragatouille

用户用自然语言提出问题并被路由到特定数据源(例如,向量存储、图形数据库等)后,该问题需要被转换为结构化查询,以便从选定的数据源检索信息(例如,文本到SQL、文本到Cypher等)。在本节中,我们将看到如何使用Langchain将自然语言问题转换为结构化查询。

# 导入环境变量扩展
%load_ext dotenv
%dotenv secrets/secrets.env# 导入所需的库
from langchain_community.document_loaders import YoutubeLoader
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.runnables import RunnablePassthrough

在本节中,我们将看到如何使用自然语言问题构建一个查询,以便根据它们的元数据过滤记录。为此,我们考虑一个用例,即根据视频的元数据过滤YouTube播放列表。首先,我们来了解一下在YouTube视频中可以找到哪些元数据。

# 从YouTube URL加载文档
docs = YoutubeLoader.from_youtube_url("https://www.youtube.com/watch?v=sVcwVQRHIc8", add_video_info=True
).load()# 打印第一个文档的元数据
docs[0].metadata

输出示例:

{'source': 'sVcwVQRHIc8','title': 'Learn RAG From Scratch – Python AI Tutorial from a LangChain Engineer','description': 'Unknown','view_count': 147737,'thumbnail_url': 'https://i.ytimg.com/vi/sVcwVQRHIc8/hq720.jpg','publish_date': '2024-04-17 00:00:00','length': 9191,'author': 'freeCodeCamp.org'
}

现在,假设我们要基于titlecontentview_countpublish_datelength过滤播放列表。因此,一旦我们向LLM提出问题,它应该返回一个包含上述字段的对象,这些字段用于从播放列表/数据库中选择视频。为此,我们定义了一个Pydantic模型,类似于我们在“路由”部分构建的模型。

# 定义TutorialSearch Pydantic模型
import datetime
from typing import Optional
from langchain_core.pydantic_v1 import BaseModel, Fieldclass TutorialSearch(BaseModel):"""在关于LLMs和Langchain的视频数据库/播放列表中进行搜索。"""content_search: str = Field(..., description="应用于视频文字的相似性搜索查询。")title_search: str = Field(..., description="应用于视频标题的内容搜索查询的替代版本。")min_view_count: Optional[int] = Field(None, description="视图计数的最小值过滤器。")max_view_count: Optional[int] = Field(None, description="视图计数的最大值过滤器。")earliest_publish_date: Optional[datetime.date] = Field(None, description="最早的发布日期过滤器。")latest_publish_date: Optional[datetime.date] = Field(None, description="最晚的发布日期过滤器。")min_length_sec: Optional[int] = Field(None, description="视频的最小长度(秒)。")max_length_sec: Optional[int] = Field(None, description="视频的最大长度(秒)。")def pretty_print(self) -> None:# 打印非空字段for field in self.__fields__:if getattr(self, field) is not None and getattr(self, field) != getattr(self.__fields__[field], "default", None):print(f"{field}: {getattr(self, field)}")

接下来,我们构建一个链,该链接受用户问题和提示,将其提供给LLM,LLM根据定义的Pydantic模型提供答案,并返回答案。

# 定义元数据提示模板
meta_data_prompt = ChatPromptTemplate.from_messages([("system", "你是转换用户问题为数据库查询的专家。"),("user", "{question}")
])# 初始化GPT-4模型
llm = ChatOpenAI(model='gpt-4', temperature=0)
# 使用with_structured_output()方法初始化结构化输出
structured_llm = llm.with_structured_output(TutorialSearch)# 创建元数据链
meta_data_chain = ({'question': RunnablePassthrough()}| meta_data_prompt| structured_llm
)# 调用元数据链并打印结果
query = meta_data_chain.invoke("Build RAG using Langchain videos published before January 2024 with at least 1000 views.")
query.pretty_print()

输出示例:

content_search: Building RAG using Langchain
title_search: RAG Langchain
min_view_count: 1000
latest_publish_date: 2024-01-01

这可以用来过滤数据库的记录,如本文所示。我们将在最后一部分使用文本到Cypher查询构建,以从图形数据库获取信息。

总结

本文介绍了如何使用Langchain将用户用自然语言提出的问题转换为结构化查询,以便从特定数据源检索信息。通过定义Pydantic模型和构建链,我们可以将用户问题转化为数据库查询,从而优化检索最相关结果的过程。

http://www.jinmujx.cn/news/109046.html

相关文章:

  • 装饰设计的变形手法有哪些沈阳关键词优化报价
  • 盈润企业网站管理系统长春网站建设公司哪个好
  • 陕西省建设资格注册中心网站网站域名查询系统
  • Wordpress都有什么商城插件zac博客seo
  • 如何做网站源码营销策划的重要性
  • 成都医院手机网站建设东莞网站制作公司
  • sqlite做网站数据库大连百度关键词排名
  • 高校网站建设滞后推广普通话的意义简短
  • dw建设网站视频营销外包公司
  • js网站访问计数什么都不懂能去干运营吗
  • 建网站电话青岛网站优化公司哪家好
  • 头条站长平台昆明自动seo
  • 深圳龙华政府在线官网苏州seo按天扣费
  • 齐诺网站建设东莞网站建设做网站合肥关键词排名
  • 农业网站建设模板下载百度指数三个功能模块
  • 腾讯的网站是谁做的免费网站建设
  • 英德市住房城乡建设局网站手机访问另一部手机访问文件
  • 陕西省建设监理协会查询官方网站信阳seo推广
  • wordpress 添加证书东莞网站优化关键词排名
  • 上海网站建设与设计公司沈阳优化网站公司
  • 营销网络是指公司在国内外寻找战略伙伴和同盟者优化网站搜索排名
  • 网站建设报名系统是真的吗重庆百度推广排名优化
  • 触屏手机网站seo外链建设的方法
  • 新网站制作怎么样营销策划方案ppt范文
  • 学校网站 制作广告优化师怎么学
  • h5做的公司网站百度免费咨询
  • 网站怎么做导航栏江门关键词排名优化
  • 允许发外链的网站关键词网站排名查询
  • 微企点建站效果付费计算机培训机构排名前十
  • 零陵区住房和城乡建设局网站首页今日预测足球比分预测