背景
我们要想自定义一个prompt,习惯行写一个txt文档,里面放prompt_template
!<INPUT 0>!name
===split===
!<INPUT 0>!的兴趣爱好是什么?
构建prompt时,先定义变量input0="bob"
,导入template之后,替换掉对应变量
def create_prompt(input: [], template: str)
prompt = template
for i, v in enumnate(input):
prompt = prompt.replace(f"!<INPUT {v}>!", v)
return prompt
with open("prompt_template.txt", 'w') as f:
template = f.read()
input = []
input0="马斯克"
input.append(input0)
prompt = create_prompt(input, template)
这样一类prompt就对应着一个template(txt文件),以及一个构造函数,文件一多就很烦
使用LangChain构造prompt
先看代码,背景中的代码可以用LangChain的两行代码就能实现
from langchain.prompts import PromptTemplate
prompt_template = PromptTemplate.from_template("{name}的兴趣爱好是什么?")
print(prompt_template.format(name="马斯克"))
> 马斯克的兴趣爱好是什么?
Chat模板
我们用PromptTemplate
定义一个Chat模板,Chat模板是一个<role - contet>
List
from langchain_core.prompts import PromptTemplate
chat_template = PromptTemplate.from_template(
[
("system", "You are a helpful AI bot. Your name is {name}."),
("human", "Hello, how are you doing?"),
("ai", "I'm doing well, thanks!"),
("human", "{user_input}"),
]
)
messages = chat_template.format(name="Bob", user_input="What is your name?")
我们发现写<role - contet>
对的时候比较繁琐,role
是提前定义好了的,我们只要赋值content
就行
LangChain在PromptTemplate
之上提供了专门的ChatPromptTemplate
来构造Chat模板
from langchain.prompts import ChatMessagePromptTemplate
from langchain.prompts import HumanMessagePromptTemplate
from langchain_core.messages import SystemMessage
chat_template = ChatPromptTemplate.from_messages(
[
SystemMessage(
content=(
"You are a helpful assistant that re-writes the user's text to "
"sound more upbeat."
)
),
HumanMessagePromptTemplate.from_template("{text}"),
]
)
messages = chat_template.format_messages(text="I don't like eating tasty things")
print(messages)
[SystemMessage(content="You are a helpful assistant that re-writes the user's text to sound more upbeat."), HumanMessage(content="I don't like eating tasty things")]
与PromptTemplate
不同,ChatPromptTemplate
调用from_messages
方法来构造模板,其参数是一个Message List
,用format_messages
方法来创建prompt。
想要Few Shot怎么办
在需要prompt中加入Few Shot时, 我们一般直接在prompt模板中加入,比如
!<INPUT 0>!name
===split===
Question: 李明的兴趣爱好是什么?
李明是一位热情的户外探险者和环保主义者。他热爱徒步旅行和山地自行车运动,经常在周末组织或参加远足活动,探索自然的美丽。他还对摄影有着浓厚的兴趣,喜欢用镜头记录下旅途中的壮丽风景和野生动物。此外,李明还是一名志愿者,积极参与当地的环保项目,致力于提高公众对可持续发展和生态保护的意识。
Question: 王晓华的兴趣爱好是什么?
王晓华是一位热爱艺术和文化的自由职业者。她对绘画和陶艺特别感兴趣,经常在工作室里创作自己的艺术作品。王晓华也喜欢参加各种艺术展览和文化节,从中汲取灵感和学习新的艺术技巧。她还是一个书籍爱好者,尤其喜欢阅读历史和文学方面的书籍,她的书架上摆满了各种经典和现代作品。
Question: 张伟的兴趣爱好是什么?
张伟是一名科技爱好者和编程极客。他对最新的科技发展和创新保持高度关注,业余时间经常参与开源项目,贡献自己的编程技能。张伟对电子制作和机器人学也有浓厚的兴趣,他的家中摆满了各种电子元件和自制的机器人模型。此外,他还是一个电子竞技爱好者,经常与朋友们一起在线玩游戏,参加本地的电竞比赛。
Question: !<INPUT 0>!的兴趣爱好是什么?
LangChain中的FewShotChatMessagePromptTemplate
能实现从库中加载Few-shot示例
from langchain.prompts import (
ChatPromptTemplate,
FewShotChatMessagePromptTemplate,
)
examples = [
{"input": "王晓华的兴趣爱好是什么?", "output": "..."},
{"input": "张伟的兴趣爱好是什么?", "output": "..."},
{"input": "李明的兴趣爱好是什么?", "output": "..."},
]
# 为库中每个example格式化的模板
example_prompt = ChatPromptTemplate.from_messages(
[
("human", "{input}"),
("ai", "{output}"),
]
)
few_shot_prompt = FewShotChatMessagePromptTemplate(
example_prompt=example_prompt,
examples=examples,
)
print(few_shot_prompt.format())
Human:王晓华的兴趣爱好是什么?
AI: ...省略
Human:张伟的兴趣爱好是什么?
AI: ...省略
Human:李明的兴趣爱好是什么?
AI: ...省略
但这样的示例是写死的,不能换的
假设examples有:
Question: 赵雨的兴趣爱好是什么?
赵雨是一位文学爱好者和语言学习者。她对世界各地的文化和历史充满好奇,喜欢通过阅读各国的经典文学作品来了解不同的生活方式和思想。赵雨精通英语和法语,目前正在学习西班牙语,希望能够流利地使用多种语言进行交流。在业余时间,她还喜欢参加书法和茶艺课程,以此来陶冶情操和放松心情。
Question: 陈磊的兴趣爱好是什么?
陈磊是一位健身爱好者和营养师。他坚信健康的生活方式对于生活质量至关重要,因此他每天都会进行至少一小时的体育锻炼,包括力量训练、有氧运动和瑜伽。陈磊对营养学有着深入的研究,喜欢制定个性化的饮食计划,帮助他人达到健康和健身的目标。此外,他还是一位烹饪爱好者,擅长制作健康美味的低脂菜肴
Question: 林静的兴趣爱好是什么?
林静是一位音乐和旅行的狂热爱好者。她从小就学习钢琴和小提琴,现在是一名业余的音乐家,经常参加社区的音乐演出和慈善活动。林静热爱旅行,她的梦想是游遍世界上的每一个角落,体验不同国家的文化和风景。她喜欢在旅行中尝试当地的美食,与当地人交流,并通过摄影记录下旅途中的点点滴滴。
Question: 李明的兴趣爱好是什么?
李明是一位热情的户外探险者和环保主义者。他热爱徒步旅行和山地自行车运动,经常在周末组织或参加远足活动,探索自然的美丽。他还对摄影有着浓厚的兴趣,喜欢用镜头记录下旅途中的壮丽风景和野生动物。此外,李明还是一名志愿者,积极参与当地的环保项目,致力于提高公众对可持续发展和生态保护的意识。
Question: 王晓华的兴趣爱好是什么?
王晓华是一位热爱艺术和文化的自由职业者。她对绘画和陶艺特别感兴趣,经常在工作室里创作自己的艺术作品。王晓华也喜欢参加各种艺术展览和文化节,从中汲取灵感和学习新的艺术技巧。她还是一个书籍爱好者,尤其喜欢阅读历史和文学方面的书籍,她的书架上摆满了各种经典和现代作品。
Question: 张伟的兴趣爱好是什么?
张伟是一名科技爱好者和编程极客。他对最新的科技发展和创新保持高度关注,业余时间经常参与开源项目,贡献自己的编程技能。张伟对电子制作和机器人学也有浓厚的兴趣,他的家中摆满了各种电子元件和自制的机器人模型。此外,他还是一个电子竞技爱好者,经常与朋友们一起在线玩游戏,参加本地的电竞比赛。
我们准备为人设为文科学生的梁静设定兴趣爱好,最好的示例选择应该是
Question: 赵雨的兴趣爱好是什么?
赵雨是一位文学爱好者和语言学习者。她对世界各地的文化和历史充满好奇,喜欢通过阅读各国的经典文学作品来了解不同的生活方式和思想。赵雨精通英语和法语,目前正在学习西班牙语,希望能够流利地使用多种语言进行交流。在业余时间,她还喜欢参加书法和茶艺课程,以此来陶冶情操和放松心情。
Question: 王晓华的兴趣爱好是什么?
王晓华是一位热爱艺术和文化的自由职业者。她对绘画和陶艺特别感兴趣,经常在工作室里创作自己的艺术作品。王晓华也喜欢参加各种艺术展览和文化节,从中汲取灵感和学习新的艺术技巧。她还是一个书籍爱好者,尤其喜欢阅读历史和文学方面的书籍,她的书架上摆满了各种经典和现代作品。
Question: 林静的兴趣爱好是什么?
林静是一位音乐和旅行的狂热爱好者。她从小就学习钢琴和小提琴,现在是一名业余的音乐家,经常参加社区的音乐演出和慈善活动。林静热爱旅行,她的梦想是游遍世界上的每一个角落,体验不同国家的文化和风景。她喜欢在旅行中尝试当地的美食,与当地人交流,并通过摄影记录下旅途中的点点滴滴。
Question: 梁静的兴趣爱好是什么?
LangChain提供ExampleSelector
来根据某种策略从库中选择example
- 基于长度
- 基于语义相似度
- 基于ngram重叠度
- 基于maximal marginal relevance (MMR)
以基于长度的策略示例,使用LengthBasedExampleSelector
设置一个基于长度来动态选择example的选择器
from langchain.prompts.example_selector import LengthBasedExampleSelector
example_selector = LengthBasedExampleSelector(
# The examples it has available to choose from.
examples=examples,
# The PromptTemplate being used to format the examples.
example_prompt=example_prompt,
# The maximum length that the formatted examples should be.
# Length is measured by the get_text_length function below.
max_length=100,
# The function used to get the length of a string, which is used
# to determine which examples to include. It is commented out because
# it is provided as a default value if none is specified.
# get_text_length: Callable[[str], int] = lambda x: len(re.split("\n| ", x))
)
dynamic_prompt = FewShotPromptTemplate(
# We provide an ExampleSelector instead of examples.
example_selector=example_selector,
example_prompt=example_prompt,
prefix="Give the answer of every question",
suffix="Human: {name}的兴趣爱好是什么?\nAI:",
input_variables=["name"],
)
这样就会动态选择example,使得prompt的长度不超过100
print(dynamic_prompt.format(name="梁静"))
Human:王晓华的兴趣爱好是什么?
AI: ...省略
Human:张伟的兴趣爱好是什么?
AI: ...省略
Human:梁静的兴趣爱好是什么?
AI: