【大语言模型|ChatGPT】搭建「英文案例翻译/分析机器人」实践
本章详细剥析如何搭建「自定义知识库的聊天机器人」。
机器人基本原理:
将现有资料喂给AI,让它用来回答问题或给出延伸建议等。
操作步骤:S1. 导入Github 数据(导入几份流行营销案例,且案例都是英文)git clone https://github.com/Airbangs/Operation-management-case-baseS2. 安装依赖库pip3 install gpt-index
pip3 install langchain
pip3 install transformers
缺啥补啥S3. 编写脚本
num_outputs :设置最大的输出 token 数,若想回答问题的字数越多就设置越大。
Temperature:控制模型生成结果的随机性。温度越低,结果越确定,但也会越平凡或无趣。若要出人意料的回答,则将该参数调高一些。若想基于事实,如数据提取、FAQ 场景等,调成 0最合适。#!/usr/bin/env python3
from gpt_index import SimpleDirectoryReader, GPTListIndex, readers, GPTSimpleVectorIndex, LLMPredictor, PromptHelper,ServiceContext
from langchain import OpenAI
import sys
import os
from IPython.display import Markdown, display
import PyPDF2
# 设置 OpenAI API Key
os.environ["OPENAI_API_KEY"] = "你的Open_Api_Key"
def main():
# set maximum input size
max_input_size = 4096
# set number of output tokens
num_outputs = 4000
# set maximum chunk overlap
max_chunk_overlap = 20
# set chunk size limit
chunk_size_limit = 600
# define LLM
llm_predictor = LLMPredictor(llm=OpenAI(temperature=0.5, model_name="text-davinci-003", max_tokens=num_outputs))
prompt_helper = PromptHelper(max_input_size, num_outputs, max_chunk_overlap, chunk_size_limit=chunk_size_limit)
documents = SimpleDirectoryReader('你的文件目录/files').load_data()
service_context = ServiceContext.from_defaults(llm_predictor=llm_predictor, prompt_helper=prompt_helper)
index = GPTSimpleVectorIndex.from_documents(
documents, service_context=service_context
)
index.save_to_disk('index.json')
index = GPTSimpleVectorIndex.load_from_disk('index.json')
while True:
query = input("小朋友你是不是有很多问号,提出来让我帮你吧:")
response = index.query(query, response_mode="compact")
print(f"Response: <b>{response.response}</b>")
if __name__ == '__main__':
main()S4. 用中文总结英文案例内容
S5. 提问
S6. 翻译
如何生成自己的OPENAI_API_KEY
登录地址 => https://platform.openai.com/account/api-keys
[Tips] 若使用付费的GPT4则更佳
代码执行报错
ModuleNotFoundError: No module named 'langchain.utilities'
报错可能原因:python版本低于3.8
解决:升级到3.8 (我使用的是3.9.4)
世界上禁止听的歌 世界三大禁曲为何被禁
导语:世界三大禁曲,分别是忏魂曲,第十三双眼睛,黑色星期五,其中忏魂曲是宗教赎罪曲,因为让很多信徒羞愧自杀所以被禁,而第十三双眼睛也一样导致了整个部落自杀所以被禁,黑色星期五则是由于和人脑产生了共振,导致听过人也都自杀了才被禁的,探秘志带大家看看世界上禁止听的歌。1、忏魂曲我要新鲜事2023-05-09 07:04:050005烧脑的科学悖论 电车难题是否永远无解(电车难题)
人性悖论可能永远也没有解决的办法。一个人的命还是五条命?这是人类历史上最著名的十大思想实验之一。电车问题一辆失控的电车正在轨道上加速行驶。不幸的是,有五个无辜的人被绑在铁轨上,而你旁边就有一个拉杆。此时,你所要做的就是拉动控制杆,你可以改变电车,拯救那五个人。电车悖论我要新鲜事2023-05-15 18:17:220002非洲地下发现数千公里质量异常,难道地球内部是空的?
在《哥斯拉大战金刚》以及同系列电影的背景故事里,这些巨兽们都来自于中空地球,《地心历险记》里,地球内部也存在一个拥有海洋以及史前动植物的中空区域,现实世界的地球中空理论最早由天文学家哈雷在1692年提出,但随着近代以来地质学的发展以及人造卫星的不断升空,科学界并没有找到所谓"地心世界入口",地球中空说也渐渐和地平说一样,成了少数人还在坚持的"行为艺术"。我要新鲜事2023-12-04 20:26:550001地球的五个准卫星,小行星3753/继月球后的第二颗卫星
说到地球的卫星,大家都会想到月球,可除了月球呢?你知道地球还有准卫星吗,就是那些能够稳定的与地球共享轨道,而不会发生碰撞的天体。以下是截至2010年,已知的地球的五个准卫星,跟着小编一起去看看吧!地球的五个准卫星1、小行星3753我要新鲜事2023-05-10 19:23:010000千万不要看第四类接触,揭露外星人绑架(让人噩梦不断)
在美国,有一部纪实片《第四类接触》非常恐怖,据说看的人都噩梦不断。正因为如此,许多网友都说千万不要看第四类接触,这可不是什么欲拒还迎,而是真的建议你不要看。大家是不是很好奇,接下来就随小编一起去了解看看。千万不要看第四类接触1、这是一部电影我要新鲜事2023-05-11 03:36:440000