【大语言模型|ChatGPT】搭建「英文案例翻译/分析机器人」实践
本章详细剥析如何搭建「自定义知识库的聊天机器人」。
机器人基本原理:
将现有资料喂给AI,让它用来回答问题或给出延伸建议等。

操作步骤:S1. 导入Github 数据(导入几份流行营销案例,且案例都是英文)git clone https://github.com/Airbangs/Operation-management-case-baseS2. 安装依赖库pip3 install gpt-index
pip3 install langchain
pip3 install transformers
缺啥补啥S3. 编写脚本
num_outputs :设置最大的输出 token 数,若想回答问题的字数越多就设置越大。
Temperature:控制模型生成结果的随机性。温度越低,结果越确定,但也会越平凡或无趣。若要出人意料的回答,则将该参数调高一些。若想基于事实,如数据提取、FAQ 场景等,调成 0最合适。#!/usr/bin/env python3
from gpt_index import SimpleDirectoryReader, GPTListIndex, readers, GPTSimpleVectorIndex, LLMPredictor, PromptHelper,ServiceContext
from langchain import OpenAI
import sys
import os
from IPython.display import Markdown, display
import PyPDF2
# 设置 OpenAI API Key
os.environ["OPENAI_API_KEY"] = "你的Open_Api_Key"
def main():
# set maximum input size
max_input_size = 4096
# set number of output tokens
num_outputs = 4000
# set maximum chunk overlap
max_chunk_overlap = 20
# set chunk size limit
chunk_size_limit = 600
# define LLM
llm_predictor = LLMPredictor(llm=OpenAI(temperature=0.5, model_name="text-davinci-003", max_tokens=num_outputs))
prompt_helper = PromptHelper(max_input_size, num_outputs, max_chunk_overlap, chunk_size_limit=chunk_size_limit)
documents = SimpleDirectoryReader('你的文件目录/files').load_data()
service_context = ServiceContext.from_defaults(llm_predictor=llm_predictor, prompt_helper=prompt_helper)
index = GPTSimpleVectorIndex.from_documents(
documents, service_context=service_context
)
index.save_to_disk('index.json')
index = GPTSimpleVectorIndex.load_from_disk('index.json')
while True:
query = input("小朋友你是不是有很多问号,提出来让我帮你吧:")
response = index.query(query, response_mode="compact")
print(f"Response: <b>{response.response}</b>")
if __name__ == '__main__':
main()S4. 用中文总结英文案例内容

S5. 提问

S6. 翻译

如何生成自己的OPENAI_API_KEY
登录地址 => https://platform.openai.com/account/api-keys
[Tips] 若使用付费的GPT4则更佳

代码执行报错
ModuleNotFoundError: No module named 'langchain.utilities'
报错可能原因:python版本低于3.8
解决:升级到3.8 (我使用的是3.9.4)
宇宙的氢元素能够摧毁大桥,还可以让巨轮断裂,何来这么大威力?
宇宙中的星体都是无比庞大的。但越是巨大的星体其生命周期也就越是短暂,在很短的时间内就会因为超新星的爆发,产生出一大批由氢元素组成的重元素。由超新星爆炸而形成的星云经过几百万年的时间,就会重新变成质量更小型的恒星。氢元素会发生核聚变我要新鲜事2023-07-17 20:53:310000美国3年无动静!中国航天战略消息,月球版北斗:未来航天员可用
说到北斗,大家应该不陌生了,很多人可能手机已经运用起来。例如:我们使用的导航,率先运用的就是中国的北斗系统。而在全球范围之中,主要有四大被公认的卫星导航系统,除了北斗之外,还有美国GPS、俄罗斯GLONASS、欧盟GALILEO。我要新鲜事2023-04-26 20:42:140000手机电池为什么会老化?背后机制揭晓
电池这个玩意早期其实只用在了一些商业用途上,比如移动网络信号、便捷式的照明以及战争活动。但今天电池已然成为了许多个人设备稳定的“伙伴”,手机、游戏机、汽车、笔记本都离不开电池。我要新鲜事2023-07-11 15:44:340001距离地球150万公里 韦伯望远镜拍摄的照片 让人类重新认识宇宙
韦伯望远镜是一台造价百亿美元的望远镜,距离地球最远可达到150万公里,最近时刻也能接近30万公里。然而,由于其巨大的成本和远离地球的位置,这台望远镜注定无法进行维修工作。1、SMACS-0723星系团我要新鲜事2023-10-08 20:06:240001美国登月火箭发射推迟 火箭发射台曾遭3次雷劈 被雷劈坏了吗?
美国登月火箭发射推迟,是因为出现了故障,并不是因为被雷劈坏了,之前美国公布了登月火箭的发射时间,可是火箭发射台遭到了3次雷劈,不得已一再推迟火箭发射计划,根本原因还是在于火箭自身没有达到发射的条件。火箭故障我要新鲜事2023-05-16 02:11:540000