Files
prompt-engineering-for-deve…/docs/content/前言.md
2023-07-23 00:24:50 +08:00

3.5 KiB
Raw Blame History

亲爱的读者朋友:

  您好!欢迎阅读这本《大模型入门:吴恩达 x OpenAI 系列课程中文实战教程》。

最近以GPT-4为代表的大规模预训练语言模型备受关注。这些模型拥有数十亿到千亿参数通过学习大规模文本语料库获得了十分强大的语言理解和生成能力。与此同时OpenAI等公司推出的API服务使得访问这些模型变得前所未有的便捷。

  那么如何运用这些强大的预训练模型开发实用的应用呢?本书汇聚了斯坦福大学的吴恩达老师与OpenAI合作打造的大语言模型LLM系列经典课程从模型原理到应用落地全方位介绍大模型的开发技能。

本书首先介绍Prompt工程的方法提示是连接用户与模型的桥梁优化提示对模型效果至关重要。通过案例读者可以学习文本总结、推理、转换等基础NLP任务的Prompt设计技巧。

  然后,本书指导读者基于 ChatGPT 提供的 API 开发一个完整的、全面的智能问答系统,包括使用大语言模型的基本规范,通过分类与监督评估输入,通过思维链推理及链式提示处理输入,检查并评估系统输出等,介绍了基于大模型开发的新范式,值得每一个有志于使用大模型开发应用程序的开发者学习。

通过对LLM或大型语言模型给出提示(prompt)现在可以比以往更快地开发AI应用程序但是一个应用程序可能需要进行多轮提示以及解析输出。在此过程有很多胶水代码需要编写基于此需求哈里森·蔡斯 (Harrison Chase) 创建了一个用于构建大模型应用程序的开源框架 LangChain ,使开发过程变得更加丝滑。

在Langchain部分读者将会学习如何结合框架 LangChain 使用 ChatGPT API 来搭建基于 LLM 的应用程序,帮助开发者学习使用 LangChain 的一些技巧,包括:模型、提示和解析器,应用程序所需要用到的存储,搭建模型链,基于文档的问答系统,评估与代理等。

当前主流的大规模预训练语言模型如ChatGPT训练知识截止到2021年9月主要依赖的是通用的训练数据集而未能有效利用用户自身的数据。这成为模型回答问题的一个重要局限。具体来说这类模型无法使用用户的私有数据比如个人信息、公司内部数据等来生成个性化的回复。它们也无法获得用户最新的实时数据而只能停留在预训练数据集的时间点。这导致模型对许多需要结合用户情况的问题无法给出满意答案。如果能赋予语言模型直接访问用户自有数据的能力并让模型能够实时吸收用户最新产生的数据则其回答质量将能大幅提升。

  最后,本书重点探讨了如何使用 LangChain 来整合自己的私有数据,包括:加载并切割本地文档;向量数据库与词向量;检索回答;基于私有数据的问答与聊天等。

可以说本书涵盖大模型应用开发的方方面面相信通过本书的学习即便您没有丰富编程经验也可以顺利入门大模型开发出有实用价值的AI产品。让我们共同推进这一具有革命性的新兴技术领域吧

  如果你在学习中遇到任何问题,也欢迎随时与我们交流。

  祝您的大模型之旅愉快而顺利!