From 2f799bb733f0af4e65051a1417630ef4e48c0cb5 Mon Sep 17 00:00:00 2001 From: nowadays0421 Date: Sun, 16 Jul 2023 14:14:17 +0800 Subject: [PATCH] =?UTF-8?q?finish=20readme=20=E4=BF=AE=E8=AE=A2?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 31 ++++++++++++++++--- content/LangChain Chat with Your Data/do.py | 29 ----------------- .../LangChain Chat with Your Data/readme.md | 15 ++++++++- 3 files changed, 40 insertions(+), 35 deletions(-) delete mode 100644 content/LangChain Chat with Your Data/do.py diff --git a/README.md b/README.md index 85a42ac..c7c657c 100644 --- a/README.md +++ b/README.md @@ -70,7 +70,11 @@ ## 项目意义 -LLM 正在逐步改变人们的生活,而对于开发者,如何基于 LLM 提供的 API 快速、便捷地开发一些具备更强能力、集成LLM 的应用,来便捷地实现一些更新颖、更实用的能力,是一个急需学习的重要能力。由吴恩达老师与 OpenAI 合作推出的大模型系列教程,包括 、等教程,其中,《ChatGPT Prompt Engineering for Developers》教程面向入门 LLM 的开发者,深入浅出地介绍了对于开发者,如何构造 Prompt 并基于 OpenAI 提供的 API 实现包括总结、推断、转换等多种常用功能,是入门 LLM 开发的经典教程;《Building Systems with the ChatGPT API》、《LangChain for LLM Application Development》教程面向想要基于 LLM 开发应用程序的开发者,简洁有效而又系统全面地介绍了如何基于 LangChain 与 ChatGPT API 开发具备实用功能的应用程序,适用于开发者学习以开启基于 LLM 实际搭建应用程序之路。因此,我们将该系列课程翻译为中文,并复现其范例代码,也为其中一个视频增加了中文字幕,支持国内中文学习者直接使用,以帮助中文学习者更好地学习 LLM 开发;我们也同时实现了效果大致相当的中文 Prompt,支持学习者感受中文语境下 LLM 的学习使用。未来,我们也将加入更多 Prompt 高级技巧,以丰富本课程内容,帮助开发者掌握更多、更巧妙的 Prompt 技能。 +LLM 正在逐步改变人们的生活,而对于开发者,如何基于 LLM 提供的 API 快速、便捷地开发一些具备更强能力、集成LLM 的应用,来便捷地实现一些更新颖、更实用的能力,是一个急需学习的重要能力。 + +由吴恩达老师与 OpenAI 合作推出的大模型系列教程,从大模型时代开发者的基础技能出发,深入浅出地介绍了如何基于大模型 API、LangChain 架构快速开发结合大模型强大能力的应用。其中,《Prompt Engineering for Developers》教程面向入门 LLM 的开发者,深入浅出地介绍了对于开发者,如何构造 Prompt 并基于 OpenAI 提供的 API 实现包括总结、推断、转换等多种常用功能,是入门 LLM 开发的经典教程;《Building Systems with the ChatGPT API》教程面向想要基于 LLM 开发应用程序的开发者,简洁有效而又系统全面地介绍了如何基于 ChatGPT API 打造完整的对话系统;《LangChain for LLM Application Development》教程结合经典大模型开源框架 LangChain,介绍了如何基于 LangChain 框架开发具备实用功能、能力全面的应用程序,《LangChain Chat With Your Data》教程则在此基础上进一步介绍了如何使用 LangChain 架构结合个人私有数据开发个性化大模型应用。 + +上述教程非常适用于开发者学习以开启基于 LLM 实际搭建应用程序之路。因此,我们将该系列课程翻译为中文,并复现其范例代码,也为其中一个视频增加了中文字幕,支持国内中文学习者直接使用,以帮助中文学习者更好地学习 LLM 开发;我们也同时实现了效果大致相当的中文 Prompt,支持学习者感受中文语境下 LLM 的学习使用,对比掌握多语言语境下的 Prompt 设计与 LLM 开发。未来,我们也将加入更多 Prompt 高级技巧,以丰富本课程内容,帮助开发者掌握更多、更巧妙的 Prompt 技能。 ## 项目受众 @@ -78,7 +82,7 @@ LLM 正在逐步改变人们的生活,而对于开发者,如何基于 LLM ## 项目亮点 -《ChatGPT Prompt Engineering for Developers》、《Building Systems with the ChatGPT API》、《LangChain for LLM Application Development》等教程作为由吴恩达老师与 OpenAI 联合推出的官方教程,在可预见的未来会成为 LLM 的重要入门教程,但是目前还只支持英文版且国内访问受限,打造中文版且国内流畅访问的教程具有重要意义;同时,GPT 对中文、英文具有不同的理解能力,本教程在多次对比、实验之后确定了效果大致相当的中文 Prompt,支持学习者研究如何提升 ChatGPT 在中文语境下的理解与生成能力。 +《ChatGPT Prompt Engineering for Developers》、《Building Systems with the ChatGPT API》、《LangChain for LLM Application Development》、《LangChain Chat with Your Data》等教程作为由吴恩达老师与 OpenAI 联合推出的官方教程,在可预见的未来会成为 LLM 的重要入门教程,但是目前还只支持英文版且国内访问受限,打造中文版且国内流畅访问的教程具有重要意义;同时,GPT 对中文、英文具有不同的理解能力,本教程在多次对比、实验之后确定了效果大致相当的中文 Prompt,支持学习者研究如何提升 ChatGPT 在中文语境下的理解与生成能力。 ## 内容大纲 @@ -132,8 +136,23 @@ LLM 正在逐步改变人们的生活,而对于开发者,如何基于 LLM 6. 评估 Evaluation @苟晓攀 7. 代理 Agent @Joye 8. 总结 Conclusion @Sarai + + ### 四、使用 LangChain 访问个人数据 + + 注:吴恩达《LangChain Chat with Your Data》课程中文版 + + **目录:** + +1. 简介 Introduction @Joye +2. 加载文档 Document Loading @Joye +3. 文档切割 Document Splitting @苟晓攀 +4. 向量数据库与词向量 Vectorstores and Embeddings @Puppet、仲泰 +5. 检索 Retrieval @Puppet +6. 问答 Question Answering @邹雨衡 +7. 聊天 Chat @高立业 +8. 总结 Summary @高立业 -### 四、Prompt 高级技巧(暂未完成) +### 五、Prompt 高级技巧(暂未完成) **目录:** @@ -161,11 +180,13 @@ LLM 正在逐步改变人们的生活,而对于开发者,如何基于 LLM - [仲泰](https://github.com/ztgg0228)(内容创作者-Datawhale成员) - [魂兮](https://github.com/wisdom-pan)(内容创作者-前端工程师) - [徐虎](https://github.com/xuhu0115)(内容创作者) -- [Joye](https://Joyenjoye.com)(内容创作者-数据科学家) +- [Joye](https://Joyenjoye.com)(内容创作者-教程订正成员-数据科学家) - [诸世纪](https://github.com/very-very-very)(内容创作者-算法工程师) - [宋志学](https://github.com/KMnO4-zx)(内容创作者-Datawhale成员) - Sarai(内容创作者-AI应用爱好者) -- 陈志宏(内容创作者) +- Puppet(内容创作者-教程订正成员) +- 高立业(内容创作者-教程订正成员) +- AaronZ(内容创作者-教程订正成员) **其他** diff --git a/content/LangChain Chat with Your Data/do.py b/content/LangChain Chat with Your Data/do.py deleted file mode 100644 index 1400185..0000000 --- a/content/LangChain Chat with Your Data/do.py +++ /dev/null @@ -1,29 +0,0 @@ -import os -import codecs -import json - -def add_toc(ipynb_file): - f = codecs.open(ipynb_file, 'r') - source = f.read() - y = json.loads(source) - toc = ["\n"] - for item in y["cells"]: - if item["cell_type"]=='markdown': - item_start = item['source'][0].strip("\n") - if item_start.startswith("#"): - l = len(item_start.split()[0]) - if l<=3 and l>1: - name = " ".join(item_start.split(" ")[1:]) - tag = "-".join(item_start.split(" ")[1:]) - tab = " "*(l-2) - toc.append(f' {tab}- [{name}](#{tag})\n') - - y["cells"][0]['source']= y["cells"][0]['source'][0:1] - y["cells"][0]['source'].extend(toc) - f = codecs.open(ipynb_file, 'w') - f.write(json.dumps(y)) - f.close() - -for file in os.listdir("."): - if file.endswith("ipynb") and file[0].isdigit(): - add_toc(file) \ No newline at end of file diff --git a/content/LangChain Chat with Your Data/readme.md b/content/LangChain Chat with Your Data/readme.md index 9952c0b..cc8ccc6 100644 --- a/content/LangChain Chat with Your Data/readme.md +++ b/content/LangChain Chat with Your Data/readme.md @@ -1 +1,14 @@ -吴恩达新课程《Langchain Chat with Your Data》 +# 吴恩达新课程《Langchain Chat with Your Data》 + +吴恩达《LangChain Chat With your Data》课程中文版,主要内容为在 LangChain 应用开发课程基础上,讲解如何使用 LangChain 来整合自己的私有数据,包括:加载并切割本地文档;向量数据库与词向量;检索回答;基于私有数据的问答与聊天等。 + + **目录:** + +1. 简介 Introduction @Joye +2. 加载文档 Document Loading @Joye +3. 文档切割 Document Splitting @苟晓攀 +4. 向量数据库与词向量 Vectorstores and Embeddings @Puppet、仲泰 +5. 检索 Retrieval @Puppet +6. 问答 Question Answering @邹雨衡 +7. 聊天 Chat @高立业 +8. 总结 Summary @高立业 \ No newline at end of file