Add some results

2023-05-16 16:53:03 +08:00
parent 737cfa1c31
commit 479a9e26fe
7 changed files with 25 additions and 6 deletions
--- a/README.md
+++ b/README.md
@ -120,7 +120,7 @@ LawGPT 系列模型的训练过程分为两个阶段：
 ### 二次训练流程

 1. 参考 `data/example_instruction_train.json` 构造指令微调数据集
-2. 运行 `src/scripts/train.sh` 
+2. 运行 `src/scripts/train_lora.sh` 

 ### 指令精调步骤

@ -135,9 +135,21 @@ LawGPT 系列模型的训练过程分为两个阶段：

 ### 输出示例

-<details><summary>问题：欠了信用卡的钱还不上要坐牢吗？</summary>
+<details><summary>问题：请给出判决意见。</summary>

-![](assets/demo/example-01.jpeg)
+![](assets/demo/example-05.jpeg)
+
+</details>
+
+<details><summary>问题：请介绍赌博罪的定义。</summary>
+
+![](assets/demo/example-06.jpeg)
+
+</details>
+
+<details><summary>问题：请问加班工资怎么算？</summary>
+
+![](assets/demo/example-04.jpeg)

 </details>

@ -147,12 +159,19 @@ LawGPT 系列模型的训练过程分为两个阶段：

 </details>

-<details><summary>问题：你能否写一段抢劫罪罪名的案情描述？</summary>
+<details><summary>问题：欠了信用卡的钱还不上要坐牢吗？</summary>

-![](assets/demo/example-03.jpg)
+![](assets/demo/example-01.jpeg)

 </details>

+<details><summary>问题：你能否写一段抢劫罪罪名的案情描述？</summary>
+
+![](assets/demo/example-03.jpeg)
+
+</details>
+
+
 ### 局限性

 由于计算资源、数据规模等因素限制，当前阶段 LawGPT 存在诸多局限性：
--- a/assets/demo/example-03.jpeg
+++ b/assets/demo/example-03.jpeg
--- a/assets/demo/example-04.jpeg
+++ b/assets/demo/example-04.jpeg
--- a/assets/demo/example-05.jpeg
+++ b/assets/demo/example-05.jpeg
--- a/assets/demo/example-06.jpeg
+++ b/assets/demo/example-06.jpeg
--- a/src/scripts/train.sh
+++ b/src/scripts/train.sh
@ -1,6 +1,6 @@
 #!/bin/bash

-WORLD_SIZE=8 CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 torchrun --nproc_per_node=8 --master_port=1235 train.py \
+WORLD_SIZE=8 CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 torchrun --nproc_per_node=8 --master_port=1235 train_lora.py \
    --base_model '../models/base_models/chinese_llama_7b' \
    --data_path '' \
    --output_dir '../models/lora_weights' \
--- a/src/train_lora.py
+++ b/src/train_lora.py