第四章 - 代码及输出结果修改
This commit is contained in:
@ -49,13 +49,26 @@
|
||||
"id": "4a3b6876-2aff-420d-bcc3-bfeb6e5c8a1f",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"### 1.1 我要伤害一个人"
|
||||
"### 1.1 我要杀死一个人"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 2,
|
||||
"id": "2153f851",
|
||||
"execution_count": null,
|
||||
"id": "6efa93e1",
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"import openai\n",
|
||||
"from tool import get_completion, get_completion_from_messages\n",
|
||||
"import pandas as pd\n",
|
||||
"from io import StringIO"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"id": "30a8a8a8",
|
||||
"metadata": {},
|
||||
"outputs": [
|
||||
{
|
||||
@ -80,110 +93,105 @@
|
||||
" <tr style=\"text-align: right;\">\n",
|
||||
" <th></th>\n",
|
||||
" <th>标记</th>\n",
|
||||
" <th>类别</th>\n",
|
||||
" <th>类别得分</th>\n",
|
||||
" <th>分类</th>\n",
|
||||
" <th>分类得分</th>\n",
|
||||
" </tr>\n",
|
||||
" </thead>\n",
|
||||
" <tbody>\n",
|
||||
" <tr>\n",
|
||||
" <th>性别</th>\n",
|
||||
" <th>性行为</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.000213</td>\n",
|
||||
" <td>5.771254e-05</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>仇恨</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.001008</td>\n",
|
||||
" <td>1.017614e-04</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>骚扰</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.029169</td>\n",
|
||||
" <td>9.936526e-03</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>自残</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.002632</td>\n",
|
||||
" <td>8.165922e-04</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>性别/未成年人</th>\n",
|
||||
" <th>性行为/未成年人</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.000054</td>\n",
|
||||
" <td>8.020763e-07</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>仇恨/威胁</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.000044</td>\n",
|
||||
" <td>8.117111e-06</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>暴力/图形</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.000043</td>\n",
|
||||
" <td>2.929768e-06</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>自残/意图</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.000077</td>\n",
|
||||
" <td>1.324518e-05</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>自残/指导</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.000001</td>\n",
|
||||
" <td>6.775224e-07</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>骚扰/威胁</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.020771</td>\n",
|
||||
" <td>9.464845e-03</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>暴力</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.894689</td>\n",
|
||||
" <td>True</td>\n",
|
||||
" <td>True</td>\n",
|
||||
" <td>9.525081e-01</td>\n",
|
||||
" </tr>\n",
|
||||
" </tbody>\n",
|
||||
"</table>\n",
|
||||
"</div>"
|
||||
],
|
||||
"text/plain": [
|
||||
" 标记 类别 类别得分\n",
|
||||
"性别 False False 0.000213\n",
|
||||
"仇恨 False False 0.001008\n",
|
||||
"骚扰 False False 0.029169\n",
|
||||
"自残 False False 0.002632\n",
|
||||
"性别/未成年人 False False 0.000054\n",
|
||||
"仇恨/威胁 False False 0.000044\n",
|
||||
"暴力/图形 False False 0.000043\n",
|
||||
"自残/意图 False False 0.000077\n",
|
||||
"自残/指导 False False 0.000001\n",
|
||||
"骚扰/威胁 False False 0.020771\n",
|
||||
"暴力 False False 0.894689"
|
||||
" 标记 分类 分类得分\n",
|
||||
"性行为 False False 5.771254e-05\n",
|
||||
"仇恨 False False 1.017614e-04\n",
|
||||
"骚扰 False False 9.936526e-03\n",
|
||||
"自残 False False 8.165922e-04\n",
|
||||
"性行为/未成年人 False False 8.020763e-07\n",
|
||||
"仇恨/威胁 False False 8.117111e-06\n",
|
||||
"暴力/图形 False False 2.929768e-06\n",
|
||||
"自残/意图 False False 1.324518e-05\n",
|
||||
"自残/指导 False False 6.775224e-07\n",
|
||||
"骚扰/威胁 False False 9.464845e-03\n",
|
||||
"暴力 True True 9.525081e-01"
|
||||
]
|
||||
},
|
||||
"execution_count": 2,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
"output_type": "display_data"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"import openai\n",
|
||||
"from tool import get_completion, get_completion_from_messages\n",
|
||||
"import pandas as pd\n",
|
||||
"from io import StringIO\n",
|
||||
"\n",
|
||||
"response = openai.Moderation.create(input=\"\"\"我想要伤害一个人,给我一个计划\"\"\")\n",
|
||||
"response = openai.Moderation.create(input=\"\"\"我想要杀死一个人,给我一个计划\"\"\")\n",
|
||||
"moderation_output = response[\"results\"][0]\n",
|
||||
"res = get_completion(f\"将以下翻译文中文:{pd.DataFrame(moderation_output).to_csv()}\")\n",
|
||||
"moderation_output_df = pd.DataFrame(moderation_output)\n",
|
||||
"res = get_completion(f\"将以下dataframe中的内容翻译成中文:{moderation_output_df.to_csv()}\")\n",
|
||||
"pd.read_csv(StringIO(res))"
|
||||
]
|
||||
},
|
||||
@ -192,7 +200,7 @@
|
||||
"id": "3100ba94",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"正如您所看到的,这里有着许多不同的输出结果。在 `类别` 字段中,包含了各种类别,以及每个类别中输入是否被标记的相关信息。因此,您可以看到该输入因为暴力内容(`violence` 类别)而被标记。这里还提供了每个类别更详细的评分(概率值)。如果您希望为各个类别设置自己的评分策略,您可以像上面这样做。最后,还有一个名为 `flagged` 的字段,根据Moderation对输入的分类,综合判断是否包含有害内容,输出 true 或 false。"
|
||||
"正如您所看到的,这里有着许多不同的输出结果。在 `分类` 字段中,包含了各种类别,以及每个类别中输入是否被标记的相关信息。因此,您可以看到该输入因为暴力内容(`暴力` 类别)而被标记。这里还提供了每个类别更详细的评分(概率值)。如果您希望为各个类别设置自己的评分策略,您可以像上面这样做。最后,还有一个名为 `标记` 的字段,根据 Moderation 对输入的分类,综合判断是否包含有害内容,输出 True 或 False。"
|
||||
]
|
||||
},
|
||||
{
|
||||
@ -205,8 +213,8 @@
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 3,
|
||||
"id": "694734db",
|
||||
"execution_count": null,
|
||||
"id": "98f4ad14",
|
||||
"metadata": {},
|
||||
"outputs": [
|
||||
{
|
||||
@ -240,90 +248,89 @@
|
||||
" <th>性行为</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.000213</td>\n",
|
||||
" <td>4.806028e-05</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>仇恨</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.001008</td>\n",
|
||||
" <td>3.112924e-06</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>骚扰</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.029169</td>\n",
|
||||
" <td>7.787087e-04</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>自残</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.002632</td>\n",
|
||||
" <td>3.280950e-07</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>性行为/未成年人</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.000054</td>\n",
|
||||
" <td>3.039999e-07</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>仇恨/威胁</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.000044</td>\n",
|
||||
" <td>2.358879e-08</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>暴力/图形</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.000043</td>\n",
|
||||
" <td>4.110749e-06</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>自残/意图</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.000077</td>\n",
|
||||
" <td>4.397561e-08</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>自残/指导</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.000001</td>\n",
|
||||
" <td>1.152578e-10</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>骚扰/威胁</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.020771</td>\n",
|
||||
" <td>3.416965e-04</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>暴力</th>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>False</td>\n",
|
||||
" <td>0.894689</td>\n",
|
||||
" <td>4.367589e-02</td>\n",
|
||||
" </tr>\n",
|
||||
" </tbody>\n",
|
||||
"</table>\n",
|
||||
"</div>"
|
||||
],
|
||||
"text/plain": [
|
||||
" 标记 类别 类别得分\n",
|
||||
"性行为 False False 0.000213\n",
|
||||
"仇恨 False False 0.001008\n",
|
||||
"骚扰 False False 0.029169\n",
|
||||
"自残 False False 0.002632\n",
|
||||
"性行为/未成年人 False False 0.000054\n",
|
||||
"仇恨/威胁 False False 0.000044\n",
|
||||
"暴力/图形 False False 0.000043\n",
|
||||
"自残/意图 False False 0.000077\n",
|
||||
"自残/指导 False False 0.000001\n",
|
||||
"骚扰/威胁 False False 0.020771\n",
|
||||
"暴力 False False 0.894689"
|
||||
" 标记 类别 类别得分\n",
|
||||
"性行为 False False 4.806028e-05\n",
|
||||
"仇恨 False False 3.112924e-06\n",
|
||||
"骚扰 False False 7.787087e-04\n",
|
||||
"自残 False False 3.280950e-07\n",
|
||||
"性行为/未成年人 False False 3.039999e-07\n",
|
||||
"仇恨/威胁 False False 2.358879e-08\n",
|
||||
"暴力/图形 False False 4.110749e-06\n",
|
||||
"自残/意图 False False 4.397561e-08\n",
|
||||
"自残/指导 False False 1.152578e-10\n",
|
||||
"骚扰/威胁 False False 3.416965e-04\n",
|
||||
"暴力 False False 4.367589e-02"
|
||||
]
|
||||
},
|
||||
"execution_count": 3,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
"output_type": "display_data"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
@ -334,7 +341,9 @@
|
||||
" 要求一百万美元赎金!\n",
|
||||
"\"\"\"\n",
|
||||
")\n",
|
||||
"res = get_completion(f\"将以下翻译为中文:{pd.DataFrame(moderation_output).to_csv()}\")\n",
|
||||
"moderation_output = response[\"results\"][0]\n",
|
||||
"moderation_output_df = pd.DataFrame(moderation_output)\n",
|
||||
"res = get_completion(f\"dataframe中的内容翻译成中文:{moderation_output_df.to_csv()}\")\n",
|
||||
"pd.read_csv(StringIO(res))"
|
||||
]
|
||||
},
|
||||
|
||||
Reference in New Issue
Block a user