Initialize datasset jec_qa
This commit is contained in:
@ -1,7 +1,5 @@
|
||||
# LaWGPT:基于中文法律知识的大语言模型
|
||||
|
||||
<!--  -->
|
||||
|
||||
<p align="center">
|
||||
<a href="./assets/logo/lawgpt2.jpeg">
|
||||
<img src="./assets/logo/lawgpt2.jpeg" width="70%" >
|
||||
|
||||
6
instructions/README.md
Normal file
6
instructions/README.md
Normal file
@ -0,0 +1,6 @@
|
||||
## 指令微调数据
|
||||
|
||||
**JEC-QA:中国法考问答数据集**
|
||||
|
||||
- https://jecqa.thunlp.org/
|
||||
- https://github.com/thunlp/jec-qa
|
||||
476
instructions/jec_qa/data_preprocess.ipynb
Normal file
476
instructions/jec_qa/data_preprocess.ipynb
Normal file
@ -0,0 +1,476 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 2,
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"import pandas as pd\n",
|
||||
"import json"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 3,
|
||||
"metadata": {},
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/html": [
|
||||
"<div>\n",
|
||||
"<style scoped>\n",
|
||||
" .dataframe tbody tr th:only-of-type {\n",
|
||||
" vertical-align: middle;\n",
|
||||
" }\n",
|
||||
"\n",
|
||||
" .dataframe tbody tr th {\n",
|
||||
" vertical-align: top;\n",
|
||||
" }\n",
|
||||
"\n",
|
||||
" .dataframe thead th {\n",
|
||||
" text-align: right;\n",
|
||||
" }\n",
|
||||
"</style>\n",
|
||||
"<table border=\"1\" class=\"dataframe\">\n",
|
||||
" <thead>\n",
|
||||
" <tr style=\"text-align: right;\">\n",
|
||||
" <th></th>\n",
|
||||
" <th>answer</th>\n",
|
||||
" <th>option_list</th>\n",
|
||||
" <th>statement</th>\n",
|
||||
" </tr>\n",
|
||||
" </thead>\n",
|
||||
" <tbody>\n",
|
||||
" <tr>\n",
|
||||
" <th>0</th>\n",
|
||||
" <td>[B]</td>\n",
|
||||
" <td>{'A': '我国商务部在确定进口橡胶制品是否存在补贴时必须证明出国(地区)政府直接向出口商...</td>\n",
|
||||
" <td>中国商务部决定对原产于马来西亚等八国的橡胶制品展开反补贴调查。根据我国《反补贴条例》以及相关...</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>1</th>\n",
|
||||
" <td>[D]</td>\n",
|
||||
" <td>{'A': '该法典体现了“个人最大限度的自由,法律最小限度的干涉”这一立法精神', 'B'...</td>\n",
|
||||
" <td>1804年的《法国民法典》是世界近代法制史上的第一部民法典,是大陆法系的核心和基础。下列关于...</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>2</th>\n",
|
||||
" <td>[D]</td>\n",
|
||||
" <td>{'A': '“偶语诗书”', 'B': '“以古非今”', 'C': '“非所宜言”', ...</td>\n",
|
||||
" <td>据史书载,以下均为秦朝刑事罪名。下列哪一选项最不具有秦朝法律文化的专制特色?</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>3</th>\n",
|
||||
" <td>[A, B]</td>\n",
|
||||
" <td>{'A': '船舶抵押权的设定', 'B': '同国籍船舶在公海发生碰撞的损害赔偿', 'C...</td>\n",
|
||||
" <td>根据《中华人民共和国海商法》,在海事关系的法律适用中,旗国法适用于下列哪些情形?</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>4</th>\n",
|
||||
" <td>[A, B, C]</td>\n",
|
||||
" <td>{'A': '“君权神授”观念是近代宪法发展的思想条件之一', 'B': '美国宪法是世界上...</td>\n",
|
||||
" <td>下列有关宪法发展史的论述不正确的有</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>...</th>\n",
|
||||
" <td>...</td>\n",
|
||||
" <td>...</td>\n",
|
||||
" <td>...</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>13292</th>\n",
|
||||
" <td>[D]</td>\n",
|
||||
" <td>{'A': '如依中国法律和甲国法律均构成犯罪,即可准予引渡', 'B': '中国应按照收到...</td>\n",
|
||||
" <td>中国人高某在甲国探亲期间加入甲国国籍,回中国后健康不佳,也未申请退出中国国籍。后甲国因高某在...</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>13293</th>\n",
|
||||
" <td>[B, C]</td>\n",
|
||||
" <td>{'A': '欣荣公司的请求权已经超过诉讼时效', 'B': '乙的请求权没有超过诉讼时效'...</td>\n",
|
||||
" <td>欣荣公司于2006年8月1日领取营业执照时,股东甲尚有50万元的出资未缴纳。按照出资协议最晚...</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>13294</th>\n",
|
||||
" <td>[B]</td>\n",
|
||||
" <td>{'A': '报同级检察院批准', 'B': '报同级检察院备案', 'C': '报上一级公...</td>\n",
|
||||
" <td>张某因涉嫌放火罪被批准逮捕。公安机关在侦查过程中,发现张某另有抢劫罪的重大嫌疑,决定依照刑事...</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>13295</th>\n",
|
||||
" <td>[A, B, D]</td>\n",
|
||||
" <td>{'A': '被告人的辩护人申请审判员张某回避', 'B': '被告人收到起诉书后下落不明'...</td>\n",
|
||||
" <td>在法庭审判过程中,下列哪些情形不可以延期审理?</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>13296</th>\n",
|
||||
" <td>[C]</td>\n",
|
||||
" <td>{'A': '甲鸳鸯运输公司的船舶发生原油泄漏,导致某海域大面积污染,海鲜捕捞量大幅度减产,...</td>\n",
|
||||
" <td>以下事实中,在甲乙之间产生民事法律关系的是:</td>\n",
|
||||
" </tr>\n",
|
||||
" </tbody>\n",
|
||||
"</table>\n",
|
||||
"<p>21072 rows × 3 columns</p>\n",
|
||||
"</div>"
|
||||
],
|
||||
"text/plain": [
|
||||
" answer option_list \\\n",
|
||||
"0 [B] {'A': '我国商务部在确定进口橡胶制品是否存在补贴时必须证明出国(地区)政府直接向出口商... \n",
|
||||
"1 [D] {'A': '该法典体现了“个人最大限度的自由,法律最小限度的干涉”这一立法精神', 'B'... \n",
|
||||
"2 [D] {'A': '“偶语诗书”', 'B': '“以古非今”', 'C': '“非所宜言”', ... \n",
|
||||
"3 [A, B] {'A': '船舶抵押权的设定', 'B': '同国籍船舶在公海发生碰撞的损害赔偿', 'C... \n",
|
||||
"4 [A, B, C] {'A': '“君权神授”观念是近代宪法发展的思想条件之一', 'B': '美国宪法是世界上... \n",
|
||||
"... ... ... \n",
|
||||
"13292 [D] {'A': '如依中国法律和甲国法律均构成犯罪,即可准予引渡', 'B': '中国应按照收到... \n",
|
||||
"13293 [B, C] {'A': '欣荣公司的请求权已经超过诉讼时效', 'B': '乙的请求权没有超过诉讼时效'... \n",
|
||||
"13294 [B] {'A': '报同级检察院批准', 'B': '报同级检察院备案', 'C': '报上一级公... \n",
|
||||
"13295 [A, B, D] {'A': '被告人的辩护人申请审判员张某回避', 'B': '被告人收到起诉书后下落不明'... \n",
|
||||
"13296 [C] {'A': '甲鸳鸯运输公司的船舶发生原油泄漏,导致某海域大面积污染,海鲜捕捞量大幅度减产,... \n",
|
||||
"\n",
|
||||
" statement \n",
|
||||
"0 中国商务部决定对原产于马来西亚等八国的橡胶制品展开反补贴调查。根据我国《反补贴条例》以及相关... \n",
|
||||
"1 1804年的《法国民法典》是世界近代法制史上的第一部民法典,是大陆法系的核心和基础。下列关于... \n",
|
||||
"2 据史书载,以下均为秦朝刑事罪名。下列哪一选项最不具有秦朝法律文化的专制特色? \n",
|
||||
"3 根据《中华人民共和国海商法》,在海事关系的法律适用中,旗国法适用于下列哪些情形? \n",
|
||||
"4 下列有关宪法发展史的论述不正确的有 \n",
|
||||
"... ... \n",
|
||||
"13292 中国人高某在甲国探亲期间加入甲国国籍,回中国后健康不佳,也未申请退出中国国籍。后甲国因高某在... \n",
|
||||
"13293 欣荣公司于2006年8月1日领取营业执照时,股东甲尚有50万元的出资未缴纳。按照出资协议最晚... \n",
|
||||
"13294 张某因涉嫌放火罪被批准逮捕。公安机关在侦查过程中,发现张某另有抢劫罪的重大嫌疑,决定依照刑事... \n",
|
||||
"13295 在法庭审判过程中,下列哪些情形不可以延期审理? \n",
|
||||
"13296 以下事实中,在甲乙之间产生民事法律关系的是: \n",
|
||||
"\n",
|
||||
"[21072 rows x 3 columns]"
|
||||
]
|
||||
},
|
||||
"execution_count": 3,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"train0_df = pd.read_json('./0_train.json', lines=True)\n",
|
||||
"train1_df = pd.read_json('./1_train.json', lines=True)\n",
|
||||
"\n",
|
||||
"train_df = pd.concat([train0_df, train1_df], axis=0)\n",
|
||||
"train_df = train_df.loc[:, ['answer', 'option_list', 'statement']]\n",
|
||||
"train_df"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 4,
|
||||
"metadata": {},
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": [
|
||||
"[{'instruction': '中国商务部决定对原产于马来西亚等八国的橡胶制品展开反补贴调查。根据我国《反补贴条例》以及相关法律法规,下列关于此次反补贴调查的哪项判断是正确的? (A) 我国商务部在确定进口橡胶制品是否存在补贴时必须证明出国(地区)政府直接向出口商提供了现金形式的财政资助 (B) 在反补贴调查期间,该八国政府或橡胶制品的出口经营者,可以向中国商务部作出承诺,取消、限制补贴或改变价格 (C) 如果我国商务部终局裁定决定对该八国进口橡胶制品征收反补贴税,该反补贴税的征收期限不得超过10年 (D) 如果中国橡胶制品进口商对商务部征收反补贴税的终局裁定不服,必须首先向商务部请求行政复审,对行政复审决定还不服,才能向中国有管辖权的法院起诉.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': '(B) 在反补贴调查期间,该八国政府或橡胶制品的出口经营者,可以向中国商务部作出承诺,取消、限制补贴或改变价格'},\n",
|
||||
" {'instruction': '1804年的《法国民法典》是世界近代法制史上的第一部民法典,是大陆法系的核心和基础。下列关于《法国民法典》的哪一项表述不正确? (A) 该法典体现了“个人最大限度的自由,法律最小限度的干涉”这一立法精神 (B) 该法典具有鲜明的革命性和时代性 (C) 该法典的影响后来传播到美洲、非洲和亚洲广大地区 (D) 该法典首次全面规定了法人制度.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': '(D) 该法典首次全面规定了法人制度'},\n",
|
||||
" {'instruction': '据史书载,以下均为秦朝刑事罪名。下列哪一选项最不具有秦朝法律文化的专制特色? (A) “偶语诗书” (B) “以古非今” (C) “非所宜言” (D) “失刑”.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': '(D) “失刑”'},\n",
|
||||
" {'instruction': '根据《中华人民共和国海商法》,在海事关系的法律适用中,旗国法适用于下列哪些情形? (A) 船舶抵押权的设定 (B) 同国籍船舶在公海发生碰撞的损害赔偿 (C) 共同海损理算 (D) 海事赔偿责任限制.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': '(A) 船舶抵押权的设定(B) 同国籍船舶在公海发生碰撞的损害赔偿'},\n",
|
||||
" {'instruction': '下列有关宪法发展史的论述不正确的有 (A) “君权神授”观念是近代宪法发展的思想条件之一 (B) 美国宪法是世界上最早的宪法 (C) 1918年的《苏联宪法》是第一部社会主义性质的宪法 (D) 《人权宣言》不是法国的第一部宪法.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': '(A) “君权神授”观念是近代宪法发展的思想条件之一(B) 美国宪法是世界上最早的宪法(C) 1918年的《苏联宪法》是第一部社会主义性质的宪法'},\n",
|
||||
" {'instruction': '下列按照特别程序审理的案件中,必须由审判员组成合议庭审理的是哪一项? (A) 宣告失踪案件 (B) 认定公民无民事行为能力案件 (C) 选民资格案件 (D) 认定财产无主案件.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': '(C) 选民资格案件'},\n",
|
||||
" {'instruction': '关于行政赔偿诉讼,下列哪些选项是正确的? (A) 当事人在提起行政诉讼的同时一并提出行政赔偿请求,法院应分别立案 (B) 除特殊情形外,法院单独受理的一审行政赔偿案件的审理期限为三个月 (C) 如复议决定加重损害,赔偿请求人只对复议机关提出行政赔偿诉讼的,复议机关为被告 (D) 提起行政诉讼时一并提出行政赔偿请求的,可以在提起诉讼后至法院一审判决前提出.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': '(A) 当事人在提起行政诉讼的同时一并提出行政赔偿请求,法院应分别立案(B) 除特殊情形外,法院单独受理的一审行政赔偿案件的审理期限为三个月(C) 如复议决定加重损害,赔偿请求人只对复议机关提出行政赔偿诉讼的,复议机关为被告'},\n",
|
||||
" {'instruction': '根据法律规定,下列关于土地使用权出让的表述正确的是: (A) 土地使用权出让的对象只能是国有土地的使用权 (B) 出让商业、旅游、娱乐和豪华住宅用地的使用权的,有条件的,必须采取招标、拍卖的方式 (C) 土地使用权出让的,应该签订书面的出让合同,但是出让合同只对土地使用者具有约束力 (D) 土地使用者以出让的方式取得土地使用权后,应当向县级以上地方人民政府申请登记,经核实后,由同级人民政府土地管理部门颁发土地使用权证.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': '(A) 土地使用权出让的对象只能是国有土地的使用权(B) 出让商业、旅游、娱乐和豪华住宅用地的使用权的,有条件的,必须采取招标、拍卖的方式'},\n",
|
||||
" {'instruction': '依我国法律规定,在我国法院受理的涉外离婚案件审理过程中,认定婚姻是否有效应当以下列哪一项为准据法? (A) 婚姻缔结地法 (B) 当事人本国法 (C) 当事人住所地法 (D) 法院地.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': '(A) 婚姻缔结地法'},\n",
|
||||
" {'instruction': '法院在审理刑事案件过程中,下列表述不正确的有: (A) 法院经过审理,如果认为定罪证据不足,应当坚持无罪推定的原则,依法宣告被告人无罪 (B) 法院经过审理,如果认为量刑证据存疑,应当在量刑时作出有利于被告人的处理 (C) 为了保障被告人的合法权益,侦查人员在规定的办案场所外讯问取得的供述应当一律依法排除 (D) 庭前会议时,对于控辩双方有异议的证据,应当重点调查,没有异议的,可以简化调查.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': '(A) 法院经过审理,如果认为定罪证据不足,应当坚持无罪推定的原则,依法宣告被告人无罪(C) 为了保障被告人的合法权益,侦查人员在规定的办案场所外讯问取得的供述应当一律依法排除(D) 庭前会议时,对于控辩双方有异议的证据,应当重点调查,没有异议的,可以简化调查'}]"
|
||||
]
|
||||
},
|
||||
"execution_count": 4,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"test_instances = []\n",
|
||||
"for index, row in train_df.iterrows():\n",
|
||||
" instance_dict = {}\n",
|
||||
" answers, options, statement = row['answer'], row['option_list'], row['statement']\n",
|
||||
" opt_a, opt_b, opt_c, opt_d = options.values()\n",
|
||||
" instruction = f\"{statement} (A) {opt_a} (B) {opt_b} (C) {opt_c} (D) {opt_d}.\"\n",
|
||||
" output = ''\n",
|
||||
" for answer in answers:\n",
|
||||
" if answer in ['A', 'B', 'C', 'D']:\n",
|
||||
" output += f\"({answer}) {options[answer]}\"\n",
|
||||
" output = f\"{output}\"\n",
|
||||
" test_instances.append({'instruction': instruction, 'input': '', 'output': output})\n",
|
||||
"test_instances[:10]"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 5,
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"with open('qa_thunlp.json', 'w') as f:\n",
|
||||
" json.dump(test_instances, f, ensure_ascii=False)"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 6,
|
||||
"metadata": {},
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/html": [
|
||||
"<div>\n",
|
||||
"<style scoped>\n",
|
||||
" .dataframe tbody tr th:only-of-type {\n",
|
||||
" vertical-align: middle;\n",
|
||||
" }\n",
|
||||
"\n",
|
||||
" .dataframe tbody tr th {\n",
|
||||
" vertical-align: top;\n",
|
||||
" }\n",
|
||||
"\n",
|
||||
" .dataframe thead th {\n",
|
||||
" text-align: right;\n",
|
||||
" }\n",
|
||||
"</style>\n",
|
||||
"<table border=\"1\" class=\"dataframe\">\n",
|
||||
" <thead>\n",
|
||||
" <tr style=\"text-align: right;\">\n",
|
||||
" <th></th>\n",
|
||||
" <th>id</th>\n",
|
||||
" <th>option_list</th>\n",
|
||||
" <th>statement</th>\n",
|
||||
" </tr>\n",
|
||||
" </thead>\n",
|
||||
" <tbody>\n",
|
||||
" <tr>\n",
|
||||
" <th>0</th>\n",
|
||||
" <td>11781</td>\n",
|
||||
" <td>{'A': '犯罪的预备阶段', 'B': '犯罪的实行阶段', 'C': '犯罪行为尚未实...</td>\n",
|
||||
" <td>犯罪中止可以发生在:</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>1</th>\n",
|
||||
" <td>13516</td>\n",
|
||||
" <td>{'A': '行为人知道或者应当知道标明密级的事项,而为境外窃取、刺探、收买、非法提供的',...</td>\n",
|
||||
" <td>下列哪些行为不属于为境外窃取、刺探、收买、非法提供国家秘密罪?</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>2</th>\n",
|
||||
" <td>14849</td>\n",
|
||||
" <td>{'A': '单务法律行为', 'B': '双务法律行为', 'C': '实践法律行为', ...</td>\n",
|
||||
" <td>下列关于赠与合同的说法正确的是:</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>3</th>\n",
|
||||
" <td>1218</td>\n",
|
||||
" <td>{'A': '人权是基本权利的来源,基本权利是人权宪法化的具体表现', 'B': '基本权利...</td>\n",
|
||||
" <td>公民基本权利也称宪法权利。关于公民基本权利,下列哪些选项是正确的?</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>4</th>\n",
|
||||
" <td>12483</td>\n",
|
||||
" <td>{'A': '政府采购机构签订的采购合同行为', 'B': '公安局作出的行政调解行为', ...</td>\n",
|
||||
" <td>公民、法人或者其他组织对下列哪些行为可以提起行政复议?</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>...</th>\n",
|
||||
" <td>...</td>\n",
|
||||
" <td>...</td>\n",
|
||||
" <td>...</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>3298</th>\n",
|
||||
" <td>314495</td>\n",
|
||||
" <td>{'A': '对可能判处5年有期徒刑以上刑罚的,一般应当组成合议庭进行审判', 'B': '...</td>\n",
|
||||
" <td>甲盗窃财物,数额较大,某区人民检察院向该区人民法院提起公诉,同时因为案件事实清楚,证据充分,...</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>3299</th>\n",
|
||||
" <td>38200</td>\n",
|
||||
" <td>{'A': '在行政许可的听证程序中,行政机关可以收取合理费用', 'B': '行政机关对行...</td>\n",
|
||||
" <td>关于收费问题,下列说法正确的是?</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>3300</th>\n",
|
||||
" <td>313314</td>\n",
|
||||
" <td>{'A': '刘某只能自行收集证据', 'B': '刘某必须经过人民法院准许,方可查阅、摘抄...</td>\n",
|
||||
" <td>在一起强奸案中,律师刘某作为被害人的诉讼代理人,下列说法正确的是:</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>3301</th>\n",
|
||||
" <td>311215</td>\n",
|
||||
" <td>{'A': '甲、乙共同购买一台电视,乙要将其共有的份额转让,甲享有优先购买权', 'B':...</td>\n",
|
||||
" <td>以下关系中,一方享有优先购买权的为哪些选项?</td>\n",
|
||||
" </tr>\n",
|
||||
" <tr>\n",
|
||||
" <th>3302</th>\n",
|
||||
" <td>31863</td>\n",
|
||||
" <td>{'A': '郭某是村民小组长,在管理本村行政事务时,将村集体财产30万元均为己有', 'B...</td>\n",
|
||||
" <td>下列行为构成贪污罪的有:</td>\n",
|
||||
" </tr>\n",
|
||||
" </tbody>\n",
|
||||
"</table>\n",
|
||||
"<p>5289 rows × 3 columns</p>\n",
|
||||
"</div>"
|
||||
],
|
||||
"text/plain": [
|
||||
" id option_list \\\n",
|
||||
"0 11781 {'A': '犯罪的预备阶段', 'B': '犯罪的实行阶段', 'C': '犯罪行为尚未实... \n",
|
||||
"1 13516 {'A': '行为人知道或者应当知道标明密级的事项,而为境外窃取、刺探、收买、非法提供的',... \n",
|
||||
"2 14849 {'A': '单务法律行为', 'B': '双务法律行为', 'C': '实践法律行为', ... \n",
|
||||
"3 1218 {'A': '人权是基本权利的来源,基本权利是人权宪法化的具体表现', 'B': '基本权利... \n",
|
||||
"4 12483 {'A': '政府采购机构签订的采购合同行为', 'B': '公安局作出的行政调解行为', ... \n",
|
||||
"... ... ... \n",
|
||||
"3298 314495 {'A': '对可能判处5年有期徒刑以上刑罚的,一般应当组成合议庭进行审判', 'B': '... \n",
|
||||
"3299 38200 {'A': '在行政许可的听证程序中,行政机关可以收取合理费用', 'B': '行政机关对行... \n",
|
||||
"3300 313314 {'A': '刘某只能自行收集证据', 'B': '刘某必须经过人民法院准许,方可查阅、摘抄... \n",
|
||||
"3301 311215 {'A': '甲、乙共同购买一台电视,乙要将其共有的份额转让,甲享有优先购买权', 'B':... \n",
|
||||
"3302 31863 {'A': '郭某是村民小组长,在管理本村行政事务时,将村集体财产30万元均为己有', 'B... \n",
|
||||
"\n",
|
||||
" statement \n",
|
||||
"0 犯罪中止可以发生在: \n",
|
||||
"1 下列哪些行为不属于为境外窃取、刺探、收买、非法提供国家秘密罪? \n",
|
||||
"2 下列关于赠与合同的说法正确的是: \n",
|
||||
"3 公民基本权利也称宪法权利。关于公民基本权利,下列哪些选项是正确的? \n",
|
||||
"4 公民、法人或者其他组织对下列哪些行为可以提起行政复议? \n",
|
||||
"... ... \n",
|
||||
"3298 甲盗窃财物,数额较大,某区人民检察院向该区人民法院提起公诉,同时因为案件事实清楚,证据充分,... \n",
|
||||
"3299 关于收费问题,下列说法正确的是? \n",
|
||||
"3300 在一起强奸案中,律师刘某作为被害人的诉讼代理人,下列说法正确的是: \n",
|
||||
"3301 以下关系中,一方享有优先购买权的为哪些选项? \n",
|
||||
"3302 下列行为构成贪污罪的有: \n",
|
||||
"\n",
|
||||
"[5289 rows x 3 columns]"
|
||||
]
|
||||
},
|
||||
"execution_count": 6,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"test0_df = pd.read_json('./0_test.json', lines=True)\n",
|
||||
"test1_df = pd.read_json('./1_test.json', lines=True)\n",
|
||||
"\n",
|
||||
"test_df = pd.concat([test0_df, test1_df], axis=0)\n",
|
||||
"test_df = test_df.loc[:, ['id', 'option_list', 'statement']]\n",
|
||||
"test_df"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 7,
|
||||
"metadata": {},
|
||||
"outputs": [
|
||||
{
|
||||
"data": {
|
||||
"text/plain": [
|
||||
"[{'instruction': '犯罪中止可以发生在: (A) 犯罪的预备阶段 (B) 犯罪的实行阶段 (C) 犯罪行为尚未实行完毕的情况下 (D) 犯罪行为已经实行完毕的情况下.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': ''},\n",
|
||||
" {'instruction': '下列哪些行为不属于为境外窃取、刺探、收买、非法提供国家秘密罪? (A) 行为人知道或者应当知道标明密级的事项,而为境外窃取、刺探、收买、非法提供的 (B) 行为人知道或者应当知道没有标明密级的事项关系国家安全和利益,而为境外窃取、刺探、收买、非法提供的 (C) 通过互联网将国家秘密或者情报非法发送给境外的机构、组织、个人的 (D) 将国家秘密通过互联网予以发布,情节严重的.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': ''},\n",
|
||||
" {'instruction': '下列关于赠与合同的说法正确的是: (A) 单务法律行为 (B) 双务法律行为 (C) 实践法律行为 (D) 要式法律行为.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': ''},\n",
|
||||
" {'instruction': '公民基本权利也称宪法权利。关于公民基本权利,下列哪些选项是正确的? (A) 人权是基本权利的来源,基本权利是人权宪法化的具体表现 (B) 基本权利的主体主要是公民,在我国法人也可以作为基本权利的主体 (C) 我国公民在行使自由和权利的时候,不得损害国家的、社会的、集体的利益和其他公民的合法的自由和利益 (D) 权利和义务的平等性是我国公民基本权利和义务的重要特点.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': ''},\n",
|
||||
" {'instruction': '公民、法人或者其他组织对下列哪些行为可以提起行政复议? (A) 政府采购机构签订的采购合同行为 (B) 公安局作出的行政调解行为 (C) 大学拒绝发放学位证书的行为 (D) 注册会计师协会对注册会计师执业证照不予年检的行为.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': ''},\n",
|
||||
" {'instruction': '以下关于环境保护法的民事责任的说法,哪些是正确的? (A) 环境侵权责任应当适用民事侵权的过错原则 (B) 赔偿责任和赔偿金额的纠纷,可以根据当事人的请求,由环境保护行政主管部门处理 (C) 由于不可抗拒的自然灾害,免予承担责任 (D) 因环境污染损害赔偿提起诉讼的时效期间为四年,从当事人知道或者应当知道受到污染损害时起计算.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': ''},\n",
|
||||
" {'instruction': '我国《商标法》第三十九条规定:“转让注册商标的,转让人和受让人应当签订转让协议,并共同向商标局提出申请。受让人应当保证使用该注册商标的商品质量。”从表述上看,该法律条文省略了: (A) 假定条件 (B) 处理 (C) 行为模式 (D) 法律后果.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': ''},\n",
|
||||
" {'instruction': '根据我国《行政复议法》的规定,公民、法人或其他组织对民事纠纷的仲裁、调解或者处理不服的,不能申请行政复议。但下列哪种情况除外 (A) 继承权纠纷 (B) 干涉婚姻自主权的 (C) 房屋买卖行为 (D) 行政机关对土地、矿产、森林等资源所有权或使用权归属的处理决定.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': ''},\n",
|
||||
" {'instruction': '下列有关中国的贸易救济措施的说法正确的是: (A) 反倾销税的征收期限和价格承诺的履行期限不超过6年,但是经复审确定终止征收反倾销有可能导致损害的继续或者再度发生的,可以适当延长反倾销税的征收期限 (B) 根据反补贴条例,出口国政府或出口经营者,都可以做出承诺,分别承诺取消、限制补贴或其他有关措施,承诺修改价格 (C) 保障措施的实施期限不超过4年,符合法律规定的条件的,保障措施的实施期限可以适当延长,但最长不超过8年。 (D) 适用保障措施要求的产业损害程度重于反倾销或反补贴要求的损害程度,即实质损害而不是严重损害.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': ''},\n",
|
||||
" {'instruction': '以下说法不正确的是? (A) 1919年《魏玛宪法》是第一部现代宪法 (B) 1830年法国宪法是钦定宪法 (C) 英国是世界上制定宪法最多的国家 (D) 1787年美国宪法是世界首部成文宪法.',\n",
|
||||
" 'input': '',\n",
|
||||
" 'output': ''}]"
|
||||
]
|
||||
},
|
||||
"execution_count": 7,
|
||||
"metadata": {},
|
||||
"output_type": "execute_result"
|
||||
}
|
||||
],
|
||||
"source": [
|
||||
"test_instances = []\n",
|
||||
"for index, row in test_df.iterrows():\n",
|
||||
" instance_dict = {}\n",
|
||||
" options, statement = row['option_list'], row['statement']\n",
|
||||
" opt_a, opt_b, opt_c, opt_d = options.values()\n",
|
||||
" instruction = f\"{statement} (A) {opt_a} (B) {opt_b} (C) {opt_c} (D) {opt_d}.\"\n",
|
||||
" output = ''\n",
|
||||
" # print({'Instruction': instruction, 'Output': output})\n",
|
||||
" test_instances.append({'instruction': instruction, 'input': '', 'output': output})\n",
|
||||
"test_instances[:10]"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 8,
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"with open('qa_thunlp_test.json', 'w') as f:\n",
|
||||
" json.dump(test_instances, f, ensure_ascii=False)"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": []
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"kernelspec": {
|
||||
"display_name": "legal",
|
||||
"language": "python",
|
||||
"name": "python3"
|
||||
},
|
||||
"language_info": {
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 3
|
||||
},
|
||||
"file_extension": ".py",
|
||||
"mimetype": "text/x-python",
|
||||
"name": "python",
|
||||
"nbconvert_exporter": "python",
|
||||
"pygments_lexer": "ipython3",
|
||||
"version": "3.8.16"
|
||||
},
|
||||
"orig_nbformat": 4
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 2
|
||||
}
|
||||
3383
instructions/jec_qa/eva.ipynb
Normal file
3383
instructions/jec_qa/eva.ipynb
Normal file
File diff suppressed because it is too large
Load Diff
Reference in New Issue
Block a user