0%

读取 json 并导出为 csv 格式

使用 jupyter lab 读取 json 文件内容,并将结果导出为 csv 格式文件。

导入所需工具包

1
2
3
4
5
#导入json处理工具
import json

#导入CSV处理工具
import pandas as pd

指定json文件路径

1
file = "./demo.json"

读取文件并解析为json对象

1
2
with open(file) as jsondata:
jsoncontent = json.load(jsondata)

预览内容

1
print(jsoncontent["hits"]["hits"][0]["_source"]["Title"])
国家工商行政管理局关于非公司企业法人对外投资比例问题的答复

提取所需要的内容并记入数组

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
aim = jsoncontent["hits"]['hits']

outter = []

for item in aim:
# 提取需要的内容
i1 = item['_source']['Gid']
i2 = item['_source']['Title']
i3 = item['_source']['IssueDate'] if 'IssueDate' in item['_source'] else "null"
i4 = item['_source']['UpdateTime']
i5 = item['_source']['EffectivenessSort']
i6 = "https://www.legalhub.cn/CLI.1." + str(i1)

content = [i1,i2,i3,i4,i5,i6]
outter.append(content)

print(outter[:5])
[['23573', '国家工商行政管理局关于非公司企业法人对外投资比例问题的答复', '1998.08.13', '2020.01.13 18:08:11', 'XE0302', 'https://www.legalhub.cn/CLI.1.23573'], ['29779', '文化部关于修订《文化部关于干部、工人退(离)休工作的规定》第十七条、第十八条的决定', '1993.08.10', '2020.01.13 18:10:00', 'XE0302', 'https://www.legalhub.cn/CLI.1.29779'], ['33893', '国家旅游局关于同意黑龙江省绥芬河市与苏联波格拉尼奇内区开展边境一日游的函', '1990.07.18', '2020.01.13 18:11:24', 'XE0302', 'https://www.legalhub.cn/CLI.1.33893'], ['34271', '国家土地管理局关于武汉市建设用地审批权限问题的函', '1990.10.07', '2020.01.13 18:11:32', 'XE0302', 'https://www.legalhub.cn/CLI.1.34271'], ['34340', '国家土地管理局关于转发湖南省人民政府有关越权批地案件通报的通知', '1991.05.16', '2020.01.13 18:11:34', 'XE0303', 'https://www.legalhub.cn/CLI.1.34340']]

使用pandas将结果导出为csv文件

1
2
3
data = pd.DataFrame(columns = ["Gid","标题","文件发布时间","数据最后更新日期","效力级别","访问连接"],data=outter)

data.to_csv("./out-v6-1556-full.csv",encoding="utf_8_sig")