Python的json模块和pickle模块怎么使用

json模块

json用于不同语言之间的数据交换，比如C和Python之间等等，即可跨语言。而pickle只能用于python与python之间数据交换。

序列化与反序列化

我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化，在Python中叫pickling，在其他语言中也被称之为serialization，marshalling，flattening等等，都是一个意思。序列化之后，就可以把序列化后的内容写入磁盘，或者通过网络传输到别的机器上。反过来，把变量内容从序列化的对象重新读到内存里称之为反序列化，即unpickling。

如果我们要在不同的编程语言之间传递对象，就必须把对象序列化为标准格式，比如XML，但更好的方法是序列化为JSON，因为JSON表示出来就是一个字符串，可以被所有语言读取，也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式，并且比XML更快，而且可以直接在Web页面中读取，非常方便。

JSON表示的对象就是标准的JavaScript语言的对象，JSON和Python内置的数据类型对应如下：

Python的json模块和pickle模块怎么使用

在文件中写入读取数据-字典

dic =&#39; {‘string1&#39;:&#39;hello&#39;}&#39; #写文件只能写入字符串 - 手动把字典变成字符串
f = open(‘hello&#39;, ‘w&#39;)
f.write(dic)

f_read = open(‘hello&#39;, ‘r&#39;)
data = f_read.read() #从文件中读出的都是字符串
data = eval(data) #提取出字符串中的字典
print(data[‘name&#39;])

json实现上述功能 - json可以在任意语言中传送数据

dic = {‘string1&#39;:&#39;hello&#39;}
data = json.dumps(dic)
print(data)
print(type(data)) #dumps()会把我们的变量变成一个json字符串
f = open(“new_hello”, “w”)
f.write(data)

json字符串和我们手动加 ’’ 变成的字符串是有区别的，它遵循json字符串规范，即字符串用双引号引起来。

dumps会把我们传入的任何数据类型变成双引号引起来的字符串

# {‘string1&#39;:&#39;hello&#39;} ---> “{“string1”:”hello”}”
# 8 ---> “8”
# ‘hello&#39; ---> ““hello”” – 被json包装后的数据内部只能有双引号
#[1, 2] ---> “[1, 2]”

我们在存储或传输的时候把数据转换成json字符串，可以实现任何语言通用

f_read = open(“new_hello”, “r”)
data = json.loads(f_read.read()) #这个data直接就是字典类型
print(data)
print(type(data))

json模块中的方法

json.dumps() # 把数据包装成json字符串 – 序列化
json.loads() # 从json字符串中提取出原来的数据 – 反序列化

我们在python中将一个列表 l = [1, 2, 3] 包装成一个json字符串并存储或发送出去，假如我们在C语言中使用json解析，就会得到C语言中对应的数据结构，提取出来就是一个数组buf[3] = {1, 2, 3}。

并不是说dumps和loads必须要一块用，只要是符合json规范的json字符串都可以用loads处理提取数据结构，和用不用dumps没关系。

json.dump(data, f) #转换成json字符串并写入文件
#相当于 data = json.dumps(dic) + f.write(data)
data = json.load(f) #先读取文件，再提取出数据
#相当于data = json.loads(f_read.read())

示例：

#----------------------------序列化
import json
dic={&#39;name&#39;:&#39;alvin&#39;,&#39;age&#39;:23,&#39;sex&#39;:&#39;male&#39;}
print(type(dic))#<class &#39;dict&#39;>
j=json.dumps(dic)
print(type(j))#<class &#39;str&#39;>
f=open(&#39;序列化对象&#39;,&#39;w&#39;)
f.write(j)  #-------------------等价于json.dump(dic,f)
f.close()

#-----------------------------反序列化<br>
import json
f=open(&#39;序列化对象&#39;)
data=json.loads(f.read())#  等价于data=json.load(f)

注意：

import json
#dct="{&#39;1&#39;:111}"#json 不认单引号
#dct=str({"1":111})#报错,因为生成的数据还是单引号:{&#39;one&#39;: 1}
dct=&#39;{"1":"111"}&#39;
print(json.loads(dct))

无论数据是怎样创建的，只要满足json格式，就可以json.loads出来，不一定非要dumps的数据才能loads。

pickle模块

Pickle的问题和所有其他编程语言特有的序列化问题一样，就是它只能用于Python，并且可能不同版本的Python彼此都不兼容，因此，只能用Pickle保存那些不重要的数据，不能成功地反序列化也没关系。

##----------------------------序列化
import pickle
dic={&#39;name&#39;:&#39;alvin&#39;,&#39;age&#39;:23,&#39;sex&#39;:&#39;male&#39;}
print(type(dic))#<class &#39;dict&#39;>
j=pickle.dumps(dic)
print(type(j))#<class &#39;bytes&#39;>
f=open(&#39;序列化对象_pickle&#39;,&#39;wb&#39;)#注意是w是写入str,wb是写入bytes,j是&#39;bytes&#39;
f.write(j)  #-------------------等价于pickle.dump(dic,f)
f.close()

#-------------------------反序列化
import pickle
f=open(&#39;序列化对象_pickle&#39;,&#39;rb&#39;)
data=pickle.loads(f.read())#  等价于data=pickle.load(f)
print(data[&#39;age&#39;])

pickle和json的用法是一样的，二者学名都叫序列化，只不过json序列化之后的结果是字符串，pickle序列化后的结果是字节bytes。也就是说形式不同，内容是一样的，但是，pickle序列化后的是bytes，也就是要写入文件的数据是bytes，所以open打开文件的时候要以wb的形式二进制打开。pickle写入文件的内容是不可读的（乱七八糟的字符，但是计算机可以识别），json写入的数据是可读的。pickle支持的数据类型更多，pickle可以序列化函数和类。虽然json不支持这两种序列化，但是大部分场景还是用json。

以上就是Python的json模块和pickle模块怎么使用的详细内容，更多请关注其它相关文章！