json
--- JSON 編碼和解碼器?
源代碼: Lib/json/__init__.py
JSON (JavaScript Object Notation), specified by RFC 7159 (which obsoletes RFC 4627) and by ECMA-404, is a lightweight data interchange format inspired by JavaScript object literal syntax (although it is not a strict subset of JavaScript 1 ).
json
提供了與標(biāo)準庫 marshal
和 pickle
相似的API接口。
對基本的 Python 對象層次結(jié)構(gòu)進行編碼:
>>> import json
>>> json.dumps(['foo', {'bar': ('baz', None, 1.0, 2)}])
'["foo", {"bar": ["baz", null, 1.0, 2]}]'
>>> print(json.dumps("\"foo\bar"))
"\"foo\bar"
>>> print(json.dumps('\u1234'))
"\u1234"
>>> print(json.dumps('\\'))
"\\"
>>> print(json.dumps({"c": 0, "b": 0, "a": 0}, sort_keys=True))
{"a": 0, "b": 0, "c": 0}
>>> from io import StringIO
>>> io = StringIO()
>>> json.dump(['streaming API'], io)
>>> io.getvalue()
'["streaming API"]'
緊湊編碼:
>>> import json
>>> json.dumps([1, 2, 3, {'4': 5, '6': 7}], separators=(',', ':'))
'[1,2,3,{"4":5,"6":7}]'
美化輸出:
>>> import json
>>> print(json.dumps({'4': 5, '6': 7}, sort_keys=True, indent=4))
{
"4": 5,
"6": 7
}
JSON解碼:
>>> import json
>>> json.loads('["foo", {"bar":["baz", null, 1.0, 2]}]')
['foo', {'bar': ['baz', None, 1.0, 2]}]
>>> json.loads('"\\"foo\\bar"')
'"foo\x08ar'
>>> from io import StringIO
>>> io = StringIO('["streaming API"]')
>>> json.load(io)
['streaming API']
特殊 JSON 對象解碼:
>>> import json
>>> def as_complex(dct):
... if '__complex__' in dct:
... return complex(dct['real'], dct['imag'])
... return dct
...
>>> json.loads('{"__complex__": true, "real": 1, "imag": 2}',
... object_hook=as_complex)
(1+2j)
>>> import decimal
>>> json.loads('1.1', parse_float=decimal.Decimal)
Decimal('1.1')
擴展 JSONEncoder
:
>>> import json
>>> class ComplexEncoder(json.JSONEncoder):
... def default(self, obj):
... if isinstance(obj, complex):
... return [obj.real, obj.imag]
... # Let the base class default method raise the TypeError
... return json.JSONEncoder.default(self, obj)
...
>>> json.dumps(2 + 1j, cls=ComplexEncoder)
'[2.0, 1.0]'
>>> ComplexEncoder().encode(2 + 1j)
'[2.0, 1.0]'
>>> list(ComplexEncoder().iterencode(2 + 1j))
['[2.0', ', 1.0', ']']
從命令行使用 json.tool
來驗證并美化輸出:
$ echo '{"json":"obj"}' | python -m json.tool
{
"json": "obj"
}
$ echo '{1.2:3.4}' | python -m json.tool
Expecting property name enclosed in double quotes: line 1 column 2 (char 1)
詳細文檔請參見 命令行界面。
備注
JSON 是 YAML 1.2 的一個子集。由該模塊的默認設(shè)置生成的 JSON (尤其是默認的 “分隔符” 設(shè)置值)也是 YAML 1.0 and 1.1 的一個子集。因此該模塊也能夠用于序列化為 YAML。
備注
這個模塊的編碼器和解碼器默認保護輸入和輸出的順序。僅當(dāng)?shù)讓拥娜萜魑磁判驎r才會失去順序。
基本使用?
- json.dump(obj, fp, *, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)?
使用這個 轉(zhuǎn)換表 將 obj 序列化為 JSON 格式化流形式的 fp (支持
.write()
的 file-like object)。如果 skipkeys 是 true (默認為
False
),那么那些不是基本對象(包括str
,int
、float
、bool
、None
)的字典的鍵會被跳過;否則引發(fā)一個TypeError
。json
模塊始終產(chǎn)生str
對象而非bytes
對象。因此,fp.write()
必須支持str
輸入。如果 ensure_ascii 是 true (即默認值),輸出保證將所有輸入的非 ASCII 字符轉(zhuǎn)義。如果 ensure_ascii 是 false,這些字符會原樣輸出。
If check_circular is false (default:
True
), then the circular reference check for container types will be skipped and a circular reference will result in aRecursionError
(or worse).如果 allow_nan 是 false(默認為
True
),那么在對嚴格 JSON 規(guī)格范圍外的float
類型值(nan
、inf
和-inf
)進行序列化時會引發(fā)一個ValueError
。如果 allow_nan 是 true,則使用它們的 JavaScript 等價形式(NaN
、Infinity
和-Infinity
)。如果 indent 是一個非負整數(shù)或者字符串,那么 JSON 數(shù)組元素和對象成員會被美化輸出為該值指定的縮進等級。 如果縮進等級為零、負數(shù)或者
""
,則只會添加換行符。None
(默認值) 選擇最緊湊的表達。 使用一個正整數(shù)會讓每一層縮進同樣數(shù)量的空格。 如果 indent 是一個字符串 (比如"\t"
),那個字符串會被用于縮進每一層。在 3.2 版更改: 現(xiàn)允許使用字符串作為 indent 而不再僅僅是整數(shù)。
當(dāng)被指定時,separators 應(yīng)當(dāng)是一個
(item_separator, key_separator)
元組。當(dāng) indent 為None
時,默認值取(', ', ': ')
,否則取(',', ': ')
。為了得到最緊湊的 JSON 表達式,你應(yīng)該指定其為(',', ':')
以消除空白字符。在 3.4 版更改: 現(xiàn)當(dāng) indent 不是
None
時,采用(',', ': ')
作為默認值。當(dāng) default 被指定時,其應(yīng)該是一個函數(shù),每當(dāng)某個對象無法被序列化時它會被調(diào)用。它應(yīng)該返回該對象的一個可以被 JSON 編碼的版本或者引發(fā)一個
TypeError
。如果沒有被指定,則會直接引發(fā)TypeError
。如果 sort_keys 是 true(默認為
False
),那么字典的輸出會以鍵的順序排序。為了使用一個自定義的
JSONEncoder
子類(比如:覆蓋了default()
方法來序列化額外的類型), 通過 cls 關(guān)鍵字參數(shù)來指定;否則將使用JSONEncoder
。在 3.6 版更改: 所有可選形參現(xiàn)在都是 僅限關(guān)鍵字參數(shù)。
- json.dumps(obj, *, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)?
使用這個 轉(zhuǎn)換表 將 obj 序列化為 JSON 格式的
str
。 其參數(shù)的含義與dump()
中的相同。備注
JSON 中的鍵-值對中的鍵永遠是
str
類型的。當(dāng)一個對象被轉(zhuǎn)化為 JSON 時,字典中所有的鍵都會被強制轉(zhuǎn)換為字符串。這所造成的結(jié)果是字典被轉(zhuǎn)換為 JSON 然后轉(zhuǎn)換回字典時可能和原來的不相等。換句話說,如果 x 具有非字符串的鍵,則有loads(dumps(x)) != x
。
- json.load(fp, *, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)?
使用這個 轉(zhuǎn)換表 將 fp (一個支持
.read()
并包含一個 JSON 文檔的 text file 或者 binary file) 反序列化為一個 Python 對象。object_hook 是一個可選的函數(shù),它會被調(diào)用于每一個解碼出的對象字面量(即一個
dict
)。object_hook 的返回值會取代原本的dict
。這一特性能夠被用于實現(xiàn)自定義解碼器(如 JSON-RPC 的類型提示)。object_pairs_hook 是一個可選的函數(shù),它會被調(diào)用于每一個有序列表對解碼出的對象字面量。 object_pairs_hook 的返回值將會取代原本的
dict
。這一特性能夠被用于實現(xiàn)自定義解碼器。如果 object_hook 也被定義, object_pairs_hook 優(yōu)先。在 3.1 版更改: 添加了對 object_pairs_hook 的支持。
parse_float ,如果指定,將與每個要解碼 JSON 浮點數(shù)的字符串一同調(diào)用。默認狀態(tài)下,相當(dāng)于
float(num_str)
??梢杂糜趯?JSON 浮點數(shù)使用其它數(shù)據(jù)類型和語法分析程序 (比如decimal.Decimal
)。parse_int ,如果指定,將與每個要解碼 JSON 整數(shù)的字符串一同調(diào)用。默認狀態(tài)下,相當(dāng)于
int(num_str)
??梢杂糜趯?JSON 整數(shù)使用其它數(shù)據(jù)類型和語法分析程序 (比如float
)。parse_constant ,如果指定,將要與以下字符串中的一個一同調(diào)用:
'-Infinity'
,'Infinity'
,'NaN'
。如果遇到無效的 JSON 數(shù)字則可以使用它引發(fā)異常。在 3.1 版更改: parse_constant 不再調(diào)用 'null' , 'true' , 'false' 。
要使用自定義的
JSONDecoder
子類,用cls
指定他;否則使用JSONDecoder
。額外的關(guān)鍵詞參數(shù)會通過類的構(gòu)造函數(shù)傳遞。如果反序列化的數(shù)據(jù)不是有效 JSON 文檔,引發(fā)
JSONDecodeError
錯誤。在 3.6 版更改: 所有可選形參現(xiàn)在都是 僅限關(guān)鍵字參數(shù)。
在 3.6 版更改: fp 現(xiàn)在可以是 binary file 。輸入編碼應(yīng)當(dāng)是 UTF-8 , UTF-16 或者 UTF-32 。
- json.loads(s, *, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)?
使用這個 轉(zhuǎn)換表 將 s (一個包含 JSON 文檔的
str
,bytes
或bytearray
實例) 反序列化為 Python 對象。其他參數(shù)的含義與
load()
中的相同。如果反序列化的數(shù)據(jù)不是有效 JSON 文檔,引發(fā)
JSONDecodeError
錯誤。在 3.9 版更改: 關(guān)鍵字參數(shù) encoding 已被移除。
編碼器和解碼器?
- class json.JSONDecoder(*, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, strict=True, object_pairs_hook=None)?
簡單的JSON解碼器。
默認情況下,解碼執(zhí)行以下翻譯:
JSON
Python
object -- 對象
dict
array
list -- 列表
string
str
number (int)
int
number (real)
float
true
True
false
False
null
None
它還將“NaN”、“Infinity”和“-Infinity”理解為它們對應(yīng)的“float”值,這超出了JSON規(guī)范。
如果指定了 object_hook,它將被調(diào)用并傳入每個已解碼 JSON 對象的結(jié)果,并且其返回值將被用來替代給定的
dict
。 它可被用于提供自定義的反序列化操作(例如支持 JSON-RPC 類提示)。如果指定了 object_pairs_hook 則它將被調(diào)用并傳入以對照值有序列表進行解碼的每個 JSON 對象的結(jié)果。 object_pairs_hook 的結(jié)果值將被用來替代
dict
。 這一特性可被用于實現(xiàn)自定義解碼器。 如果還定義了 object_hook,則 object_pairs_hook 的優(yōu)先級更高。在 3.1 版更改: 添加了對 object_pairs_hook 的支持。
parse_float ,如果指定,將與每個要解碼 JSON 浮點數(shù)的字符串一同調(diào)用。默認狀態(tài)下,相當(dāng)于
float(num_str)
。可以用于對 JSON 浮點數(shù)使用其它數(shù)據(jù)類型和語法分析程序 (比如decimal.Decimal
)。parse_int ,如果指定,將與每個要解碼 JSON 整數(shù)的字符串一同調(diào)用。默認狀態(tài)下,相當(dāng)于
int(num_str)
。可以用于對 JSON 整數(shù)使用其它數(shù)據(jù)類型和語法分析程序 (比如float
)。parse_constant ,如果指定,將要與以下字符串中的一個一同調(diào)用:
'-Infinity'
,'Infinity'
,'NaN'
。如果遇到無效的 JSON 數(shù)字則可以使用它引發(fā)異常。如果 strict 為 false (默認為
True
),那么控制字符將被允許在字符串內(nèi)。在此上下文中的控制字符編碼在范圍 0--31 內(nèi)的字符,包括'\t'
(制表符),'\n'
,'\r'
和'\0'
。如果反序列化的數(shù)據(jù)不是有效 JSON 文檔,引發(fā)
JSONDecodeError
錯誤。在 3.6 版更改: 所有形參現(xiàn)在都是 僅限關(guān)鍵字參數(shù)。
- decode(s)?
返回 s 的 Python 表示形式(包含一個 JSON 文檔的
str
實例)。如果給定的 JSON 文檔無效則將引發(fā)
JSONDecodeError
。
- class json.JSONEncoder(*, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, sort_keys=False, indent=None, separators=None, default=None)?
用于Python數(shù)據(jù)結(jié)構(gòu)的可擴展JSON編碼器。
默認支持以下對象和類型:
Python
JSON
dict
object -- 對象
list, tuple
array
str
string
int, float, int 和 float 派生的枚舉
number
True
true
False
false
None
null
在 3.4 版更改: 添加了對 int 和 float 派生的枚舉類的支持
為了將其拓展至識別其他對象,需要子類化并實現(xiàn)
default()
方法于另一種返回o
的可序列化對象的方法如果可行,否則它應(yīng)該調(diào)用超類實現(xiàn)(來引發(fā)TypeError
)。如果 skipkeys 為假值(默認),則當(dāng)嘗試對非
str
,int
,float
或None
的鍵進行編碼時將會引發(fā)TypeError
。 如果 skipkeys 為真值,這些條目將被直接跳過。如果 ensure_ascii 是 true (即默認值),輸出保證將所有輸入的非 ASCII 字符轉(zhuǎn)義。如果 ensure_ascii 是 false,這些字符會原樣輸出。
If check_circular is true (the default), then lists, dicts, and custom encoded objects will be checked for circular references during encoding to prevent an infinite recursion (which would cause a
RecursionError
). Otherwise, no such check takes place.如果 allow_nan 為 true (默認),那么
NaN
,Infinity
,和-Infinity
進行編碼。此行為不符合 JSON 規(guī)范,但與大多數(shù)的基于 Javascript 的編碼器和解碼器一致。否則,它將是一個ValueError
來編碼這些浮點數(shù)。如果 sort_keys 為 true (默認為:
False
),那么字典的輸出是按照鍵排序;這對回歸測試很有用,以確保可以每天比較 JSON 序列化。如果 indent 是一個非負整數(shù)或者字符串,那么 JSON 數(shù)組元素和對象成員會被美化輸出為該值指定的縮進等級。 如果縮進等級為零、負數(shù)或者
""
,則只會添加換行符。None
(默認值) 選擇最緊湊的表達。 使用一個正整數(shù)會讓每一層縮進同樣數(shù)量的空格。 如果 indent 是一個字符串 (比如"\t"
),那個字符串會被用于縮進每一層。在 3.2 版更改: 現(xiàn)允許使用字符串作為 indent 而不再僅僅是整數(shù)。
當(dāng)被指定時,separators 應(yīng)當(dāng)是一個
(item_separator, key_separator)
元組。當(dāng) indent 為None
時,默認值取(', ', ': ')
,否則取(',', ': ')
。為了得到最緊湊的 JSON 表達式,你應(yīng)該指定其為(',', ':')
以消除空白字符。在 3.4 版更改: 現(xiàn)當(dāng) indent 不是
None
時,采用(',', ': ')
作為默認值。當(dāng) default 被指定時,其應(yīng)該是一個函數(shù),每當(dāng)某個對象無法被序列化時它會被調(diào)用。它應(yīng)該返回該對象的一個可以被 JSON 編碼的版本或者引發(fā)一個
TypeError
。如果沒有被指定,則會直接引發(fā)TypeError
。在 3.6 版更改: 所有形參現(xiàn)在都是 僅限關(guān)鍵字參數(shù)。
- default(o)?
在子類中實現(xiàn)這種方法使其返回 o 的可序列化對象,或者調(diào)用基礎(chǔ)實現(xiàn)(引發(fā)
TypeError
)。例如,為了支持任意的迭代器,你可以這樣來實現(xiàn)
default()
:def default(self, o): try: iterable = iter(o) except TypeError: pass else: return list(iterable) # Let the base class default method raise the TypeError return json.JSONEncoder.default(self, o)
- encode(o)?
返回 Python o 數(shù)據(jù)結(jié)構(gòu)的 JSON 字符串表達方式。例如:
>>> json.JSONEncoder().encode({"foo": ["bar", "baz"]}) '{"foo": ["bar", "baz"]}'
- iterencode(o)?
編碼給定對象 o ,并且讓每個可用的字符串表達方式。例如:
for chunk in json.JSONEncoder().iterencode(bigobject): mysocket.write(chunk)
異常?
標(biāo)準符合性和互操作性?
The JSON format is specified by RFC 7159 and by
ECMA-404.
This section details this module's level of compliance with the RFC.
For simplicity, JSONEncoder
and JSONDecoder
subclasses, and
parameters other than those explicitly mentioned, are not considered.
此模塊不嚴格遵循于 RFC ,它實現(xiàn)了一些擴展是有效的 Javascript 但不是有效的 JSON。尤其是:
無限和 NaN 數(shù)值是被接受并輸出;
對象內(nèi)的重復(fù)名稱是接受的,并且僅使用最后一對屬性-值對的值。
自從 RFC 允許符合 RFC 的語法分析程序接收 不符合 RFC 的輸入文本以來,這個模塊的解串器在默認狀態(tài)下默認符合 RFC 。
字符編碼?
RFC 要求使用 UTF-8 , UTF-16 ,或 UTF-32 之一來表示 JSON ,為了最大互通性推薦使用 UTF-8 。
RFC允許,盡管不是必須的,這個模塊的序列化默認設(shè)置為 ensure_ascii=True ,這樣消除輸出以便結(jié)果字符串至容納 ASCII 字符。
ensure_ascii 參數(shù)以外,此模塊是嚴格的按照在 Python 對象和 Unicode strings
間的轉(zhuǎn)換定義的,并且因此不能直接解決字符編碼的問題。
RFC 禁止添加字符順序標(biāo)記( BOM )在 JSON 文本的開頭,這個模塊的序列化器不添加 BOM 標(biāo)記在它的輸出上。 RFC,準許 JSON 反序列化器忽略它們輸入中的初始 BOM 標(biāo)記,但不要求。此模塊的反序列化器引發(fā) ValueError
當(dāng)存在初始 BOM 標(biāo)記。
RFC 不會明確禁止包含字節(jié)序列的 JSON 字符串這不對應(yīng)有效的 Unicode 字符(比如 不成對的 UTF-16 的替代物),但是它確實指出它們可能會導(dǎo)致互操作性問題。默認下,模塊對這樣的序列接受和輸出(當(dāng)在原始 str
存在時)代碼點。
Infinite 和 NaN 數(shù)值?
RFC 不允許 infinite 或者 NaN 數(shù)值的表達方式。盡管這樣,默認情況下,此模塊接受并且輸出 Infinity
, -Infinity
,和 NaN
好像它們是有效的JSON數(shù)字字面值
>>> # Neither of these calls raises an exception, but the results are not valid JSON
>>> json.dumps(float('-inf'))
'-Infinity'
>>> json.dumps(float('nan'))
'NaN'
>>> # Same when deserializing
>>> json.loads('-Infinity')
-inf
>>> json.loads('NaN')
nan
序列化器中, allow_nan 參數(shù)可用于替代這個行為。反序列化器中, parse_constant 參數(shù),可用于替代這個行為。
對象中的重復(fù)名稱?
RFC 具體說明了 在 JSON對象里的名字應(yīng)該是唯一的,但沒有規(guī)定如何處理JSON對象中的重復(fù)名稱。默認下,此模塊不引發(fā)異常;作為替代,對于給定名它將忽略除姓-值對之外的所有對:
>>> weird_json = '{"x": 1, "x": 2, "x": 3}'
>>> json.loads(weird_json)
{'x': 3}
The object_pairs_hook parameter can be used to alter this behavior.
頂級非對象,非數(shù)組值?
過時的 RFC 4627 指定的舊版本 JSON 要求 JSON 文本頂級值必須是 JSON 對象或數(shù)組( Python dict
或 list
),并且不能是 JSON null 值,布爾值,數(shù)值或者字符串值。 RFC 7159 移除這個限制,此模塊沒有并且從未在序列化器和反序列化器中實現(xiàn)這個限制。
無論如何,為了最大化地獲取互操作性,你可能希望自己遵守該原則。
實現(xiàn)限制?
一些 JSON 反序列化器的實現(xiàn)應(yīng)該在以下方面做出限制:
可接受的 JSON 文本大小
嵌套 JSON 對象和數(shù)組的最高水平
JSON 數(shù)字的范圍和精度
JSON 字符串的內(nèi)容和最大長度
此模塊不強制執(zhí)行任何上述限制,除了相關(guān)的 Python 數(shù)據(jù)類型本身或者 Python 解釋器本身的限制以外。
當(dāng)序列化為 JSON ,在應(yīng)用中當(dāng)心此類限制這可能破壞你的 JSON 。特別是,通常將 JSON 數(shù)字反序列化為 IEEE 754 雙精度數(shù)字,從而受到該表示方式的范圍和精度限制。這是特別相關(guān)的,當(dāng)序列化非常大的 Python int
值時,或者當(dāng)序列化 "exotic" 數(shù)值類型的實例時比如 decimal.Decimal
。
命令行界面?
源代碼: Lib/json/tool.py
The json.tool
module provides a simple command line interface to validate
and pretty-print JSON objects.
如果未指定可選的 infile
和 outfile
參數(shù),則將分別使用 sys.stdin
和 sys.stdout
:
$ echo '{"json": "obj"}' | python -m json.tool
{
"json": "obj"
}
$ echo '{1.2:3.4}' | python -m json.tool
Expecting property name enclosed in double quotes: line 1 column 2 (char 1)
在 3.5 版更改: 輸出現(xiàn)在將與輸入順序保持一致。 請使用 --sort-keys
選項來將輸出按照鍵的字母順序排序。
命令行選項?
- infile?
要被驗證或美化打印的 JSON 文件:
$ python -m json.tool mp_films.json [ { "title": "And Now for Something Completely Different", "year": 1971 }, { "title": "Monty Python and the Holy Grail", "year": 1975 } ]
如果 infile 未指定,則從
sys.stdin
讀取。
- outfile?
將 infile 輸出寫入到給定的 outfile。 在其他情況下寫入到
sys.stdout
。
- --sort-keys?
將字典輸出按照鍵的字母順序排序。
3.5 新版功能.
- --no-ensure-ascii?
禁用非 ASCII 字符的轉(zhuǎn)義,詳情參見
json.dumps()
。3.9 新版功能.
- --json-lines?
將每個輸入行解析為單獨的 JSON 對象。
3.8 新版功能.
- --indent, --tab, --no-indent, --compact?
用于空白符控制的互斥選項。
3.9 新版功能.
- -h, --help?
顯示幫助消息。
備注
- 1
正如 RFC 7159 的勘誤表 所說明的,JSON 允許以字符串表示字面值字符 U+2028 (LINE SEPARATOR) 和 U+2029 (PARAGRAPH SEPARATOR),而 JavaScript (在 ECMAScript 5.1 版中) 不允許。