python中可以使用chardet模塊檢測(cè)字符串/文件編碼。
1、chardet下載與安裝
下載地址:http://pypi.python.org/pypi/chardet
下載chardet后,解壓chardet壓縮包,直接將chardet文件夾放在應(yīng)用程序目錄下,就可以使用importchardet開(kāi)始使用chardet了,也可以將chardet拷貝到Python系統(tǒng)目錄下,這樣你所有的python程序只要用importchardet就可以了。
pythonsetup.pyinstall
使用中,chardet.detect()返回字典,其中confidence是檢測(cè)精確度,encoding是編碼形式。
示例:
網(wǎng)頁(yè)編碼判斷:
>>>importurllib
>>>rawdata=urllib.urlopen('http://www.google.cn/').read()
>>>importchardet
>>>chardet.detect(rawdata)
{'confidence':0.98999999999999999,'encoding':'GB2312'}
文件編碼判斷
importchardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#這里試著換成read(5)也可以,但是換成readlines()后報(bào)錯(cuò)
enc=chardet.detect(ff)
printenc['encoding']
tt.close()
以上內(nèi)容為大家介紹了python如何查看編碼,希望對(duì)大家有所幫助,如果想要了解更多Python相關(guān)知識(shí),請(qǐng)關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。