久久久蜜桃91直播,日本所有在线a网站

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案

創(chuàng)新互聯(lián)Python教程：python中如何將亂碼解碼

中文編碼問題一直是程序員頭疼的問題，而Python2中的字符編碼足矣令新手抓狂。本文將盡量用通俗的語言帶大家徹底的了解字符編碼

成都創(chuàng)新互聯(lián)是專業(yè)的清河網(wǎng)站建設(shè)公司，清河接單;提供成都做網(wǎng)站、成都網(wǎng)站設(shè)計,網(wǎng)頁設(shè)計,網(wǎng)站設(shè)計,建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進行清河網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團隊,希望更多企業(yè)前來合作!

以及Python2和3中的各種編碼問題。

一、什么是字符編碼。

要徹底解決字符編碼的問題就不能不去了解到底什么是字符編碼。計算機從本質(zhì)上來說只認識二進制中的0和1，可以說任何數(shù)據(jù)在計算機

中實際的物理表現(xiàn)形式也就是0和1，如果你將硬盤拆開，你是看不到所謂的數(shù)字0和1的，你能看到的只是一塊光滑閃亮的磁盤，如果你

用足夠大的放大鏡你就能看到磁盤的表面有著無數(shù)的凹凸不平的元件，凹下去的代表0，突出的代表1，這就是計算機用來表現(xiàn)二進制的方

式。

1.ASCII

現(xiàn)在我們面臨了第一個問題：如何讓人類語言，比如英文被計算機理解？我們以英文為例，英文中有英文字母（大小寫）、標(biāo)點符號、特

殊符號。如果我們將這些字母與符號給予固定的編號，然后將這些編號轉(zhuǎn)變?yōu)槎M制，那么計算機明顯就能夠正確讀取這些符號，同時通

過這些編號，計算機也能夠?qū)⒍M制轉(zhuǎn)化為編號對應(yīng)的字符再顯示給人類去閱讀。由此產(chǎn)生了我們最熟知的ASCII碼。ASCII 碼使用指定

的7 位或8 位二進制數(shù)組合來表示128 或256 種可能的字符。這樣在大部分情況下，英文與二進制的轉(zhuǎn)換就變得容易多了。

2.GB2312

然而，雖然計算機是美國人發(fā)明的，但是全世界的人都在使用計算機?，F(xiàn)在出現(xiàn)了另一個問題：如何讓中文被計算機理解？這下麻煩了，

中文不像拉丁語系是由固定的字母排列組成的。ASCII 碼顯然沒辦法解決這個問題，為了解決這個問題中國國家標(biāo)準總局1980年發(fā)布《信

息交換用漢字編碼字符集》提出了GB2312編碼，用于解決漢字處理的問題。1995年又頒布了《漢字編碼擴展規(guī)范》（GBK）。GBK與

GB 2312—1980國家標(biāo)準所對應(yīng)的內(nèi)碼標(biāo)準兼容，同時在字匯一級支持ISO/IEC10646—1和GB 13000—1的全部中、日、韓（CJK）漢

字，共計20902字。這樣我們就解決了計算機處理漢字的問題了。

3.Unicode

現(xiàn)在英文和中文問題被解決了，但新的問題又出現(xiàn)了。全球有那么多的國家不僅有英文、中文還有阿拉伯語、西班牙語、日語、韓語等

等。難不成每種語言都做一種編碼？基于這種情況一種新的編碼誕生了：Unicode。Unicode又被稱為統(tǒng)一碼、萬國碼；它為每種語言中

的每個字符設(shè)定了統(tǒng)一并且唯一的二進制編碼，以滿足跨語言、跨平臺進行文本轉(zhuǎn)換、處理的要求。Unicode支持歐洲、非洲、中東、亞

洲（包括統(tǒng)一標(biāo)準的東亞象形漢字和韓國表音文字）。這樣不管你使用的是英文或者中文，日語或者韓語，在Unicode編碼中都有收錄，

且對應(yīng)唯一的二進制編碼。這樣大家都開心了，只要大家都用Unicode編碼，那就不存在這些轉(zhuǎn)碼的問題了，什么樣的字符都能夠解析

了。

4.UTF-8

但是，由于Unicode收錄了更多的字符，可想而知它的解析效率相比ASCII碼和GB2312的速度要大大降低，而且由于Unicode通過增加一

個高字節(jié)對ISO Latin-1字符集進行擴展，當(dāng)這些高字節(jié)位為0時，低字節(jié)就是ISO Latin-1字符。對可以用ASCII表示的字符使用Unicode

并不高效，因為Unicode比ASCII占用大一倍的空間，而對ASCII來說高字節(jié)的0對他毫無用處。為了解決這個問題，就出現(xiàn)了一些中間格

式的字符集，他們被稱為通用轉(zhuǎn)換格式，即UTF（Unicode Transformation Format）。而我們最常用的UTF-8就是這些轉(zhuǎn)換格式中的一

種。在這里我們不去研究UTF-8到底是如何提高效率的，你只需要知道他們之間的關(guān)系即可。

總結(jié)：

1.為了處理英文字符，產(chǎn)生了ASCII碼。
2.為了處理中文字符，產(chǎn)生了GB2312。
3.為了處理各國字符，產(chǎn)生了Unicode。
4.為了提高Unicode存儲和傳輸性能，產(chǎn)生了UTF-8，它是Unicode的一種實現(xiàn)形式。

新聞標(biāo)題：創(chuàng)新互聯(lián)Python教程：python中如何將亂碼解碼
文章出自：http://m.5511xx.com/article/ccosjdo.html

日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

新聞中心

其他資訊