日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關(guān)咨詢(xún)
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時(shí)間:8:30-17:00
你可能遇到了下面的問(wèn)題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷(xiāo)解決方案
創(chuàng)新互聯(lián)Python教程:一文帶你了解編碼集

成都創(chuàng)新互聯(lián)長(zhǎng)期為近1000家客戶(hù)提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊(duì)從業(yè)經(jīng)驗(yàn)10年,關(guān)注不同地域、不同群體,并針對(duì)不同對(duì)象提供差異化的產(chǎn)品和服務(wù);打造開(kāi)放共贏平臺(tái),與合作伙伴共同營(yíng)造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為昌邑企業(yè)提供專(zhuān)業(yè)的做網(wǎng)站、成都網(wǎng)站制作,昌邑網(wǎng)站改版等技術(shù)服務(wù)。擁有十載豐富建站經(jīng)驗(yàn)和眾多成功案例,為您定制開(kāi)發(fā)。

編碼集

1. ASCII編碼:

127個(gè)字母 8個(gè)數(shù)據(jù)位足夠存儲(chǔ)字母、數(shù)字、符號(hào),支持到0x7F。

2. GB2312編碼  

每個(gè)漢字占據(jù)2個(gè)字節(jié)(高位和低位),16個(gè)數(shù)據(jù)。GB2312是對(duì)ASCII的中文擴(kuò)展,共包含7000多個(gè)漢字。是計(jì)算機(jī)發(fā)展到中國(guó)后發(fā)展起來(lái)的編碼,檢測(cè)高位和低位,如果同時(shí)大于0x7F,則認(rèn)為是GB2312,否則認(rèn)為是ASCII編碼。

相關(guān)推薦:《Python視頻教程》

3. GBK(1995)和GB18030(2005/2000)

每個(gè)漢字占據(jù)2個(gè)字節(jié),由于漢字的數(shù)量太大,GB2312不能滿(mǎn)足需求。GBK包括了GB2312的所有內(nèi)容,

同時(shí)增加了近20000個(gè)新的漢字(包括繁體)和符號(hào) 。只要求高位大于0x7F,低位可以小于0x7F,認(rèn)為是中文。 

>  國(guó)家標(biāo)準(zhǔn)GB18030-2000《信息交換用漢字編碼字符集基本集的補(bǔ)充》是我國(guó)繼GB2312-1980和

GB13000-1993之后最重要的漢字編碼標(biāo)準(zhǔn),包含多種我國(guó)少數(shù)民族文字,其中收入漢字70000余個(gè)。

4.Unicode編碼 

> 定長(zhǎng)存儲(chǔ), 將所有語(yǔ)言都統(tǒng)一到一套編碼集,通常使用2個(gè)字節(jié),有的是4個(gè)字節(jié)。收錄很全。

分為17個(gè)面,基本面采用2個(gè)字節(jié),普通中文子也在基本面中,另外16個(gè)面是4個(gè)字節(jié)。

不兼容ASCII碼,即存儲(chǔ)的時(shí)候,對(duì)ASCII碼前面補(bǔ)0,導(dǎo)致存儲(chǔ)的數(shù)據(jù)變大。

5. utf-8---變長(zhǎng)存儲(chǔ)

> 國(guó)際標(biāo)準(zhǔn)組織(ISO)制定英文字符使用1個(gè)字節(jié),沿用原來(lái)的ASCII碼。

> 使用1~4個(gè)字節(jié)表示一個(gè)符號(hào),中文存儲(chǔ)使用3個(gè)字節(jié)(ascii碼中的內(nèi)容用1個(gè)字節(jié)保存\歐洲的字符用2個(gè)字節(jié)保存\東亞的字符用3個(gè)字節(jié)保存\特殊符號(hào)用4個(gè)字節(jié))

> Unicode是內(nèi)存編碼表示方案(規(guī)范),而utf-8是如何保存和傳輸U(kuò)nicode的方案(實(shí)現(xiàn))

> 優(yōu)點(diǎn):雖然內(nèi)存匯總的數(shù)據(jù)都是Unicode,但當(dāng)數(shù)據(jù)保存到磁盤(pán)或者用于網(wǎng)絡(luò)傳輸時(shí),使用utf-8會(huì)節(jié)省更多的流量和硬盤(pán)空間。

如何判斷幾個(gè)字節(jié)表示一個(gè)字符:

每個(gè)字節(jié)添加識(shí)別位,其中高位識(shí)別位為4位,低位識(shí)別位為2位。判斷高位字節(jié)開(kāi)頭有幾個(gè)1,可以確定共有幾個(gè)字節(jié)來(lái)表示一個(gè)字符。

6. utf-8和Unicode對(duì)應(yīng)關(guān)系

utf-8去掉識(shí)別位,變成unicode。


網(wǎng)站名稱(chēng):創(chuàng)新互聯(lián)Python教程:一文帶你了解編碼集
網(wǎng)站路徑:http://m.5511xx.com/article/dpieeeg.html