華文網

一個漢字為什麼占倆字元?Twitter支援的280字元微博早就支援了

Twitter日前宣佈正式將發文長度限制擴大到280個字元,並且已經從9月份開始向少量用戶測試新功能。

作為混跡於互聯網多年的中國網友們,經常會看到這樣的資訊“一個漢字相當於兩個英文字元”,不知道朋友們有沒有想過這到底是為什麼?

要瞭解這個問題,我們還需要首先說到電腦語言。大家都知道電腦語言是0和1的組合,

所以電腦的進制是二進位。電腦的最小存儲單位就是位元組(Byte),1個位元組8位元二進位,根據數學上的排列組合可以知道一共有2*2*2*2*2*2*2*2=256種組合,足以對應英文的大小寫字母、數位及部分符號。

而中文漢字數量較多,《現代漢語常用字表》公佈的就有3500個漢字,

顯然如此數量在一個位元組8位元二進位下無法實現一一對應,此時用兩個位元組8位元二進位就有65536種組合,足以對應所有的漢字。

(日韓文一個字占兩字元原理同漢字,實際上,一個Unicode可以排完中日韓文所有常用字。)