1樓:育知同創教育
java語言所使用的字符集是16位unicode編碼。另外再介紹一些常見的字符集:
1、最早在dos下寫pascal的時候,就遇到ascii字符集,後來還是dos下寫c,也是ascii字符集
特點:目前最通用的單位元組編碼字符集
表示:單位元組
最早ascii用7bit表示,總共能表示2^7=128個字元,後來擴充套件到8bit,就表示2^8=256個字元
2、gb2312又稱為gb2312-80字符集,全稱為《資訊交換用漢字編碼字符集·基本集》,由原中國國家標準總局釋出,2023年5月1日實施。
特點:當然是能表示99%的中國漢字,還包括拉丁字母、日文假名、希臘字母、俄文字母、漢語拼音符號、漢語注音字母等
表示:雙位元組
3、gbk是漢字編碼標準之一,全稱《漢字內碼擴充套件規範》,gbk 向下與gb2312編碼相容,向上支援iso10646.1國際標準。可以認為gbk是在gb2313基礎上通過內碼擴充套件出來的一個標準。
特點:完全相容gb2312標準,支援國際標準iso/iec10646-1和國家標準gb13000-1中的全部中日韓漢字,幷包含了big5編碼中的所有漢字
表示:雙位元組
4、big5,臺灣那邊使用比較多。
5、gb 18030,全稱是gb18030-2000《資訊交換用漢字編碼字符集基本集的擴充》,是我國**於2023年3月17日釋出的新的漢字編碼國家標準,2023年8月31日後在中國市場上釋出的軟體必須符合本標準。
特點:就是強大。覆蓋中文、日文、朝鮮語和中國少數民族文字。
滿足中國大陸、香港、臺灣、日本和韓國等東亞地區資訊交換多文種、大字量、多用途、統一編碼格式的要求。並且與unicode 3.0版本相容,填補unicode擴充套件字元字彙「統一漢字擴充套件a」的內容。
並且與以前的國家字元編碼標準(gb2312,gb13000.1)相容。
表示:單位元組、雙位元組、四位元組三種方式
6、unicode野心更大(當然有一個國際統一標準當然是好事)
特點:unicode是一種在計算機上使用的字元編碼。它為每種語言中的每個字元設定了統一併且唯一的二進位制編碼,以滿足跨語言、跨平臺進行文字轉換、處理的要求。
表示:utf-8,utf-16,utf-32
這裡可能有點不好理解,舉個例子
首先,把unicode理解成對所有字元做了一個統一的編號,比如:「字」這個字元,編號是23383,這個是unicode定義的
但是,在計算機中,如何儲存這個編號呢?方式就有很多,儲存unicode的方式,就是utf-8,utf-16,utf-32
23383數值的16進製表示:0x5b57
utf-8用3個位元組來表示漢字,所以utf-8的表示為:0xe5ad97
utf-16用2個位元組來表示漢字,所以utf-16的表示為:0x5b57 剛好和數值是一樣的
utf-32用4個位元組來表示漢字,所以utf-32的表示為:0x00005b57 和數值是一樣的,不過浪費空間
7、再來講講utf-8,它是一種變長的字符集
表示:單位元組來表示字母,雙位元組來表示一些希臘字母,三位元組來表示漢字,當然也有四位元組的
這麼做當然會增加表示和識別的難度,不過,可以節省空間。這也是為什麼utf-8在網路編碼中流行的原因。
轉義字元什麼時候用,java中什麼時候使用轉義字元?
一般在輸出時使用,因為c語言自帶的庫函式不能直接輸出某些特殊的字元,因此需要轉義字元,所以一般在使用printf等函式時,使用轉義字元 與 java中什麼時候使用轉義字元 一,先來看看轉義字元的概念 通過 來轉變後面字母或符號的含義。意思就是改變字母本身的含義。舉一些例子 b 退格 n 換行 t 製...
java是什麼語言,java語言是什麼?
java是sun公司推出的一種程式語言 三道能搜到鬧死都按時濃度 java語言是什麼?java是一門物件導向程式語言,不僅吸收了c 語言的各種優點,還摒棄了c 裡難以理解的多繼承 指標等概念,因此java語言具有功能強大和簡單易用兩個特徵。java語言作為靜態物件導向程式語言的代表,極好地實現了物件...
C語言字串問題,C語言中,字串是什麼?
這迴圈需要執行4次,對應的字元就是0001,也就是說這個sc需要5個空間,加一個 0 for i 0 i 2.你這個程式每次執行的結果可能是不確定的,因為你沒有初始化sc陣列,printf以字串的形式輸出,他是遇到 0 字元才結束的,所以為了保證程式的結果是一致的,建議初始化陣列。sc 5 這樣就可...