APP開發(fā)字符集的使用與它們各自的特點有哪些?字節(jié)序在開發(fā)APP時會遇到字符顯示及與服務器間傳輸字符的情況,尤其是中文字符和一些特殊字符,會涉及字符編碼的處理,深圳APP開發(fā)公司下面對字符編碼做個簡單的介紹。
APP開發(fā)關于字符集作用
1.ASCII及其擴展字符集作用:英語及西歐語言。
位數(shù):ASCII是用7位表示的,能表示128個字符;其擴展使用8位表示,表示256個字符。
范圍:ASCII從00到7F,擴展從00到FF。
2.ISO-8859-1字符集作用:擴展ASCII,表示西歐和希臘語等。
位數(shù):1個字節(jié)。
范圍:從00到FF,兼容ASCII字符集。
3.GB2312字符集作用:國家簡體中文字符集,兼容ASCII。
位數(shù):2個字節(jié)。
范圍:高字節(jié)從A1到F7,低字節(jié)從A1到FE。將高字節(jié)和低字節(jié)分別
加上0XA0即可得到編碼。
4.BIG5字符集作用:統(tǒng)一繁體字編碼。
位數(shù):2個字節(jié)。
范圍:高字節(jié)從A1到F9,低字節(jié)從40到7E,A1到FE。
5.GBK字符集作用:它是GB2312的擴展,加入對繁體字的支持,兼容GB2312。
位數(shù):2個字節(jié)。
范圍:高字節(jié)從81到FE,低字節(jié)從40到FE。
6.GB18030字符集
作用:它解決了中文、日文和朝鮮語等的編碼,兼容GBK。
位數(shù):采用變長字節(jié)表示字符(1字節(jié)、2字節(jié)和4字節(jié))。
范圍:1字節(jié)從00到7F;2字節(jié)高字節(jié)從81到FE,低字節(jié)從40到7E和80到FE;4字節(jié)中第一、三字節(jié)從81到FE,第二、四字節(jié)從30到39。
7.UCS字符集作用:國際標準ISO10646定義了通用字符集(UniversalCharacterSet)。它是與UNICODE同類的組織,UCS-2和UNICODE兼容。
位數(shù):有UCS-2和UCS-4兩種格式,分別是2字節(jié)和4字節(jié)。
范圍:目前,UCS-4只是在UCS-2前面加了0×0000。
8.UNICODE字符集作用:為世界650種語言進行統(tǒng)一編碼,兼容ISO-8859-1。
位數(shù):UNICODE字符集有多個編碼方式,分別是UTF-8、UTF-16和UTF-32。
APP開發(fā)關于字符編碼淺析
1.UTF-8采用變長字節(jié)表示字符,最多可用到6個字節(jié)。
2.UTF-16采用2字節(jié),Unicode中不同部分的字符同樣基于現(xiàn)有的標準,這是為了便于轉換。從0×0000到0×007F是ASCII字符,從0×0080到0×00FF是ISO-8859-1對ASCII的擴展。希臘字母表使用從0×0370到0×03FF的代碼,斯拉夫語使用從
0×0400到0×04FF的代碼,美國使用從0×0530到0×058F的代碼,希伯來語使用從0×0590到0×05FF的代碼。中國、日本和韓國的象形文字(總稱為CJK)占用了從0×3000到0×9FFF的代碼;由于0×00在C語言及操作系統(tǒng)文件名中有特殊意義,很多情況下需要UTF-8編碼保存文本,去掉這個0×00。舉例如下:UTF-16:0×0080=0000000010000000UTF-8:0xC280=1100001010000000UTF-32:采用4字節(jié)。
3.UTF-8、UTF-16和UTF-32的優(yōu)缺點UTF-8、UTF-16和UTF-32都可以表示有效編碼空間(U+000000~U+10FFFF)內的所有Unicode字符。使用UTF-8編碼時ASCII字符只占1個字節(jié),存儲效率比較高,適用于拉丁字符較多的場合以節(jié)省空間。
對于大多數(shù)非拉丁字符(如中文和日文)來說,UTF-16所需存儲空間最小,每個字符只占2個字節(jié)。采用UTF-16和UTF-32會有BigEndian和LittleEndian之分,而UTF-8則沒有字節(jié)順序問題,所以UTF-8適合傳輸和通信。UTF-32采用4字節(jié)編碼,一方面處理速度比較快,但另一方面也浪費了大量空間,影響傳輸速度,因而很少使用。好了,APP開發(fā)公司本文關于“APP開發(fā)字符集的使用與它們各自的特點有哪些?”的知識就分享到這里,謝謝關注,博納網(wǎng)絡編輯整理。