汉字编码范围见第二节:码位分配及顺序,并有所补充,共收录汉字和图形符号21886个。 · ˉ ˇ ¨ 〃 々 — ~ ‖ … ‘ ’ B “ ” 〔 〕 〈 〉 《 》 「 」 『 』 〖 〗 【 】 C ± × ÷ ∶ ∧ ∨ ∑ ∏ ∪ ∩ ∈ ∷ √ ⊥ ∥ ∠ D ⌒ ⊙ ∫ ∮ ≡ ≌ ≈ ∽ ∝ ≠ ≮ ≯ ≤ ≥ ∞ ∵ E ∴ ♂ ♀ ° ′ ″ ℃ $ ¤ ¢ £ ‰ § № ☆ ★ F ○ ● ◎ ◇ ◆ □ ■ △ ▲ ※ → ← ↑ ↓ 〓 A2 0 1 2 3 4 5 6 7 8 9 A B C D E F 4 5 6 7 8 9 A ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ B ⒈ ⒉ ⒊ ⒋ ⒌ ⒍ ⒎ ⒏ ⒐ ⒑ ⒒ ⒓ ⒔ ⒕ ⒖ C ⒗ ⒘ ⒙ ⒚ ⒛ ⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽ ⑾ D ⑿ ⒀ ⒁ ⒂ ⒃ ⒄ ⒅ ⒆ ⒇ ① ② ③ ④ ⑤ ⑥ ⑦ E ⑧ ⑨ ⑩ ㈠ ㈡ ㈢ ㈣ ㈤ ㈥ ㈦ ㈧ ㈨ ㈩ F Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ Ⅺ Ⅻ A3 0 1 2 3 4 5 6 7 8 9 A B C D E F 4 5 6 7 8 9 A ! " # ¥ % & ' ( ) * + 。 故 GBK 亦不收),其编码范围:8140-FEFE,尾字节在 40-FE 之间。 在 GBK 码位上暂安放旧字形,其中汉字(包括部首和构件)21003 个, 第(3)区尽管对用户开放, 全部编码分为三大部分: 1. 汉字区,按原顺序排列。 这一版的GBK规范为1.0版, 4. 非汉字符号的字形,图形符号 883 个, 若要查询具体字符的编码请前往:汉字字符集编码查询。 共23940个码位,总体编码范围为 8140-FEFE,在许多情况下 GBK 收入了同一汉字的新旧两种字形。 一、字汇 GBK 规范收录了 ISO 10646.1 中的全部 CJK 汉字和符号, 9. GB 12345 增补的 19 个竖排标点符号(GB 12345 较 GB 2312 增补竖排标点符号 29 个。 具体包括: 1. GB 2312 中的全部汉字、非汉字符号, 2. 在 CJK 汉字认同规则的总框架内,BIG-5 非汉字符号、结构符和“〇”排列在此区,但限制使用, 3. 对于超出 CJK 汉字认同规则的、或认同规则尚未明确规定的汉字,收录 GB 2312 汉字 6763 个。 按《康熙字典》的页码/字位排列,CJK 汉字在前, 5. 带声调的拼音字母取半角形式, 5. 13 个汉字结构符,与 GB 13000.1 保持一致,收录 CJK 汉字和增补的汉字 8160 个。 (1) AAA1-AFFE,码位 658 个,并包含了BIG5编码中的所有汉字。 因为不排除未来在此区域增补新字符的可能性,对所有的 GBK 编码汉字实施“无重码正形”(“GB 化”);即在不造成重码的前提下,尽量采用中国新字形, GBK编码范围:8140-FEFE,还有 10 个小写罗马数字和 GB 12345 增补的符号,图形符号883个,包括: (1) GBK/3: 8140-A0FE, 7. GB 12345 增补的 6 个拼音符号,因此完全兼容GB2312-80标准。 按 UCS 代码大小排列;增补的汉字(包括部首和构件)在后, 8. 汉字“〇”, 三、字形 GBK 对字形作了如下的规定: 1. 原则上与 GB 13000.1 G列(即源自中国大陆法定标准的汉字)下的字形/笔形保持一致。 其中除 GB 2312 的符号外,收录 GB 13000.1 中的 CJK 汉字 6080 个,以上合计 20902 个 GB 化汉字, GBK 编码表 全国信息技术标准化技术委员会 汉字内码扩展规范(GBK) Chinese Internal Code Specification 1.0 版 (按编码顺序排列) 81 0 1 2 3 4 5 6 7 8 9 A B C D E F 4 丂 丄 丅 丆 丏 丒 丗 丟 丠 両 丣 並 丩 丮 丯 丱 5 丳 丵 丷 丼 乀 乁 乂 乄 乆 乊 乑 乕 |