字符集识别

HTML文件的基本结构

字符集识别 Character Set Recognition

Microsoft® Internet Explorer 使用文档中指定的字符集决定如何将文档中的字节翻译为在屏幕上或打印纸上可读的字符。缺省情况下,Internet Explorer 将使用服务器返回的 HTTP 内容类型中指定的字符集来决定此翻译。若此参数未给出,Internet Explorer 将使用文档中的 meta 元素指定的字符集。若未指定 meta 元素则使用用户参数。

你可以使用 meta 元素明确设定文档的字符集。在这种情况下,设置 HTTP-EQUIV 标签属性为 Content-Type 并在 CONTENT 标签属性中指定字符集标识符。

要为整个文档应用字符集,你必须在 body 元素前插入 meta 元素。为明确器件,该元素应该是 head 之后的第一个元素,这样所有浏览器就都可以在文档处理前翻译 meta 元素。meta 元素应用到包含该元素的文档。这意味着,组合文档(由两个或更多文档组成框架的文档)可以在不同的框架中使用不同的字符集。

下面的标格包含了关于 Internet Explorer 5 支持的字符集的信息,以及下列信息。

  • 字符集友好名称 ─ 用于引用字符集的名称。
  • 首选字符集标签 ─ 在 Internet Explorer 中用于设置字符集的最普通标识符。这些标识符用于外部数据。
  • 别名 ─ 可用于设置此字符集的其它标识符。这些标识符用于内部数据。
  • IE 版本 ─ 支持所列字符集的 Internet Explorer 版本。
  • 最低 OS ─ 支持所列字符集的最低操作系统版本。
  • 代码页 ─ 支持列出字符集的代码页。
  • 家族代码页 ─ 表明用于代表字符集中所有或大多数字符的 Microsoft Windows® 代码页。

Microsoft Internet Explorer 5 中的字符集
CharsetFriendlyName
字符集友好名称
Preferred Charset Label
首选字符集标签
Aliases
别名
IE Ver
IE版本
Min OS
最低OS
CodePage
代码页
FamilyCodePage
家族代码页
阿拉伯(ASMO 708) ASMO-708   IE5 Win95 708 1256
阿拉伯(DOS) DOS-720   IE5 Win95 720 1256
阿拉伯(ISO) iso-8859-6 arabic, csISOLatinArabic, ECMA-114, ISO_8859-6, ISO_8859-6:1987, iso-ir-127 IE5, IE4 Win95 28596 1256
阿拉伯(Mac) x-mac-arabic   IE5 Win2000 10004 1256
阿拉伯(Windows) windows-1256 cp1256 IE5 Win95 1256 1256
波罗的语(DOS) ibm775 CP500 IE5 Win2000 775 1257
波罗的语(ISO) iso-8859-4 csISOLatin4, ISO_8859-4, ISO_8859-4:1988, iso-ir-110, l4, latin4 IE5 Win95 28594 1257
波罗的语(Windows) windows-1257   IE5 Win95 1257 1257
中欧(DOS) ibm852 cp852 IE5, IE4 Win95 852 1250
中欧(ISO) iso-8859-2 csISOLatin2, iso_8859-2, iso_8859-2:1987, iso8859-2, iso-ir-101, l2, latin2 IE5, IE4 Win95 28592 1250
中欧(Mac) x-mac-ce   IE5 Win2000 10029 1250
中欧(Windows) windows-1250 x-cp1250 IE5 Win95 1250 1250
简体中文(EUC) EUC-CN x-euc-cn IE5 Win2000 51936 936
简体中文(GB2312) gb2312 chinese, CN-GB, csGB2312, csGB231280, csISO58GB231280, GB_2312-80, GB231280, GB2312-80, GBK, iso-ir-58 IE5, IE4 Win95 936 936
简体中文(HZ) hz-gb-2312   IE5, IE4 Win95 52936 936
简体中文(Mac) x-mac-chinesesimp   IE5 Win2000 10008 936
繁体中文(Big5) big5 cn-big5, csbig5, x-x-big5 IE5, IE4 Win95 950 950
繁体中文(CNS) x-Chinese-CNS   IE5 Win2000 20000 950
繁体中文(Eten) x-Chinese-Eten   IE5 Win2000 20002 950
繁体中文(Mac) x-mac-chinesetrad   IE5 Win2000 10002 950
西里尔语(DOS) cp866 ibm866 IE5, IE4 Win95 866 1251
西里尔语(ISO) iso-8859-5 csISOLatin5, csISOLatinCyrillic, cyrillic, ISO_8859-5, ISO_8859-5:1988, iso-ir-144, l5 IE5, IE4 Win95 28595 1251
西里尔语(KOI8-R) koi8-r csKOI8R, koi, koi8, koi8r IE5, IE4 Win95 20866 1251
西里尔语(KOI8-U) koi8-u koi8-ru IE5 Win95 21866 1251
西里尔语(Mac) x-mac-cyrillic   IE5 Win2000 10007 1251
西里尔语(Windows) windows-1251 x-cp1251 IE5 Win95 1251 1251
欧罗巴 x-Europa   IE5 n.a. 29001 1252
德语(IA5) x-IA5-German   IE5 Win2000 20106 1252
希腊语(DOS) ibm737   IE5 Win2000 737 1253
希腊语(ISO) iso-8859-7 csISOLatinGreek, ECMA-118, ELOT_928, greek, greek8, ISO_8859-7, ISO_8859-7:1987, iso-ir-126 IE5, IE4 Win95 28597 1253
希腊语(Mac) x-mac-greek   IE5 Win2000 10006 1253
希腊语(Windows) windows-1253   IE5 Win95 1253 1253
希腊语, 现代(DOS) ibm869   IE5 Win2000 869 1253
希伯莱语(DOS) DOS-862   IE5 Win95 862 1255
希伯莱语(ISO-Logical) iso-8859-8-i logical IE5, IE4 Win95 38598 1255
希伯莱语(ISO-Visual) iso-8859-8 csISOLatinHebrew, hebrew, ISO_8859-8, ISO_8859-8:1988, ISO-8859-8, iso-ir-138, visual IE5, IE4 Win95 28598 1255
希伯莱语(Mac) x-mac-hebrew   IE5 Win2000 10005 1255
希伯莱语(Windows) windows-1255 ISO_8859-8-I, ISO-8859-8, visual IE5 Win95 1255 1255
IBM EBCDIC(阿拉伯) x-EBCDIC-Arabic   IE5 Win2000 20420 1256
IBM EBCDIC(西里尔俄语) x-EBCDIC-CyrillicRussian   IE5 Win2000 20880 1251
IBM EBCDIC(西里尔塞尔维亚-保加利亚) x-EBCDIC-CyrillicSerbianBulgarian   IE5 Win2000 21025 1251
IBM EBCDIC(丹麦-挪威) x-EBCDIC-DenmarkNorway   IE5 Win2000 20277 1252
IBM EBCDIC(丹麦-挪威-欧洲) x-ebcdic-denmarknorway-euro   IE5 Win2000 1142 1252
IBM EBCDIC(芬兰-瑞典) x-EBCDIC-FinlandSweden   IE5 Win2000 20278 1252
IBM EBCDIC(芬兰-瑞典-欧洲) x-ebcdic-finlandsweden-euro   IE5 Win2000 1143 1252
IBM EBCDIC(芬兰-瑞典-欧洲) x-ebcdic-finlandsweden-euro X-EBCDIC-France IE5 Win2000 1143 1252
IBM EBCDIC(法国-欧洲) x-ebcdic-france-euro   IE5 Win2000 1147 1252
IBM EBCDIC(德语) x-EBCDIC-Germany   IE5 Win2000 20273 1252
IBM EBCDIC(德语-欧洲) x-ebcdic-germany-euro   IE5 Win2000 1141 1252
IBM EBCDIC(希腊语现代) x-EBCDIC-GreekModern   IE5 Win2000 875 1253
IBM EBCDIC(希腊语) x-EBCDIC-Greek   IE5 Win2000 20423 1253
IBM EBCDIC(希伯莱语) x-EBCDIC-Hebrew   IE5 Win2000 20424 1255
IBM EBCDIC(冰岛) x-EBCDIC-Icelandic   IE5 Win2000 20871 1252
IBM EBCDIC(冰岛-欧洲) x-ebcdic-icelandic-euro   IE5 Win2000 1149 1252
IBM EBCDIC(国际-欧洲) x-ebcdic-international-euro   IE5 Win2000 1148 1252
IBM EBCDIC(意大利) x-EBCDIC-Italy   IE5 Win2000 20280 1252
IBM EBCDIC(意大利-欧洲) x-ebcdic-italy-euro   IE5 Win2000 1144 1252
IBM EBCDIC(日语和日语片假名) x-EBCDIC-JapaneseAndKana   IE5 Win2000 50930 932
IBM EBCDIC(日语和日本-拉丁) x-EBCDIC-JapaneseAndJapaneseLatin   IE5 Win2000 50939 932
IBM EBCDIC(日语和美国-加拿大) x-EBCDIC-JapaneseAndUSCanada   IE5 Win2000 50931 932
IBM EBCDIC(日语片假名) x-EBCDIC-JapaneseKatakana   IE5 Win2000 20290 932
IBM EBCDIC(朝鲜语和朝鲜语扩展) x-EBCDIC-KoreanAndKoreanExtended   IE5 Win2000 50933 949
IBM EBCDIC(朝鲜语扩展) x-EBCDIC-KoreanExtended   IE5 Win2000 20833 949
IBM EBCDIC(多语种拉丁-2) CP870   IE5 Win2000 870 1250
IBM EBCDIC(简体中文) x-EBCDIC-SimplifiedChinese   IE5 Win2000 50935 936
IBM EBCDIC(西班牙) X-EBCDIC-Spain   IE5 Win2000 20284 1252
IBM EBCDIC(西班牙-欧洲) x-ebcdic-spain-euro   IE5 Win2000 1145 1252
IBM EBCDIC(泰语) x-EBCDIC-Thai   IE5 Win2000 20838 874
IBM EBCDIC(繁体中文) x-EBCDIC-TraditionalChinese   IE5 Win2000 50937 950
IBM EBCDIC(土耳其语拉丁-5) CP1026   IE5 Win2000 1026 1254
IBM EBCDIC(土耳其语) x-EBCDIC-Turkish   IE5 Win2000 20905 1254
IBM EBCDIC(英国) x-EBCDIC-UK   IE5 Win2000 20285 1252
IBM EBCDIC(英国-欧洲) x-ebcdic-uk-euro   IE5 Win2000 1146 1252
IBM EBCDIC(美国-加拿大) ebcdic-cp-us   IE5 Win2000 37 1252
IBM EBCDIC(美国-加拿大-欧洲) x-ebcdic-cp-us-euro   IE5 Win2000 1140 1252
冰岛语(DOS) ibm861   IE5 Win2000 861 1252
冰岛语(Mac) x-mac-icelandic   IE5 Win2000 10079 1252
ISCII 阿萨姆语 x-iscii-as   IE5 Win2000 57006 57006
ISCII 孟加拉语 x-iscii-be   IE5 Win2000 57003 57003
ISCII 梵文 x-iscii-de   IE5 Win2000 57002 57002
ISCII 瓜西拉 x-iscii-gu   IE5 Win2000 57010 57010
ISCII 埃纳德语 x-iscii-ka   IE5 Win2000 57008 57008
ISCII 马来西亚语 x-iscii-ma   IE5 Win2000 57009 57009
ISCII 奥里雅 x-iscii-or   IE5 Win2000 57007 57007
ISCII 旁遮普语 x-iscii-pa   IE5 Win2000 57011 57011
ISCII 泰米尔语 x-iscii-ta   IE5 Win2000 57004 57004
ISCII 泰卢固语 x-iscii-te   IE5 Win2000 57005 57005
日语(EUC) euc-jp csEUCPkdFmtJapanese, Extended_UNIX_Code_Packed_Format_for_Japanese, x-euc, x-euc-jp IE5, IE4 Win95 51932 932
日语(JIS) iso-2022-jp   IE5, IE4 Win95 50220 932
日语(JIS-允许 1 字节假名 - SO/SI) iso-2022-jp _iso-2022-jp$SIO IE5 Win95 50222 932
日语(JIS-允许 1 字节假名) csISO2022JP _iso-2022-jp IE5 Win95 50221 932
日语(Mac) x-mac-japanese   IE5 Win2000 10001 932
日语(Shift-JIS) shift_jis csShiftJIS, csWindows31J, ms_Kanji, shift-jis, x-ms-cp932, x-sjis IE5, IE4 Win95 932 932
朝鲜语 ks_c_5601-1987 csKSC56011987, euc-kr, iso-ir-149, korean, ks_c_5601, ks_c_5601_1987, ks_c_5601-1989, KSC_5601, KSC5601 IE5 Win95 949 949
朝鲜语(EUC) euc-kr csEUCKR IE5 Win95 51949 949
朝鲜语(ISO) iso-2022-kr csISO2022KR IE5 Win95 50225 949
朝鲜语(Johab) Johab   IE5 Win2000 1361 1361
朝鲜语(Mac) x-mac-korean   IE5 Win2000 10003 949
拉丁语 3(ISO) iso-8859-3 csISO, Latin3, ISO_8859-3, ISO_8859-3:1988, iso-ir-109, l3, latin3 IE5, IE4 Win95 28593 1254
拉丁语 9(ISO) iso-8859-15 csISO, Latin9, ISO_8859-15, l9, latin9 IE5 Win95 28605 1252
挪威语(IA5) x-IA5-Norwegian   IE5 Win2000 20108 1252
OEM 美国 IBM437 437, cp437, csPC8, CodePage437 IE5 Win2000 437 1252
瑞典语(IA5) x-IA5-Swedish   IE5 Win2000 20107 1252
泰语(Windows) windows-874 DOS-874, iso-8859-11, TIS-620 IE5, IE4 Win95 874 874
土耳其语(DOS) ibm857   IE5 Win2000 857 1254
土耳其语(ISO) iso-8859-9 csISO, Latin5, ISO_8859-9, ISO_8859-9:1989, iso-ir-148, l5, latin5 IE5 Win95 28599 1254
土耳其语(Mac) x-mac-turkish   IE5 Win2000 10081 1254
土耳其语(Windows) windows-1254 ISO_8859-9, ISO_8859-9:1989, iso-8859-9, iso-ir-148, latin5 IE5 Win95 1254 1254
Unicode unicode utf-16 IE5, IE4 Win95 1200 1200
Unicode(Big-Endian) unicodeFFFE   IE5, IE4 Win95 1201 1200
Unicode(UTF-7) utf-7 csUnicode11UTF7, unicode-1-1-utf-7, x-unicode-2-0-utf-7 IE5, IE4 Win95 65000 1200
Unicode(UTF-8) utf-8 unicode-1-1-utf-8, unicode-2-0-utf-8, x-unicode-2-0-utf-8 IE5, IE4 Win95 65001 1200
US-ASCII us-ascii ANSI_X3.4-1968, ANSI_X3.4-1986, ascii, cp367, csASCII, IBM367, ISO_646.irv:1991, ISO646-US, iso-ir-6us IE5 Win95 20127 1252
越南语(Windows) windows-1258   IE5, IE4 Win95 1258 1258
西欧(DOS) ibm850   IE5 Win2000 850 1252
西欧(IA5) x-IA5   IE5 Win2000 20105 1252
西欧(ISO) iso-8859-1 cp819, csISO, Latin1, ibm819, iso_8859-1, iso_8859-1:1987, iso8859-1, iso-ir-100, l1, latin1 IE5 Win95 28591 1252
西欧(Mac) macintosh   IE5 Win2000 10000 1252
西欧(Windows) Windows-1252 ANSI_X3.4-1968, ANSI_X3.4-1986, ascii, cp367, cp819, csASCII, IBM367, ibm819, ISO_646.irv:1991, iso_8859-1, iso_8859-1:1987, ISO646-US, iso8859-1, iso-8859-1, iso-ir-100, iso-ir-6, latin1, us, us-ascii, x-ansi IE5 Win95 1252 1252

回顶端↑


不用于常规的内部字符集

下列字符集不用于常规用途,所以不要用它们标识文档。
字符集友好名称首选字符集标签别名IE 版本最低 OS代码页家族代码页
用户定义的 x-user-defined   IE5, IE4 Win95 50000 50000
日语(自动选择)     IE5, IE4 Win95 50932 932
自动选择     IE5 Win95 50001 50001
朝鲜语(自动选择)     IE5, IE4 Win95 50949 949