正文

vb字符串使用了三种字符集 2005-09-20 22:20:00

【评论】 【打印】 【字体: 】 本文链接:http://blog.pfan.cn/iamben250/5062.html

分享到:

vb字符串使用了三种字符集:ANSI、DBCS 和 Unicode
Unicode 和 ANSI/DBCS 之间的差别如下:

ANSI
ANSI 是个人计算机使用得最普遍的字符集。由于 ANSI 标准使用单一字节表示每个字符,因此最多只能有 256 个字符和标点符号代码。虽然对英语来说已经足够了,但不能完全支持其它语言。

DBCS
发行在亚洲大部分地区的 Microsoft Windows 系统使用 DBCS。它支持很多不同的东亚语言字母,如汉语、日语和朝鲜语。DBCS 使用数字 0–128 表示 ASCII 字符集。其它大于 128 的数字作为前导字节字符,它并不是真正的字符,只是简单的表明下一个字符属于非拉丁字符集。在 DBCS 中,ASCII 字符的长度是一个字节,而汉语、日语、朝鲜语和其它东亚字符的长度是 2 个字节。
其汉字的编码方法参看我发的“汉字编码原理”,里面的“国家标准汉字机内码”就是DBCS字符集。

Unicode
Unicode 是用两个字节表示每个字符的字符编码方案。国际标准组织 (ISO) 几乎为每种语言的每个字符和符号在 0 到 65,535 (216 – 1) 范围内定义了一个数字(再加上为将来发展保留的一些空余空间)。在所有 32 位版本的 Windows 中,部件对象模型 (COM) 都使用 Unicode,它是 OLE 和 ActiveX 技术的基础。Windows NT 全部支持 Unicode。虽然 Unicode 和 DBCS 都是双字节字符,但它们的编码方案完全不同。
至于汉字的Unicode编码原理,我目前还没有找到这方面的资料,如果那位朋友有,希望能发上来与大家共享,谢谢!!!

阅读(5069) | 评论(0)


版权声明:编程爱好者网站为此博客服务提供商,如本文牵涉到版权问题,编程爱好者网站不承担相关责任,如有版权问题请直接与本文作者联系解决。谢谢!

评论

暂无评论
您需要登录后才能评论,请 登录 或者 注册