WML语言的基本知识 |
|---|
| WAP技术站:www.wapease.com
|
WML语言的基本知识上一节我们介绍了WML程序的基本结构,接下来我们介绍WML语言的基本知识,主要包括WML的字符集、变量、数据类型及WML程序的基本组成部分等。 5.3.1 WML的字符集及编码WML使用XML的字符集,即通用字符集ISO/IEC-10646,也即统一字符编码标准Unicode 2.0。同时,WML还支持其他系列的字符集子集,例如UTF-8、ISO-8859-1或UCS-2等。其中: UTF-8是指通用字符集UCS(Universal Character Set)的转换格式8(Transformation Format 8),主要用作传输国际字符集的转换编码。UTF-8采用了UCS字符的8位编码,提供了十分安全的编码格式,可以有效避免数据传输过程中的窃听、截取及非法解密。同时,UTF-8与7位ASCII码完全兼容,不会影响此类编码实现的程序;它的编码规则十分严格,能够有效避免同步传输错误,而且还为支持其他字符集提供了足够的空间。 ISO-8859-1字符集是国际标准化组织ISO(International Standardization Organization)制定的ASCII字符集的扩展集,能够表示所有西欧语言的字符。与 ISO Latin-1一样,ISO-8859-1与Windows环境中普遍使用的美国国家标准协会ANSI(American National Standards Institute)的字符集极为类似,绝大多数情况下无需区分。在不特别指明的情况下,HTTP协议均使用ISO Latin-1字符集。因此,为了在WML页面中表示非ASCII(non-ASCII)字符,开发人员需要使用相应的ISO Latin-1编码的字符。 UCS-2是ISO 10646标准中定义的通用多8位编码字符集(Universal Multiple-Octet Coded Character Set)的2字节(即16位)编码标准,其字符编码值与Unicode字符的标准编码值相等。 WML文档可以采用HTML 4.0规范所定义的任何字符编码标准进行编码处理。一般说来,WML文档的字符编码时需要转换为另外的编码格式,以与WAP用户的手机浏览器所用字符标准相适应,否则,手机浏览器就无法显示WML页面中的字符。然而,编码转换时可能会丢失一些字符信息,所以,如果在用户端进行WML文档的编码转换,那么就可能导致某些结果信息丢失而不能被用户所浏览。因此,如有必要,我们应当尽量在 |
| 上一篇:WML程序的基本结构 下一篇:WML字符使用基本规则 |
