内码带来的麻烦

| No Comments | No TrackBacks

中文有许多编码格式。
一直以为UNICODE同UTF-8是一回事,今天在ACCESS数据库提取一段文本后,在网页中显示时出现了问题。
用ACCESS打开数据库,中文文本显示无误,但是在网页中显示的就是乱码。
检查原始数据,中文的编码是WINDOWS UNICODE,网页输出的编码设为UTF-8。
显然UNICODE和UTF-8不是一回事,在搜索之后发现。
实际上WINDOWS中的UNICODE是UTF-16,而且我的这个原始中文数据是UTF-16 little Endian编码的。

为了转换内码,找到了ConvertZ这个软件,绿色,好用。
我是从PcHome下载的。5.7版。

后来在ALF'S HOME看到了最新的7.40版

下载后,解压缩,直接运行即可,支持简体,繁体和英文界面,多达10多种内码之间的转换。

上面的中文原始数据,在用ConvertZ转换成UTF-8内码之后,再放入ACCESS数据库之内,网页的显示,就正常了。

相关资料:
汉字编码及相关问题(unicode,ansi,gb2312)
Unicode 筆記 Unicode note
unicode官方网站


作者: David Yin
原载: FreeThinking
版权所有。转载时必须以链接形式注明作者和及本声明。

No TrackBacks

TrackBack URL: http://www.yinfor.com/mtcgi/mt-t-1102.cgi/619

Leave a comment

About this Entry

This page contains a single entry by David Yin published on 2005年5月 8日 01:36.

英文谚语大全 was the previous entry in this blog.

纪念邓丽君 is the next entry in this blog.

Find recent content on the main index or look in the archives to find all content.

Archives

Online Tools

Code Convertor
GeoURL
Listed on BlogShares