您的位置：首页 > 数据库 > Oracle

《Oracle大型数据库在AIX UNIX上的实战详解》的集中答疑九数据库字符集与国家语言字符集的关系

2010-01-06 21:00 561 查看

陆续收到若干同行来邮件，讨论关于数据库字符集和国家语言字符集之间的关系。这里我提出自己的看法。本文后面的内容部分来自网上关于Sybase ASE的一篇技术文摘，但下载日久，难分谁之作品，这里借用一下，如果正好是您的，您来信告诉我，我转告大家！

该文为Sybase ASE所作，但对于Oracle道理相同，值得借鉴！

1：什么是字符集？
字符集是字符(包含字母，数字，符号和非打印字符等)以及所指定的内码所组成的特定的集合。通常一个字符集包含一个字母表中的字符，例如拉丁字母表被使用在英语语言中，那么如果要使用拉丁字符，就要配置使用英语语言集中的特定的字符集合――拉丁语言字符集。这里为什么特指了是英语语言集呢？因为字符集是基于某种操作系统平台和某种语言集支持的。语言集的集合被称为语言组，它可能包含一种或多种语言。本地字符集是基于特定语言组中所包含的一种或多种语言支持的，在特定操作系统平台上编码的集合。

在Client/Server系统中，支持多语言的数据处理，但是所有的语言必须属于同一个语言组。例如，从下表可以看出，如果服务器中的数据用组1中的字符集，则同一数据库中可以有法语，德语，英语以及该组中的其它语言。而在这个数据库中就不能同时存储日语，法语了。

这里请注意一个非常特别的字符集—Unicode—它支持世界上超过650种语言的国际字符集。Unicode允许在同一服务器上混合使用不同语言组的不同语言。

2：字符集和排序顺序的关系？

每种字符集都有一种或多种排序顺序，Adaptive Server（包括Oracle）使用它们存储数据。排序顺序与特定的语言或语言组及特定的字符集联系密切，不同的语言对同样字符的排序是不同的，因此，需要特定语言的排序顺序，以便正确地对字符进行排序。

二进制排序顺序：对于所有字符集都至少提供一个二进制排序顺序，这一排序顺序基于字符集中分配给代表每个字符的代码(“二进制”代码)的算数值，适用于每个字符集的前128个字符和亚洲语言。当字符集支持一种以上的语言时，二进制排序顺序将会得出不正确的结果，这时就应该选择其它排序顺序了。

字典排序，区分大小写，区分重音：分别对大写和小写字母进行排序。字典排序顺序识别字母的各种重音形式，并将它们排在相关联的非重音字母之后。

字典排序，不区分大小写，区分重音：按字典顺序排序，大写字母与小写字母等同，在排序结果中大小写字母混合使用。对于避免表中名称的重复条目很有用。

字典排序，不区分大小写，区分重音，具有优先级：在排序时不区分大小写，在所有其它条件相同时，大写字母具有高的优先级(即大写字母先出现)。

字典排序，不区分大小写，不区分重音：将加重音格的字母与未加重音格的相关联字母同等对待，它在排序中混合了重音字符。

3：什么是字符集转换（Oracle的国家语言字符集）？

为保持客户端与服务器之间的数据完整性，数据必须在字符集之间进行转换，目的是跨机器和字符集使用时，确保“a”还是“a”，此过程就是字符集转换。 Oracle NLS就是如何执行转换的方式和指定。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

《Oracle大型数据库在AIX UNIX上的实战详解》的集中答疑九 数据库字符集与国家语言字符集的关系

《Oracle大型数据库在AIX UNIX上的实战详解》的集中答疑九数据库字符集与国家语言字符集的关系