您的位置:首页 > 数据库 > Oracle

Linux下oracle插入(导入)中文记录显示为问号问题及解决办法

2011-05-22 19:59 796 查看
Blog Transferred to: http://www.kanhua.org

字符集

oracle官方关于字符集和NLS_LANG的解答:http://www.oracle.com/technology/tech/globalization/htdocs/nls_lang%20faq.htm

首先要明确什么是字符集?字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包括关系,如us7ascii就是zhs16gbk的子集,从us7ascii到zhs16gbk不会有数据解释上的问题,不会有数据丢失,Oracle对这种问题也要求从子集到超集的导出受支持,反之不行。在所有的字符集中utf8应该是最大,因为它基于unicode,双字节保存字符(也因此在存储空间上占用更多),。

其次,一旦数据库创建后,数据库的字符集是不能改变的。因此,在设计和安装之初考虑使用哪一种字符集是十分重要的。数据库字符集应该是操作系统本地字符集的一个超集。存取数据库的客户使用的字符集将决定选择哪一个超集,即数据库字符集应该是所有客户字符集的超集。

nls_lang变量:

Windows下:在系统的环境变量里和注册表里可以找到进行设置

Linux下:在oracle用户下的.bash_profile文件里进行设置

NLS_LANG格式:

NLS_LANG = language_territory.charset

有三个组成部分(语言、地域和字符集),每个成分控制了NLS子集的特性。其中:language 指定服务器消息的语言。

territory 指定服务器的日期和数字格式。

charset 指定字符集

例如:

AMERICAN _ AMERICA. ZHS16GBK

linux系统语言:

/etc/sysconfig/i18n

在Red hat下面/etc/sysconfig/i18n的每一行都是什么意思?

LANG="zh_CN.GB18030"

SUPPORTED="zh_CN.GB18030:zh_CN:zh:en_US.UTF-8:en_US:en"

SYSFONT="latarcyrheb-sun16"

/etc/sysconfig/i18n 这里存放的是系统的区域语言设置, i18n是 国际化internationalization的缩写 i和n之间正好18个字母

第一行 表明你当前系统的语言环境变量设置 ,这里是 zh_CN.GB18030

第二行 表明系统预置了那些语言支持 ,不在项目中的语言不能正常显示

第三行 定义控制台终端字体,你文本登录的时候显示的字体就是这个 latarcyrheb-sun16

在导入导出oracle数据时,必须将客户端和oracle服务器的字符集设置成一致,否则导入数据库的中文字符很可能是乱码而无法正确显示,然后设置正确的环境变量,然后还要设置操作系统的语言设置,即设置i18n,下面是在服务器上我实验例子:

建立表test

SQL> create table test(id number(2),name char(12));

Table created.

然后插入第一条记录:

SQL> insert into test values(1,'张三');

1 row created.

然后查看:

SQL> select * from test;

ID NAME

---------- ------------

1 ????

中文显示为???

在服务器上查看数据库服务器字符集

SQL> select userenv('language') from dual;

USERENV('LANGUAGE')

----------------------------------------------------

AMERICAN_AMERICA.ZHS16GBK

如果是从客户端插入或者导入数据必须将客户端的nls_lang变量设置成与服务器一致,这里需将客户端设置库:

AMERICAN_AMERICA.ZHS16GBK

查看oracle服务器的nls_lang变量值:

[oracle@oradb ~]$ echo $NLS_LANG

AMERICAN

修改nls_name变量值为:AMERICAN_AMERICA.ZHS16GBK

然后重新登录再做查询:

SQL> select * from test;

ID NAME

---------- ------------

1 ????

还是问号,做插入测试:

SQL> insert into test values(2,'李四');

1 row created.

SQL> select * from test;

ID NAME

---------- ------------

1 ????
2 ????

检查i18n文件:

vi /etc/sysconfig/i18n

LANG="en_US.UTF-8"

SUPPORTED="zh_CN.UTF-8:zh_CN:zh:en_US.UTF-8:en_US:en"

SYSFONT="latarcyrheb-sun16"

将lang的值修改库中文字符集,下面是网上比较全的一个i18n文件设置:

(关键)

LANG="zh_CN.gb2312"

SUPPORTED="zh_CN.GB18030:zh_CN:zh:zh_CN.GB2312:zh_CN:zh:zh_CN.gbk:zh_CN:zh:zh_HK.UTF-8:zh_HK:zh:zh_CN.UTF-8:zh_CN:zh:zh_TW.UTF-8:zh_TW:zh:en_US.UTF-8:en_US:en"

SYSFONT="latarcyrheb-sun16"

修改后重新登录oracle,然后进行查询:

SQL> select * from test;
ID NAME

---------- ------------

1 ????
2 ????
还是无法正确显示,现在做插入测试:

SQL> insert into test values(3,'王五');
1 row created
SQL> select * from test;
        SQL> select * from test;
ID NAME

---------- ------------

1 ????
2 ????

3 王五

OK,现在看到刚插入的可以正常显示了,但是之前的还是无法显示,之前插入的记录由于无法进行正确的转换,即使修

总结:

就三步:

1:数据库编码的字符集(查询 :select userenv('language') from dual;

2:客户端编码的字符集   oracle  修改.bash_profile 文件。(操作如上)

3:系统的显示编码字符集

[/code]
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: