您的位置:首页 > 其它

数据表创建参数介绍

2012-06-17 15:46 141 查看
创建数据表create table是我们对数据库进行的常见操作。我们一般使用create table之后,指定了数据列信息和主键等约束信息,其他就交给Oracle使用默认值了。今天我们一起来看看这些默认值。说明:本片只关注一般数据表,临时表、聚簇、IOT等特殊类型暂时不考虑。

提取完整的DDL

首先我们需要提取出创建数据表的完整DDL语句,才能将Oracle提供的默认值们正确抽取出来。此处我们使用dbms_metadata.get_ddl方法。

//源数据抽取脚本

set serveroutput on size 10000;

set timing on;

declare

c_ddl clob;

begin

c_ddl := dbms_metadata.get_ddl('TABLE','DEPT','SCOTT');

dbms_output.put_line(c_ddl);

end;

/

//输出结果

CREATE TABLE "SCOTT"."DEPT"

( "DEPTNO" NUMBER(2,0),

"DNAME" VARCHAR2(14),

"LOC" VARCHAR2(13),

CONSTRAINT "PK_DEPT" PRIMARY KEY ("DEPTNO")

USING INDEXPCTFREE 10 INITRANS 2 MAXTRANS 255 COMPUTE STATISTICS

STORAGE(INITIAL 65536 NEXT 1048576 MINEXTENTS 1 MAXEXTENTS 2147483645

PCTINCREASE 0 FREELISTS 1 FREELIST GROUPS 1 BUFFER_POOL DEFAULT)

TABLESPACE "USERS" ENABLE

)

PCTFREE 10 PCTUSED 40 INITRANS 1 MAXTRANS 255 NOCOMPRESS LOGGING

STORAGE

(INITIAL 65536 NEXT 1048576 MINEXTENTS 1 MAXEXTENTS 2147483645

PCTINCREASE 0 FREELISTS 1 FREELIST GROUPS 1 BUFFER_POOL DEFAULT)

TABLESPACE "USERS"

上面是使用Oracle自带的源数据导出工具,对Scott用户下的数据表EMP进行提取的DDL语句。

注意:其上有两个片段(标注红色)是相似。这个要说明一下,我们建立一个数据表,在Oracle中要建立数据段data segment对象。同时,如果我们指定了主键,Oracle会自动为这个主键建立索引,索引是一种索引段index
segment对象。所以,如果在建立数据表的时候,也指定了主键primary key,那么一共会生成两个段segment对象。

下面,我们对相似的代码参数片段进行分析。

1、PCTFREE 10 PCTUSED 40 INITRANS 1 MAXTRANS 255 NOCOMPRESS LOGGING

2、STORAGE

(INITIAL 65536 NEXT 1048576 MINEXTENTS 1 MAXEXTENTS 2147483645

PCTINCREASE 0 FREELISTS 1 FREELIST GROUPS 1 BUFFER_POOL DEFAULT)

3、TABLESPACE "USERS"

代码段可以分为三个部分,下面分别进行介绍。

Part1、数据块Data Block与表属性部分

标注1部分表示是数据块结构和使用参数,以及我们的数据表在使用中的一些参数。

在Oracle中,数据库逻辑结构被划分为“表空间Tablespace、段对象Segment、分区extent和块block”。其中,block是最小的结构对象。

ü PCTFREE:为数据更新准备的“留白”

数据终究是要写入到数据块里面的。对数据表中的块block来说,都会依次填满行数据。而Oracle写数据表的顺序是首先找到一个空闲块,之后向空闲块中写入数据。

那么Oracle如何判断这个数据块是否非空闲呢?就是使用PCTFREE参数了,该参数是一个百分比值,默认为10%。如果一个数据块空闲的空间低于PCTFREE设定值,就认为这个数据块已经写满。会将这个块从空闲块的列表(FREELIST)上取下来。

那么,为什么要有这个参数?为什么要保留这10%呢?答案就是为了进行update使用。数据保存在数据行里,随着不断的更新,每行所占有的空间是一个不定的范围。在数据插入之后,如果发生存储空间增加(比如:varchar2类型字符长度变化),余下的10%就留作数据行空间延展使用。

那么,如果超过这个10%,还是不能装下数据怎么办?Oracle定位数据使用的物理rowid机制,实际上就是定位特定的数据行在某个数据块的第几个slot(槽)上。如果一个数据块再也装不下一些数据行,那么这些数据行就需要另找一个新的数据块进行保存。也就意味着这些行有一个新的new-rowid位置。但是,Oracle还会按照原来的old-rowid定位数据行。原来的数据块上,记录着该数据行的新位置new-rowid,再次找到新的数据行位置。这个技术过程就称为行迁移(row
migrate)。

注意:我们要读一个数据行的内容。理论上希望访问的数据块越少越好,最好只有一个块。但是,如果发生行迁移,我们就不得不访问多个数据块才能得到数据。所以,行迁移是我们通常不希望看到的。解决的方法,就是保留一个适当的PCTFREE值。

选择合适的PCTFREE的值要根据系统的性质而定。如果是一个典型的OLTP系统,数据更新操作多,变化大。这时候就需要设置一个略大些的PCTFREE。相反,如果更新很少,大部分都是读操作,PCTFREE略小些也无碍。

PCTFREE意味着一种空间的闲置。如果需要进行某种数据表压缩,设置PCTFREE为0也是一种思路。

ü PCTUSED:数据块的判定容量底线

刚才我们谈论PCTFREE的时候,介绍了Oracle在写入数据的时候,是将新数据写入到数据块中,直到认为已经满了后,再寻找新块写入。这个过程相反的是,如果一个过去写满的数据块,经过若干次删除后,会逐渐变空,那么什么时间点才能认为这个块是一个空闲块,能接受新的数据插入呢?

这就是PCTUSED参数的用途。如果一个数据块的使用容量低于PCTUSED设置的限制,那么就认为这个数据块已经空闲,可以放置回FREELIST列表中,作为空闲数据块接受新数据行的插入。

一般是不需要调节这个参数的,笔者认为,频繁的数据块空闲或者写满切换,是有损于数据库性能的。所以,设置默认的40%一般是可以接受的。对一些数据变化巨大,删除频繁的系统,这个参数可以配合PCTFREE统一筹划。

ü INITRANS和MAXTRANS

初始事务INITRANS和最大事务MAXTRANS是在数据块级别的参数。Oracle行级锁是Oracle最大的特点之一。数据库事务的本质还是对数据块的修改,而事务的信息是记录在数据块头。

参数INITRANS的作用就是表示数据块上可以标记的初始事务数目。如果同时进行的事务数据量超过这个数量,事务数目可以增加,直到达到MAXTRANS的限制。

从性能角度看,我们不希望一个数据块同时进行过多的事务。因为这样起码意味着数据块过热。所以,建议设置一个合理的INITRANS。

ü COMPRESS压缩参数

Compress参数含义很清楚:就是在存储数据表数据的时候是否启用压缩选项。压缩使用的级别是数据块block级别。Oracle对数据块的压缩采用相邻相同值合并的压缩算法。

Compress参数有两个系列参数:

1、OMPRESS FOR DIRECT_LOAD OPERATIONS:作用于Compress相同,适合于数据仓库OLAP系统。只在直接插入过程中在表或者分区上启用压缩技术

2、COMPRESS FOR ALL OPERATIONS:适合于OLTP系统,针对所有的操作均启用了压缩选项。要求的版本较高。

下面,我们通过一个小实验,来确定压缩效果。首先,构建两个数据表test和test1,数据量和顺序相同,只是参数不同。

SQL> conn scott/tiger@orcl;

Connected to Oracle Database 10g Enterprise Edition Release 10.2.0.1.0

Connected as scott

SQL> set timing on;

SQL> create table testnocompressas select * from all_objects where 1=0;

Table created

Executed in 0.11 seconds

SQL> insert /*+append */ into test select * from all_objects;

40724 rows inserted

(提交和重复执行该语句,篇幅原因省略…)

SQL> insert into test select * from test;

122170 rows inserted

Executed in 8.412 seconds

SQL> select count(*) from test;

COUNT(*)

----------

244340

Executed in 0.872 seconds

SQL> exec dbms_stats.gather_table_stats('SCOTT','TEST',cascade => true);

PL/SQL procedure successfully completed

Executed in 2.354 seconds

//压缩数据表

SQL> create table test1compressas select * from all_objects where 1=0;

Table created

Executed in 0.17 seconds

SQL> insert /*+append */ into test1 select * from all_objects;

40724 rows inserted

Executed in 2.724 seconds

(提交和重复执行该语句,篇幅原因省略…)

SQL> insert into test1 select * from test1;

122172 rows inserted

Executed in 1.562 seconds

SQL> commit;

Commit complete

Executed in 0.03 seconds

SQL> select count(*) from test1;

COUNT(*)

----------

244344

Executed in 0.03 seconds

SQL> exec dbms_stats.gather_table_stats('SCOTT','TEST1',cascade => true);

PL/SQL procedure successfully completed

Executed in 0.501 seconds

两个数据表数据量和结构完全相同,内容也相同。经过分析后,我们检查数据字典反应的情况。

SQL> select segment_name, segment_type, bytes/1024/1024 MB, blocks, extents from user_segments where segment_name in ('TEST','TEST1');

SEGMENT_NA SEGMENT_TY MB BLOCKS EXTENTS

---------- ---------- ---------- ---------- ----------

TEST1 TABLE 17 2176 32

TEST TABLE 28 3584 43

Executed in 0.08 seconds

结果很清楚了,在没有使用压缩技术的TEST数据表,占有空间28MB,共3584个数据块。而采用过数据库压缩技术后,空间使用到了17MB,共2176个数据块,空间节省39%左右。

进一步实验,根据Oracle压缩的方法,我们尝试将近似的行之间相同数据情况增加。all_objects视图中,owner和object_type相似度较高,选择性低,这样我们组织数据形态。

//构建实验数据表三

SQL> create table test2 compress as select * from test1order by owner,object_type;

Table created

Executed in 5.719 seconds

SQL> exec dbms_stats.gather_table_stats(user,'TEST2',cascade => true);

PL/SQL procedure successfully completed

Executed in 1.102 seconds

SQL> select segment_name, segment_type, bytes/1024/1024 MB, blocks, extents from user_segments where segment_name in ('TEST','TEST1','TEST2');

SEGMENT_NA SEGMENT_TY MB BLOCKS EXTENTS

---------- ---------- ---------- ---------- ----------

TEST1 TABLE 17 2176 32

TEST TABLE 28 3584 43

TEST2 TABLE 10 1280 25

Executed in 0.08 seconds

按照算法特征进行整理之后,数据表大小便为了10M,压缩率提高到了64%。

ü LOGGING:日志记录

LOGGING参数表示对数据表或者其他对象进行变化性操作的时候,是否计入到REDO日志中。默认情况下,Oracle对数据库对象的任何修改性操作都会计入到redo log中,作为数据库恢复使用。开启logging功能,是保证数据库数据一致性的重要一步。

有一些时候,我们可能会不希望记日志操作。因为logging的时候会存在相当的性能损失,为了避免这种损失,加快操作速度,我们可能会选择暂时性的设置数据表为nologging状态。比如,我们在进行大规模数据加载的时候,可能就会选择这种方式。

先不论nologging的好坏,有几个问题笔者需要说明。首先,启用数据表的nologging绝不意味着说一点重做日志都不书写。在运行过程中,数据表对应的索引对象等内容,都有一个重建的过程,这个过程是需要写入redo log的。第二,不启用redo log,的确会带来一定的性能提升。但是没有日志的数据库是极其危险的,一旦发生实例崩溃或者数据库崩溃这种情况,数据库数据丢失和不一致的情况是可能发生的。这种方法得不偿失。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: