您的位置：首页 > 其它

数据表创建参数介绍

2012-06-17 15:46 141 查看

创建数据表create table是我们对数据库进行的常见操作。我们一般使用create table之后，指定了数据列信息和主键等约束信息，其他就交给Oracle使用默认值了。今天我们一起来看看这些默认值。说明：本片只关注一般数据表，临时表、聚簇、IOT等特殊类型暂时不考虑。

提取完整的DDL

首先我们需要提取出创建数据表的完整DDL语句，才能将Oracle提供的默认值们正确抽取出来。此处我们使用dbms_metadata.get_ddl方法。

//源数据抽取脚本

set serveroutput on size 10000;

set timing on;

declare

c_ddl clob;

begin

c_ddl := dbms_metadata.get_ddl('TABLE','DEPT','SCOTT');

dbms_output.put_line(c_ddl);

end;

/

//输出结果

CREATE TABLE "SCOTT"."DEPT"

( "DEPTNO" NUMBER(2,0),

"DNAME" VARCHAR2(14),

"LOC" VARCHAR2(13),

CONSTRAINT "PK_DEPT" PRIMARY KEY ("DEPTNO")

USING INDEXPCTFREE 10 INITRANS 2 MAXTRANS 255 COMPUTE STATISTICS

STORAGE(INITIAL 65536 NEXT 1048576 MINEXTENTS 1 MAXEXTENTS 2147483645

PCTINCREASE 0 FREELISTS 1 FREELIST GROUPS 1 BUFFER_POOL DEFAULT)

TABLESPACE "USERS" ENABLE

)

PCTFREE 10 PCTUSED 40 INITRANS 1 MAXTRANS 255 NOCOMPRESS LOGGING

STORAGE

(INITIAL 65536 NEXT 1048576 MINEXTENTS 1 MAXEXTENTS 2147483645

PCTINCREASE 0 FREELISTS 1 FREELIST GROUPS 1 BUFFER_POOL DEFAULT)

TABLESPACE "USERS"

上面是使用Oracle自带的源数据导出工具，对Scott用户下的数据表EMP进行提取的DDL语句。

注意：其上有两个片段（标注红色）是相似。这个要说明一下，我们建立一个数据表，在Oracle中要建立数据段data segment对象。同时，如果我们指定了主键，Oracle会自动为这个主键建立索引，索引是一种索引段index
segment对象。所以，如果在建立数据表的时候，也指定了主键primary key，那么一共会生成两个段segment对象。

下面，我们对相似的代码参数片段进行分析。

1、PCTFREE 10 PCTUSED 40 INITRANS 1 MAXTRANS 255 NOCOMPRESS LOGGING

2、STORAGE

(INITIAL 65536 NEXT 1048576 MINEXTENTS 1 MAXEXTENTS 2147483645

PCTINCREASE 0 FREELISTS 1 FREELIST GROUPS 1 BUFFER_POOL DEFAULT)

3、TABLESPACE "USERS"

代码段可以分为三个部分，下面分别进行介绍。

Part1、数据块Data Block与表属性部分

标注1部分表示是数据块结构和使用参数，以及我们的数据表在使用中的一些参数。

在Oracle中，数据库逻辑结构被划分为“表空间Tablespace、段对象Segment、分区extent和块block”。其中，block是最小的结构对象。

ü PCTFREE：为数据更新准备的“留白”

数据终究是要写入到数据块里面的。对数据表中的块block来说，都会依次填满行数据。而Oracle写数据表的顺序是首先找到一个空闲块，之后向空闲块中写入数据。

那么Oracle如何判断这个数据块是否非空闲呢？就是使用PCTFREE参数了，该参数是一个百分比值，默认为10%。如果一个数据块空闲的空间低于PCTFREE设定值，就认为这个数据块已经写满。会将这个块从空闲块的列表（FREELIST）上取下来。

那么，为什么要有这个参数？为什么要保留这10%呢？答案就是为了进行update使用。数据保存在数据行里，随着不断的更新，每行所占有的空间是一个不定的范围。在数据插入之后，如果发生存储空间增加（比如：varchar2类型字符长度变化），余下的10%就留作数据行空间延展使用。

那么，如果超过这个10%，还是不能装下数据怎么办？Oracle定位数据使用的物理rowid机制，实际上就是定位特定的数据行在某个数据块的第几个slot（槽）上。如果一个数据块再也装不下一些数据行，那么这些数据行就需要另找一个新的数据块进行保存。也就意味着这些行有一个新的new-rowid位置。但是，Oracle还会按照原来的old-rowid定位数据行。原来的数据块上，记录着该数据行的新位置new-rowid，再次找到新的数据行位置。这个技术过程就称为行迁移（row
migrate）。

注意：我们要读一个数据行的内容。理论上希望访问的数据块越少越好，最好只有一个块。但是，如果发生行迁移，我们就不得不访问多个数据块才能得到数据。所以，行迁移是我们通常不希望看到的。解决的方法，就是保留一个适当的PCTFREE值。

选择合适的PCTFREE的值要根据系统的性质而定。如果是一个典型的OLTP系统，数据更新操作多，变化大。这时候就需要设置一个略大些的PCTFREE。相反，如果更新很少，大部分都是读操作，PCTFREE略小些也无碍。

PCTFREE意味着一种空间的闲置。如果需要进行某种数据表压缩，设置PCTFREE为0也是一种思路。

ü PCTUSED：数据块的判定容量底线

刚才我们谈论PCTFREE的时候，介绍了Oracle在写入数据的时候，是将新数据写入到数据块中，直到认为已经满了后，再寻找新块写入。这个过程相反的是，如果一个过去写满的数据块，经过若干次删除后，会逐渐变空，那么什么时间点才能认为这个块是一个空闲块，能接受新的数据插入呢？

这就是PCTUSED参数的用途。如果一个数据块的使用容量低于PCTUSED设置的限制，那么就认为这个数据块已经空闲，可以放置回FREELIST列表中，作为空闲数据块接受新数据行的插入。

一般是不需要调节这个参数的，笔者认为，频繁的数据块空闲或者写满切换，是有损于数据库性能的。所以，设置默认的40%一般是可以接受的。对一些数据变化巨大，删除频繁的系统，这个参数可以配合PCTFREE统一筹划。

ü INITRANS和MAXTRANS

初始事务INITRANS和最大事务MAXTRANS是在数据块级别的参数。Oracle行级锁是Oracle最大的特点之一。数据库事务的本质还是对数据块的修改，而事务的信息是记录在数据块头。

参数INITRANS的作用就是表示数据块上可以标记的初始事务数目。如果同时进行的事务数据量超过这个数量，事务数目可以增加，直到达到MAXTRANS的限制。

从性能角度看，我们不希望一个数据块同时进行过多的事务。因为这样起码意味着数据块过热。所以，建议设置一个合理的INITRANS。

ü COMPRESS压缩参数

Compress参数含义很清楚：就是在存储数据表数据的时候是否启用压缩选项。压缩使用的级别是数据块block级别。Oracle对数据块的压缩采用相邻相同值合并的压缩算法。

Compress参数有两个系列参数：

1、OMPRESS FOR DIRECT_LOAD OPERATIONS：作用于Compress相同，适合于数据仓库OLAP系统。只在直接插入过程中在表或者分区上启用压缩技术；

2、COMPRESS FOR ALL OPERATIONS：适合于OLTP系统，针对所有的操作均启用了压缩选项。要求的版本较高。

下面，我们通过一个小实验，来确定压缩效果。首先，构建两个数据表test和test1,数据量和顺序相同，只是参数不同。

SQL> conn scott/tiger@orcl;

Connected to Oracle Database 10g Enterprise Edition Release 10.2.0.1.0

Connected as scott

SQL> set timing on;

SQL> create table testnocompressas select * from all_objects where 1=0;

Table created

Executed in 0.11 seconds

SQL> insert /*+append */ into test select * from all_objects;

40724 rows inserted

（提交和重复执行该语句，篇幅原因省略…）

SQL> insert into test select * from test;

122170 rows inserted

Executed in 8.412 seconds

SQL> select count(*) from test;

COUNT(*)

----------

244340

Executed in 0.872 seconds

SQL> exec dbms_stats.gather_table_stats('SCOTT','TEST',cascade => true);

PL/SQL procedure successfully completed

Executed in 2.354 seconds

//压缩数据表

SQL> create table test1compressas select * from all_objects where 1=0;

Table created

Executed in 0.17 seconds

SQL> insert /*+append */ into test1 select * from all_objects;

40724 rows inserted

Executed in 2.724 seconds

（提交和重复执行该语句，篇幅原因省略…）

SQL> insert into test1 select * from test1;

122172 rows inserted

Executed in 1.562 seconds

SQL> commit;

Commit complete

Executed in 0.03 seconds

SQL> select count(*) from test1;

COUNT(*)

----------

244344

Executed in 0.03 seconds

SQL> exec dbms_stats.gather_table_stats('SCOTT','TEST1',cascade => true);

PL/SQL procedure successfully completed

Executed in 0.501 seconds

两个数据表数据量和结构完全相同，内容也相同。经过分析后，我们检查数据字典反应的情况。

SQL> select segment_name, segment_type, bytes/1024/1024 MB, blocks, extents from user_segments where segment_name in ('TEST','TEST1');

SEGMENT_NA SEGMENT_TY MB BLOCKS EXTENTS

---------- ---------- ---------- ---------- ----------

TEST1 TABLE 17 2176 32

TEST TABLE 28 3584 43

Executed in 0.08 seconds

结果很清楚了，在没有使用压缩技术的TEST数据表，占有空间28MB，共3584个数据块。而采用过数据库压缩技术后，空间使用到了17MB，共2176个数据块，空间节省39%左右。

进一步实验，根据Oracle压缩的方法，我们尝试将近似的行之间相同数据情况增加。all_objects视图中，owner和object_type相似度较高，选择性低，这样我们组织数据形态。

//构建实验数据表三

SQL> create table test2 compress as select * from test1order by owner,object_type;

Table created

Executed in 5.719 seconds

SQL> exec dbms_stats.gather_table_stats(user,'TEST2',cascade => true);

PL/SQL procedure successfully completed

Executed in 1.102 seconds

SQL> select segment_name, segment_type, bytes/1024/1024 MB, blocks, extents from user_segments where segment_name in ('TEST','TEST1','TEST2');

SEGMENT_NA SEGMENT_TY MB BLOCKS EXTENTS

---------- ---------- ---------- ---------- ----------

TEST1 TABLE 17 2176 32

TEST TABLE 28 3584 43

TEST2 TABLE 10 1280 25

Executed in 0.08 seconds

按照算法特征进行整理之后，数据表大小便为了10M，压缩率提高到了64%。

ü LOGGING：日志记录

LOGGING参数表示对数据表或者其他对象进行变化性操作的时候，是否计入到REDO日志中。默认情况下，Oracle对数据库对象的任何修改性操作都会计入到redo log中，作为数据库恢复使用。开启logging功能，是保证数据库数据一致性的重要一步。

有一些时候，我们可能会不希望记日志操作。因为logging的时候会存在相当的性能损失，为了避免这种损失，加快操作速度，我们可能会选择暂时性的设置数据表为nologging状态。比如，我们在进行大规模数据加载的时候，可能就会选择这种方式。

先不论nologging的好坏，有几个问题笔者需要说明。首先，启用数据表的nologging绝不意味着说一点重做日志都不书写。在运行过程中，数据表对应的索引对象等内容，都有一个重建的过程，这个过程是需要写入redo log的。第二，不启用redo log，的确会带来一定的性能提升。但是没有日志的数据库是极其危险的，一旦发生实例崩溃或者数据库崩溃这种情况，数据库数据丢失和不一致的情况是可能发生的。这种方法得不偿失。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航