您的位置:首页 > 其它

AUPE学习第三章------文件I/O

2013-12-26 14:29 169 查看

3.1引言

本章开始讨论U N I X系统,先说明可用的文件I / O函数——打开文件、读文件、写文件等等。

大多数U N I X文件I / O只需用到5个函数:o p e n、r e a d、w r i t e、lseek 以及c l o s e。然后说明不同缓

存器长度对r e a d和w r i t e函数的影响。

本章所说明的函数经常被称之为不带缓存的I / O(u n b u ffered I/O,与将在第5章中说明的标

准I / O函数相对照)。术语——不带缓存指的是每个r e a d和w r i t e都调用内核中的一个系统调用。

这些不带缓存的I / O函数不是ANSI C的组成部分,但是是P O S I X . 1和X P G 3的组成部分。

只要涉及在多个进程间共享资源,原子操作的概念就变成非常重要。我们将通过文件I / O

和传送给o p e n函数的参数来讨论此概念。并进一步讨论在多个进程间如何共享文件,并涉及内

核的有关数据结构。在讨论了这些特征后,将说明d u p、f c n t l和i o c t l函数。

3.2文件描述符

对于内核而言,所有打开文件都由文件描述符引用。文件描述符是一个非负整数。当打开

一个现存文件或创建一个新文件时,内核向进程返回一个文件描述符。当读、写一个文件时,

用o p e n或c r e a t返回的文件描述符标识该文件,将其作为参数传送给r e a d或w r i t e。

按照惯例,UNIX shell使文件描述符0与进程的标准输入相结合,文件描述符1与标准输出

相结合,文件描述符2与标准出错输出相结合。这是UNIX shell以及很多应用程序使用的惯例,

而与内核无关。尽管如此,如果不遵照这种惯例,那么很多U N I X应用程序就不能工作。

在P O S I X . 1应用程序中,幻数0、1、2应被代换成符号常数S T D I N F I L E N O、S T D O U T F I L E N O和S T D E R R F I L E N O。这些常数都定义在头文件< u n i s t d . h >中。

文件描述符的范围是0 ~ O P E N M A X (见表2 - 7 )。早期的U N I X版本采用的上限值是1 9 (允许

每个进程打开2 0个文件),现在很多系统则将其增加至6 3。

3.3 open函数

调用o p e n函数可以打开或创建一个文件。

#include <sys/types.h>

#include <sys/stat.h>

#include <fcntl.h>

int open(const char *p a t h n a m e , int o f l a g,.../*, mode_t m o d e * / ) ;

返回:若成功为文件描述符,若出错为- 1

我们将第三个参数写为. . .,这是ANSI C说明余下参数的数目和类型可以变化的方法。对

于o p e n函数而言,仅当创建新文件时才使用第三个参数。(我们将在稍后对此进行说明。)在函

数原型中此参数放置在注释中。

p a t h n a m e是要打开或创建的文件的名字。o f l a g参数可用来说明此函数的多个选择项。用下

列一个或多个常数进行或运算构成o f l a g参数(这些常数定义在< f c n t l . h >头文件中):

• O_RDONLY 只读打开。

• O_WRONLY 只写打开。

• O_RDWR 读、写打开。

很多实现将O R D O N LY定义为0,O W R O N LY定义为1,O R D W R定义为2,

以与早期的系统兼容。

在这三个常数中应当只指定一个。下列常数则是可选择的:

• O_APPEND 每次写时都加到文件的尾端。3 . 11节将详细说明此选择项。

• O_CREAT 若此文件不存在则创建它。使用此选择项时,需同时说明第三个参数m o d e,

用其说明该新文件的存取许可权位。( 4 . 5节将说明文件的许可权位,那时就能了解如何说明

m o d e,以及如何用进程的u m a s k值修改它。)

• O_EXCL 如果同时指定了O C R E AT,而文件已经存在,则出错。这可测试一个文件是

否存在,如果不存在则创建此文件成为一个原子操作。3 . 11节将较详细地说明原子操作。

• O_TRUNC 如果此文件存在,而且为只读或只写成功打开,则将其长度截短为0。

• O_NOCTTY 如果p a t h n a m e指的是终端设备,则不将此设备分配作为此进程的控制终端。

9 . 6节将说明控制终端。

• O_NONBLOCK 如果p a t h n a m e指的是一个F I F O、一个块特殊文件或一个字符特殊文件,

则此选择项为此文件的本次打开操作和后续的I / O操作设置非阻塞方式。1 2 . 2节将说明此工作

方式。

• O_SYNC 使每次w r i t e都等到物理I / O操作完成。3 . 1 3节将使用此选择项。

由o p e n返回的文件描述符一定是最小的未用描述符数字。这一点被很多应用程序用来在标

准输入、标准输出或标准出错输出上打开一个新的文件。例如,一个应用程序可以先关闭标准

输出(通常是文件描述符1 ),然后打开另一个文件,事先就能了解到该文件一定会在文件描述

符1上打开。在3 . 1 2节说明d u p 2函数时,可以了解到有更好的方法来保证在一个给定的描述符

上打开一个文件。

文件名和路径名结短
如果N A M E M A X是1 4,而我们却试图在当前目录中创建一个其文件名包含1 5个字符的新

文件,此时会发生什么呢? 按照传统,早期的系统V版本,允许这种使用方法,但是总是将文

件名截短为1 4个字符,而B S D类的系统则返回出错E N A M E TO O L O N G。这一问题不仅仅与创

建新文件有关。如果N A M E M A X是1 4,而存在一个其文件名恰恰就是1 4个字符的文件,那么

以p a t h n a m e作为其参数的任一函数( o p e n , s t a t等)都会遇到这一问题。

在P O S I X . 1中,常数_ P O S I X N O T R U N C决定了是否要截短过长的文件名或路径名,或者

返回一个出错。第1 2章将说明此值可以针对各个不同的文件系统进行变更。

3.4 create 函数

也可用c r e a t函数创建一个新文件。

#include <sys/types.h>

#include <sys/stat.h>

#include <fcntl.h>

int creat(const char *p a t h n a m e, mode_tm o d e) ;

返回:若成功为只写打开的文件描述符,若出错为- 1

注意,此函数等效于:

o p e n (p a t h n a m e, O_WRONLY|O C R E A T|O_TRUNC, m o d e) ;

在早期的U N I X版本中, o p e n的第二个参数只能是0、1或2。没有办法打开一

个尚未存在的文件,因此需要另一个系统调用c r e a t以创建新文件。现在, o p e n函

数提供了选择项O C R E AT和O T R U N C,于是也就不再需要c r e a t函数了。

在4 . 5节中,我们将详细说明文件存取许可权,并说明如何指定m o d e。

c r e a t的一个不足之处是它以只写方式打开所创建的文件。在提供o p e n的新版本之前,如果

要创建一个临时文件,并要先写该文件,然后又读该文件,则必须先调用c r e a t,c l o s e,然后再

调用o p e n。现在则可用下列方式调用o p e n:

o p e n (p a t h n a m e, O_RDWR|O C R E A T|O_TRUNC, m o d e) ;

3.5 close 函数

可用c l o s e函数关闭一个打开文件:

#include <unistd.h>

int close (int f i l e d e s);

返回:若成功为0,若出错为- 1
关闭一个文件时也释放该进程加在该文件上的所有记录锁。1 2 . 3节将讨论这一点。

当一个进程终止时,它所有的打开文件都由内核自动关闭。很多程序都使用这一功能而不

显式地用c l o s e关闭打开的文件。实例见程序1 - 2。

3.6 lseek函数

每个打开文件都有一个与其相关联的“当前文件位移量”。它是一个非负整数,用以度量

从文件开始处计算的字节数。(本节稍后将对“非负”这一修饰词的某些例外进行说明。)通常,

读、写操作都从当前文件位移量处开始,并使位移量增加所读或写的字节数。按系统默认,当

打开一个文件时,除非指定O A P P E N D选择项,否则该位移量被设置为0。

可以调用l s e e k显式地定位一个打开文件。

#include <sys/types.h>

#include <unistd.h>

off_t lseek(int f i l e d e s, off_to f f s e t, int w h e n c e) ;

返回:若成功为新的文件位移,若出错为- 1

对参数offset 的解释与参数w h e n c e的值有关。

• 若w h e n c e是S E E K S E T,则将该文件的位移量设置为距文件开始处offset 个字节。

• 若w h e n c e是S E E K C U R,则将该文件的位移量设置为其当前值加offset, offset可为正或负。

• 若w h e n c e是S E E K E N D,则将该文件的位移量设置为文件长度加offset, offset可为正或负。

若l s e e k成功执行,则返回新的文件位移量,为此可以用下列方式确定一个打开文件的当前

位移量:

off_t currpos;

currpos = lseek(fd, 0, SEEK_CUR);

这种方法也可用来确定所涉及的文件是否可以设置位移量。如果文件描述符引用的是一个管道

或F I F O,则l s e e k返回-1,并将e r r n o设置为E P I P E。

三个符号常数S E E K S E T,S E E K C U R和S E E K E N D是由系统V引进的。在

系统V之前, w h e n c e被指定为0 (绝对位移量),1 ( 相对于当前位置的位移量)或

2 (相对文件尾端的位移量)。很多软件仍直接使用这些数字进行编码。

在l s e e k中的字符l表示长整型。在引入o ff t数据类型之前, o f f s e t参数和返回值

是长整型的。l s e e k是由V 7引进的,当时C语言中增加了长整型。(在V 6中,用函

数s e e k和t e l l提供类似功能。)

标注:总觉得这样写博客没有意义,要写就写总结性的东西或者需要记录下来的东西。以后写博客必须一个一个字敲入。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: