Linux —— 文件描述符
文件描述符 Fd
当进程打开文件或创建新文件时,内核会返回一个文件描述符(非负整数),用来指向被打开的文件,所有执行I/O操作的系统调用(read、write)都会通过文件描述符。
文件描述符可以理解为进程文件描述表这个表的索引,或者把文件描述表看做一个数组的话,文件描述符可以看做是数组的下标。当需要进行I/O操作的时候,会传入fd作为参数,先从进程文件描述符表查找该fd对应的那个条目,取出对应的那个已经打开的文件的句柄,根据文件句柄指向,去系统fd表中查找到该文件指向的inode,从而定位到该文件的真正位置,从而进行I/O操作。
特点:
- 每个文件描述符会与一个打开的文件相对应
- 不同的文件描述符也可能指向同一个文件
- 相同的文件可以被不同的进程打开,也可以在同一个进程被多次打开
相关的三张表:
-
进程级的文件描述符表
struct task_struct {//...struct files_struct *files // 进程级别的文件描述符表//...};
-
系统级的文件描述符表
内核对系统所有打开的文件维护了一个
打开文件表
,表中每一项称为
打开文件句柄
,一个打开文件句柄描述了一个打开文件的全部信息
当前文件偏移量(调用read()和write()时更新,或使用lseek()直接修改)
- 打开文件时所使用的状态标识(即,open()的flags参数)
- 文件访问模式(如调用open()时所设置的只读模式、只写模式或读写模式)
- 与信号驱动相关的设置
- 对该文件i-node对象的引用
- 文件类型(例如:常规文件、套接字或FIFO)和访问权限
- 一个指针,指向该文件所持有的锁列表
- 文件的各种属性,包括文件大小以及与不同类型操作相关的时间戳
文件系统的inode表
每个文件系统会为存储于其上的所有文件维护一个inode表
文件描述符表、打开文件表、inode表之间的关系:
进程A文件描述符1和20指向同一个打开文件句柄,是因为多次调用open()等函数打开同一个文件导致。
进程A的文件描述符2和进程B的文件描述符2指向同一个打开文件句柄可能是因为调用fork()后出现的,子进程会继承父进程的打开文件描述符表,也就是子进程继承父进程打开文件。;或者某进程通过unix域套接字将一个打开的文件描述符传递给另一个进程;或者不通进程独自调用open函数打开同一个文件是正好分配到与其他进程打开该文件描述符一样。
进程A的描述符0和进程B的描述符3分别指向不同的打开文件句柄,但这些句柄均指向i-node表的相同条目,即同一个文件,发生这种情况是因为每个进程各自对同一个文件发起了open()调用。同一个进程两次打开同一个文件,也会发生类似情况。
文件指针 *FILE
C语言中使用的是文件指针而不是文件描述符作为I/O的句柄,“文件指针(file pointer)”指向进程用户区中的一个被称为FILE结构的数据结构。当通过文件指针操作文件时,需要调用C语言stdio.h中提供的文件API(fopen()、fread()等)。
文件描述符在POSIX系统调用中直接可见,文件指针是C语言在其基础上的包装。
int open(const char *path, int access,int mode)FILE *fopen(char *filename, char *mode)
文件路径 到 文件指针:filepath –fopen()–>FILE*;
文件路径 到 文件描述符:filepath–open()–fd;
文件描述符 到 文件指针:fd–fdopen()–>FILE*;
文件指针 到 文件描述符:FILE*–fileno()—>fd;
索引节点 Inode
index node是类unix系统中保存文件系统中对象元数据的数据结构。
inode主要存储以下数据:
- inode编号
- 文件大小
- 占用的块数目与块大小
- 文件类型(普通文件、目录、管道,etc.)
- 存储该文件的设备号
- 链接数目
- 读、写、执行权限
- 拥有者的用户ID和组ID
- 文件的最近访问、数据最近修改时间
- inode最近修改时间
stat
命令可以查看元数据,`df -i查看每个硬盘分区的inode总数和已经使用的数量。除了文件名以外的所有信息,都存在inode中。
inode也会消耗硬盘空间,所以硬盘格式化的时候,操作系统自动将硬盘分成两个区域。一个是数据区,存放文件数据;另一个是inode区(inode table),存放inode所包含的信息。
每个inode节点的大小,一56c般是
128字节
或
256字节
。inode节点的总数,在格式化时就给定,一般是每1KB或每2KB就设置一个inode。假定在一块1GB的硬盘中,每个inode节点的大小为128字节,每1KB就设置一个inode,那么inode table的大小就会达到128MB,占整块硬盘的12.8%。
每个文件都有一个inode,因此有可能inode已经用完但是硬盘还未存满的情况。linux系统不使用文件名而使用inode来识别文件。
表面上,用户通过文件名,打开文件。实际上,系统内部这个过程分成三步:首先,系统找到这个文件名对应的inode号码;其次,通过inode号码,获取inode信息;最后,根据inode信息,找到文件数据所在的block,读出数据。
目录文件就是由一系列目录项组成的数据结构,每个目录项包含文件名和inode号码两部分。
Inode特殊作用
- 有时,文件名包含特殊字符,无法正常删除。这时,直接删除inode节点,就能起到删除文件的作用。
- 移动文件或重命名文件,只是改变文件名,不影响inode号码。
- 打开一个文件以后,系统就以inode号码来识别这个文件,不再考虑文件名。因此,通常来说,系统无法从inode号码得知文件名。
ad8
第3点使得软件更新变得简单,可以在不关闭软件的情况下进行更新,不需要重启。因为系统通过inode号码,识别运行中的文件,不通过文件名。更新的时候,新版文件以同样的文件名,生成一个新的inode,不会影响到运行中的文件。等到下一次运行这个软件的时候,文件名就自动指向新版文件,旧版文件的inode则被回收。
拓展
磁盘结构
文件储存在硬盘上,硬盘的最小存储单位叫做”扇区”(Sector)。每个扇区储存
512字节
(相当于0.5KB)。
操作系统读取硬盘的时候,不会一个个扇区地读取,这样效率太低,而是一次性连续读取多个扇区,即一次性读取一个”块”(block)。这种由多个扇区组成的”块”,是文件存取的最小单位。”块”的大小,最常见的是4KB,即连续八个 sector组成一个 block。
由上,可用
(柱面号,盘面号,扇区号)
来定位任意一个“磁盘块”,我们经常提到文件数据存放在外存中的几号块(逻辑地址),这个块号就可以转换成(柱面号,盘面号,扇区号)的地址形式。
可根据该地址读取一个“块”,操作如下:
① 根据“柱面号”移动磁臂,让磁头指向指定柱面(也称磁道)
② 激活指定盘面对应的磁头;
③ 磁盘旋转的过程中,指定的扇区会从磁头下面划过,这样就完成了对指定扇区的读/写。