本文翻译自程序员的问答社区stackexchange.com上的一个问题。
有人可以给我解释一下,为什么Linux的文件系统是“单目录层阶树状”结构,而不像Windows那样有个C:、D:分区啥的,这样做有没有特别的原因呢?
一句话答案:不分区的好,Windows那是为了向下兼容。
Doug O’Neal 163票
说起来Unix的文件系统的道行要比Windows的早很多年,所以您的问题得改成:“为什么Windows要自搞一套弄出个硬盘分区符号来呢?”
树状的文件结构有个优势就是任何子目录或者文件,都能顺着根目录找到,所以,如果你需要把本地文件迁移到一个网络硬盘上,这时候对于软件来说,它们不会察觉到任何区别。
假设你有一套系统,操作系统焊死不能动,但是有个程序有很高的I/O需求,那么你可以很方便地把/usr目录加载为只读,然后把/opt(应用程序安装目录)目录加载到一块SSD上。这样整个文件系统的结构对于操作系统来说没有发生任何改变。
然而在Windows下,这种问题就比较讨厌,特别是程序路径前面带着个C:Program Files的时候……
Gilles 70票
这都是有历史原因在里面的,部分上是因为这样做在当时更有效。
Multics
Multics是我所知的历史上第一个采用“层阶树状文件结构”的操作系统,一个目录里还嵌着子目录这种机制。引用R. C. Daley和P. G. Neumann的《通用辅助文件存储(A General-Purpose File System For Secondary Storage)》一文中的话:
论文第二部分阐述了一种“层阶树状文件结构”的文件系统,对于操作系统来说,它非常高效。这种结构兼顾了可靠性和灵活性……
为了便于理解,我们可以把这种结构想象成一棵树,文件的树,其中有一些目录其实也是文件。但是有一个例外的目录,它自身的指针只指向一个单一的,确定的目录,那就Root目录。它没有明确地被其他目录所指,Root目录只是隐式地代表一个虚拟的分支,我们称这个分支结构为“文件系统”。
在任何时候,用户都处于一个目录下面,我们称它为“工作目录(working directory)”,用户可以通过指定入口访问工作目录下面的文件,而且多个用户可以同时工作在同一个工作目录之下。
在其他各个方面,Multics追求的是灵活性,用户只需工作在整个文件系统的一条分支上,其他的不用管,但还能保证用目录管理文件的便捷性。目录还被用来控制访问权限——目录的READ属性允许用户访问目录中的文件,而EXECUTE属性允许用户修改目录中的文件(这个特性被后来的unix系统继承下来)。
Multics还遵循了“单一存储对象池”的设计原则,但是论文没有在这方面展开。“单一存储对象池”对于当时的硬件条件来说非常合适,那时候没有可移动的硬盘,起码是没有人关心这个问题。Multics确实有一个备用的备份存储池,但对于用户来说,它是不存在的。
Unix
Unix系统深受Multics的影响,但是比起Multics的“灵活”,Unix更专注于加强系统的“简洁”。
“单一目录树层级”的文件系统就很适合Unix系统。就和Multics一样,存储池的细节经常不需要用户关心,但是后来出现了可拆卸的硬盘,Unix通过mount和umount两个命令把对存储设备的操作暴露给用户(只有“管理员权限”的用户才能执行这样的操作)。在《Unix分时系统设计(The Unix Time-Sharing System)》一文中,Dennis Ritchie和Ken Tompson解释道:
虽然系统根目录一般都在同一个存储设备上,但是对于其他分支目录则未必要这样做。出于两种考虑,我们需要mount命令完成存储设备挂载的工作:普通文件的文件名一致性,和文件所在的存储设备可能有其独立的文件存储结构。通过mount命令,可以把之前的一个文件,替换成一个可移动存储设备上的完整的目录结构,事实上,mount命令把文件层级的某一部分,通过引用外部数据,替换成一个新的结构。这样对于之前整个文件系统来说,没有发生任何改变。
其实,拿我们的系统安装过程举例,root目录一直在我们的硬盘上占了一小块地方,但其他用户数据在不同的硬盘上,通过mount机制,按序列加载组成一个初始化的系统。一个“可挂载”的系统,完全是通过读写特殊文件完成的。各种应用可以创建自己的文件系统,或者简单地从他处拷贝一份。(注:上面这段文字的中心思想:在UNIX中,一切都是文件。)
“层阶树状文件系统”还有一个优势,就是可以把管理存储设备的复杂任务交给内核处理,这就意味着内核虽然越来越复杂,但是对于建立其上的应用来说,其结果就是保持简洁,因为内核已经把脏活累活都包了,大部分应用都不用关心这部分细节,这是一种更加自然的设计。
Windows
Windows系统流淌着两支古老血脉:设计运行在VAX微机上的VMS操作系统,和早期Intel微机(如8080、Z80)上运行的CP/M操作系统。
VMS有一个分布式的层级文件系统,叫做Files-11。在Files-11中,一个文件的完整路径包括一个“节点名称”、一个关联的用户账户、设备名称、目录树、文件名和文件类型,以及版本号。VMS有强大的Logical Names功能,这个功能允许自定义“快捷方式”到指定的路径,所以用户不需要在意目录的“真实”路径。
CP/M是为了64KB的内存和软盘系统设计的。为了一切从简,所以从诞生起,它就没有“目录”这个概念,但是文件是通过引用“驱动器位置”来访问的,比如A:或者B:。
MSDOS 1.0继承了CP/M的这个特性,所以当MSDOS 2.0引入“目录”的概念以后,为了兼容1.0也在路径前保留了“盘符”字符,而斜杠“/”符号是原来VMS和CP/M系统中表示“命令参数开始”的符号,所以后来的DOS以及Windows必须区分,并采用反斜杠“”符号作为路径分隔符。
Windows继承了DOS和VMS的习惯,虽然已经意义不大,但是依旧保留着“盘符”的传统。如今,在Windows底层采用的是UNC路径(通用命名规则即servernamesharename的规范),但这只是一些高级Windows用户需要知道的功能,Windows现在确实可以通过“重解析点”(Reparse Points)来挂在存储设备(所以不需要C:这样的盘符了)。