现在都2018年了,而这个来自于1974年的错误信息居然还在。最新版本的windows 10依然有这个限制,而这个bug第一次出现的时候星球大战还没上映,都跟水门事件一样老了。
这个bug出现时,超市里的东西还没有UPC条码,因为UPC还没发明。
这个bug出现时,世界上只有一家电话公司,因为他们还没分家。Ted Bundy还没被抓。Babe Ruth的本垒打纪录还没有被打破。
这个bug出现时,幸运大转轮还没播出,也没人看过Rocky Horror。斯皮尔伯格只是一系列小众电视剧的导演,电影票房也十分糟糕。埃德蒙德·费兹杰罗号货轮还是一堆铁矿石。
这个愚蠢的bug出现时,教父2才刚刚在电影院中上映。
1.那么,这个bug究竟是什么?
因为Unix(当时才仅仅5岁)发明了一个很好的点子——“一切皆是文件”,也就是说,你可以用同样的命令和指令读写套接字、管道、控制台等等。
这个点子是由Gary Kildall在1974年想出来的。用这个方法有很多方便之处,比如可以从串口拷贝数据到文本文件,或者直接从命令行打印文本文件。
在Unix中,这个点子是通过特殊目录下的特殊文件实现的,比如/dev/tty表示控制台,/dev/lp0表示第一个打印机等。/dev/zero可以提供无限的零,/dev/random可以提供随机字节,还有很多!
但有个问题:CP/M是为8位计算机设计的,这些计算机内存很小,也没有硬盘,最多也就有个8寸软驱。目录是什么?还要目录干啥。你换个软盘就行了。
但没有目录,就没办法把所有特殊文件都放在/dev/目录下了。所以这些文件实际上被放到了“所有地方”。所以,如果你要打印FOO.TXT,可以执行“PIP LST:=FOO.TXT”,就能把foo.txt拷贝到“文件”LST,而实际上这个就是打印机。
这个命令在任何地方都可以使用,因为根本没有目录!非常简单。
2.那扩展名怎么办?
这里就有问题了:程序喜欢给自己的文件加上正确的扩展名。
所以如果你运行一个程序,它问你“请输入要保存代码的文件名”时,你可以输入LST让它直接打印出来,或者输入PTP让它输出到磁带(别忘了现在是1974年!)
但是!程序可能会自己在文件名后面加上.TXT!LST.TXT不是打印机,对吧?
错了,LST.TXT也是打印机。这些特殊设备存在于所有扩展名中,这样上面的问题才不会出现。所以,如果“CON”被用来指代键盘,那么CON.TXT、CON.WAT、CON.BUG都是键盘。
额……这确实是个hack,但就是好使,而且这只不过是只有4k内存的微型计算机,谁在乎呢?
3.IBM、微软等巨头的加入
结果70年代末到80年代初CP/M广泛流行。
它是最主要的商用操作系统之一。它定义了一套接口,你可以用这套接口在NorthStar Horizon上写CP/M代码,然后放到Seequa Chameleon上运行(注:两者都是计算机的型号)。
由于它缺少图形标准,所以无法进入游戏市场(虽然有一些Infocom的东西),所以主要是用于商用。但它实在太流行了,于是IBM很自然地希望在80年代早期的“个人电脑”项目上使用它。
于是IBM计划在IBM个人电脑发布时支持几种操作系统,其中CP/M是最主要的那个。但CPM的x86版直到IBM个人电脑发布六个月之后才出现……而且价格是感人的$240,相比之下DOS只要$40。
所以绝大部分用户选择了微软的PC-DOS,这个产品曾经是由Seattle Computer Products开发的一个划时代的新操作系统。微软买下了Tim Paterson的这个项目,并在其基础上开发了PC-DOS(后来改名为MS-DOS)。
Tim Paterson的操作系统叫做“QDOS”,意思是“Quick and Dirty Operation System”——“快速、肮脏的操作系统”。原因基本上是因为CP/M还没有x86版,QDOS就是为了解决CP/M的一些问题而出现的。所以,很多方面都借鉴了CP/M。
其中主要的一点就是借鉴了不使用目录来操作特殊文件的点子,因为在CP/M中这个功能很有用。于是QDOS和PC-DOS 1.0中也有AUX、PRN、CON、LPT等等!
4.结果问题来了
1983年随着IBM XT一起发行的PC-DOS 2.0中的大部分被微软重写了。因为IBM XT带硬盘,所以PC-DOS需要支持目录。显然,一个10MB的硬盘需要目录来组织文件!
但问题来了:用户在两年前PC DOS 1.0时就开始使用这些特殊文件名了。许多软件都用了这些特殊文件名!各种批处理文件也需要它们。所以,尽管有了目录之后微软可以建一个C:DEV目录,但他们没有这样做。
这种牺牲可用性来满足向后兼容性的事情绝不是最后一次。特殊文件依然适用于所有目录,所有扩展名。所以“DIR > LPT”来打印目录的技巧不会由于你从A:切换到了C:DOS就不能用了。
但是,我们现在早就不用DOS 2.0了……Windows 95是基于DOS的,所以很自然地继承了这一行为。(当然Windows 1/2/3也继承了,但与它们相比,Win95才是真正意义上的操作系统。)
但是,我们现在早就不用Windows 95了!现在的Windows是基于Windows NT的,不是Win95。
但Windows NT想要与DOS/Windows程序兼容。而XP合并了两条产品线,所以这些特殊文件依然存在——这时距离这个bug出现已经过去44年了!
你可以自己试试看!打开文件管理器,新建一个文本文件,命名为con.txt、aux.txt、prn.txt。
但Windows不会让你这么干的:
这都是因为Gary Kiddal说“特殊文件表示硬件设备!Unix的这个点子很不错。我要把这个点子实现在我的玩具操作系统中”……那一年出生的人的孩子都长大成人了,但我们仍然不能建con.txt……
微软给出的官方列表是:
CON, PRN, AUX, NUL, COM1, COM2, COM3, COM4, COM5, COM6, COM7, COM8, COM9, LPT1, LPT2, LPT3, LPT4, LPT5, LPT6, LPT7, LPT8, LPT9
https://docs.microsoft.com/en-us/windows/desktop/fileio/naming-a-file
更有意思的是,在Win95上访问C:concon(或C:auxaux)会直接导致蓝屏。即使在1995年这也非常荒谬,因为这个bug已经21岁了!你能想象一个错误的设计会如此长寿么?
下面这张图是Tim Paterson在今年8月的VCF:W上介绍DOS的历史。
至于为什么我发现了这个无法拷贝文件的bug……这些特殊文件名是在操作系统级别实现的,而不是文件系统级别。所以这些文件名完全是合法的NTFS文件名,而我在Linux下使用这些NTFS文件系统。
而且显然OS/2也没有实现这些特殊文件名,因为IBM在OS/2 devcon磁盘上发布的一些opengl头文件中有个文件叫AUX.H。
所以我今天想把这个NTFS盘备份到主PC上然后惊喜地发现,我没办法拷贝所有文件,而造成这个问题的bug的年龄比所有读者都大……
5.内容纠错
抱歉我这几天要么在医院里,要么在睡觉,好不容易才有机会上来更新一下:
1.CP/M对于特殊文件的处理方式其实不像我说的那么简单,所以我一直也没学会,也有可能学会了然后忘了。其实特殊文件后面要有个冒号,就跟盘符一样。比如PRN:是打印机,而PRN不是。
2.CP/M并不像DOS那样在操作系统层次实现!CP/M中是在PIP(文件复制)命令中实现的。所以没办法像DOS那样让程序直接保存到PRN.TXT进行打印。我可能没说清楚,我想说的是DOS,没有暗示CP/M也能这样做。
3.PC DOS 1其实没有重定向或管道,所以没办法像我说的那样做重定向。我忘记了。这些功能是1983年在PC DOS 2.0中加入的。但PC DOS 1的确支持从特殊文件中拷贝或拷贝到特殊文件,所以我说的大方向是对的,虽然例子搞错了。
不论如何,感谢大家的回复!我没想到这篇文章能这么火,其实它只是我在遇到一个44年的bug之后感到很无力而已。
而且我想重申,这篇文章并不是想说“Windows很垃圾”。一般来说,向后兼容是很好的。实际上我希望看到更多向后兼容。
我只是觉得,在Windows 10上从一个USB 3.0 SSD向另一个SSD拷贝文件时,遇到个44年前的bug很奇妙。
就像你在宇宙空间站中被马踢了一样。
6.开发者的看法
Hacker News上的很多开发者对于这个45岁的bug发表了自己的看法。
评论1:
好怀念那时的互联网……当时我们经常搜索21端口,就能找到很多开放了匿名FTP权限的机器,其中很多机器都是Windows的。
我们在这些匿名FTP上经常使用的“技巧”是:用这些特殊文件名创建一些嵌套的目录。在FTP服务器上,你可以创建这些目录,也可以访问它们(只要你知道正确的路径),但Windows下这些目录会导致错误,或者访问时会造成系统崩溃。再加上你可以创建文件名中只有空格的目录,所以可以在匿名FTP上放很多东西而不被管理员发现。
评论2:
我们高中的实验室中用的是Windows For Workgroups 3.11,我们用Alt+255(这个字符在DOS下像个空格,但在Windows下是隐藏的)来隐藏Doom、Descent还有很多其他DOS游戏的安装文件。
实验室管理员禁用了Ctrl+C和Ctrl+Break来防止有人退出DOS下的登录提示符直接进入C:,但我不知怎么发现了Alt+3也能输入同样的字符,起到同样的作用。
只有一次有个老师对我喊“在实验室里待了太长时间”,但我从来没被抓到过。我觉得管理员(上了点年纪的编程和数学老师)应该知道我们在干什么。
评论3:
好玩的是那些“COM”、“LTP”等后面加数字的……或者至少加上个像是数字的Unicode,所以COM²跟COM2一样不能用。
这种设备映射是在Win32层进行的,而不是NT内核上,所以你可以使用“verbatim path syntax”来越过这些规则。例如,“C:TempCOM2.TXT”是特殊设备,而“?C:TEmpCOM2.TXT”就是个普通文件,完全可以正常读写……但像文件管理器这种没使用verbatim path syntax的程序就会报错。
原文:https://threadreaderapp.com/thread/1058676834940776450.html
作者:foone
译者:弯月,责编:郭芮