量子是我们的老朋友,而不是最近才有的东西。事实上,1990年代,诺贝尔奖得主莱德曼就指出,量子力学贡献了当时美国国内生产总值的三分之一。现在更是很难找到与量子无关的新技术。所以说,量子力学是当代文明一个重要基础。近年来,基于量子叠加的量子信息和量子计算得到很大发展。从技术到理论,我们都需要继续量子革命。
(Image by Gerd Altmann from Pixabay)
撰文 | 施郁(复旦大学物理学系教授)
编辑 | 邸利会
最近几年,“量子”一词频繁出现在我们的生活中。我们经常听说量子科技的最新进展,一些研究领域在各方面也更突出量子元素。因为量子之热,社会上还出现乱用“量子”概念或名词,乃至用“量子”一词行骗的情况。
最近的一个研究进展是,google的科学家宣称,他们研制的一个量子处理器能够在两百秒内完成一项计算任务(具体来说,是随机数产生方面的一个计算任务),而这个计算任务是目前超级计算机需要很长时间才能完成的。他们自己说是1万年,后来IBM的科学家说是两天半。
总之,量子计算机对于解决某些计算问题具有巨大的威力。
为了解释什么是量子计算机,我们首先解释“量子”是什么。后面我会讲到,“量子”一词其实有几个不同,却又相互有关的含义。
热辐射和不情愿的量子启动者
“量子”一词起源于20世纪初[1]。当时著名物理学家开尔文勋爵宣称,物理学晴朗的天空中有两朵乌云。
其中一个是说,电磁波的媒介一直找不到。水波的媒介是水,声波的媒介是空气或者其他传播声音的东西,人们将电磁波的媒介叫做以太,但是一直找不到。
电磁波,或者简称光,按照波长从长到短,包括无线电波、微波、红外线、可见光、紫外线、X射线、伽马射线。它们都是振动的电磁场在空间的传播,区别只是波长或者频率不同(光速是一样的,频率等于光速除以波长)。
当时物理学天空的第二朵乌云是热辐射的能量问题。热辐射实际上就是电磁波。那么它是哪种电磁波呢?答案是,它是各种电磁波的混合,每种电磁波的能量取决于它的波长,也取决于温度,所以叫做热辐射。理想的情况通常称作黑体辐射,意思是,对于所有波长的电磁波,只有辐射和吸收,没有反射。
对此我们有点生活经验。物体温度不是特别高时,比如人的身体,虽然我们感受到它发出热量,但是看不到它发光,然而我们可以探测到红外线。随着物体温度升高,我们还可以看到红色,黄色,等等,说明这些波长的电磁波能量增加了。
但是,一定温度下,各种电磁波的能量究竟多少?这个问题在19世纪后期研究了几十年也没有研究清楚,没有一个满意的公式来描写它,这说明没搞清楚它的机制。所以开尔文勋爵将这个问题列为一朵乌云。
峰回路转,开尔文话音刚落,同一年的10月,普朗克找到了一个完美的公式,描写热辐射中各种电磁波的能量,这后来被称作普朗克定律。
这先是普朗克猜出来的。然后他试图从理论上推导出这个普朗克定律。但是他绝望地发现,为此必须假设,物质通过振动发出或吸收电磁波时,振动的能量必须是某个基本单元的整数倍。普朗克将这基本单元叫做量子,是频率乘以一个常数。这个常数后来叫做普朗克常数。
就这样,普朗克不太情愿地启动了量子革命。后来,他因为“能量量子的发现”获1918年诺贝尔物理学奖。
爱因斯坦、玻尔和量子力学
5年以后的1905年,爱因斯坦指出,电磁波本身就是由一份一份的量子组成的,叫做光量子,20年后被简称为光子。这是爱因斯坦本人唯一自称具有革命性的工作。
这与普朗克的量子假说并不一样,就好比,普朗克说,从水缸里舀水时,一勺一勺地舀;而爱因斯坦说,水本来就是由一勺一勺组成的,不存在半勺水的概念。
作为推论,爱因斯坦解释了光电效应,也就是光量子入射到金属上可以导致电子出射,并预言了出射电子的能量与入射光的波长的关系。
1905年,爱因斯坦还创立了相对论,说明了电磁波不需要媒介,所以也驱散了第一朵乌云。1905年被成为爱因斯坦的奇迹年[2]。
1906年,爱因斯坦指出,光量子假说自然导致普朗克定律,后来人们用此思想理解普朗克黑体辐射定律,广泛用在教科书中[1]。第二朵乌云得以彻底驱散。
1922年,爱因斯坦因为“光电效应定律的发现”而获得1921年诺贝尔物理学奖(因为1921年时,对于是否授予爱因斯坦物理诺奖有争议)[3]。
我们知道,光电效应将光信号转变为电信号,应用实在太多了:光电倍增管、光敏电阻、太阳能电池、数码相机、研究材料性质所用的光电子能谱等等。
2019年的诺贝尔物理学奖的一半授予了宇宙学的工作,而且主要是关于宇宙背景辐射。这是宇宙大爆炸发生38万年以后产生的、充满宇宙的热辐射,随着宇宙的膨胀,温度下降到2.73K(K是开氏温标,0K是摄氏零下273.15度)。现在测量到,宇宙背景辐射完美地符合普朗克定律,温度不均匀性只有10万分之一。
因此这证明了宇宙背景辐射的量子化。所以可以说,整个宇宙的行为证明了电磁波的量子化。
回到历史。1913年,玻尔提出,原子中的电子只能处于一些分立的轨道。在这些轨道上,能量是某个基本单元除以整数的平方,所以是分立的,叫作能量量子化。玻尔因为“原子结构及其辐射的研究”获1922年诺贝尔物理学奖。
1925年到1926年,一方面海森堡、玻恩、约旦通过分析原子中电子状态改变产生光子,建立了所谓矩阵力学;另一方面,薛定谔在德布罗意1924年的物质波理论(任何粒子都有波动性)的基础上,提出相应的波动方程,叫做薛定谔方程,并用于原子中的电子,得到了电子行为的准确描述,解释了玻尔模型,被称为波动力学。泡利1924年提出任何两个电子的状态不能完全相同,1926年用矩阵力学计算了氢原子中电子的能量。
然后狄拉克指出,矩阵力学和波动力学是等价的,都是量子力学的不同形式。加上物理学家们取得的其他进展,系统的量子力学理论得以建立。
“量子”是我们的老朋友
量子力学最重要的特征,是它的描述是概率性的[4]。
在我们日常生活中,也使用概率的说法。比如扔骰子,每个面朝上都有可能,概率大概1/6。但是这种概率是基于对细节的忽略。如果我们知道骰子运动的力学细节,原则上我们可以预言每次扔骰子的结果。
而在量子力学中,概率是实质性的。
关键在于,我们使用的最基本的概念是“概率的开方”,称作波函数或者概率幅,比概率信息更丰富,就好比复数比实数的信息丰富。
德布罗意所说的物质波本质上就是波函数。因为是一种波,所以有干涉效应,两种可能性叠加的概率不一定是原先两个概率相加。
量子力学建立以后,成为整个微观物理学的理论框架,取得一个又一个的成功[4]。
量子力学解释了化学。
元素周期表、化学反应、化学键、分子的稳定性等等,都是在电子和原子核的电磁力作用下,量子力学规律所导致。所以狄拉克在1929年就说:“整个化学所依赖的物理定律已经完全知道了。”
量子力学帮助我们理解宇宙。
我们的宇宙跨越各种尺度,从最小、最微观的基本粒子到原子分子,到我们可以看见的宏观世界,到天体,到整个宇宙。
从光到基本粒子,到原子核,到原子、分子以及大量原子构成的凝聚态物质,量子力学都起了重要的作用,也因此成为现代技术的基础。
在微观的尺度上,电磁力和弱相互作用(主宰中子衰变为质子从而导致放射性)已经统一为电弱相互作用,这是量子场论(量子力学与狭义相对论的结合)的成功[5]。
在更微观的尺度上,电弱相互作用可能与强相互作用(将夸克结合为核子的力量)统一,但是还没有成功。
在更加微观的尺度上,它们还可能与引力统一。
这些统一问题依赖于量子力学,都还没有解决。其他的未解之谜,比如暗物质和暗能量,答案也依赖于量子力学。
很多天体物理过程,例如太阳这样的恒星发光,白矮星和脉冲星的存在,以及刚才说过的宇宙背景辐射的存在,都是因为量子力学规律。
太阳发出的中微子到达地球时,一部分变成其他类型的中微子,这本质上就是量子概率幅的振荡。
整个宇宙起源于大爆炸,然后一直膨胀。所以在宇宙诞生的早期,宇宙就像一锅基本粒子的汤,受量子力学支配。所以不少人用咬尾蛇来象征最大和最小的统一。
在宇宙早期,量子力学决定了我们的宇宙中有多少氢和氦。后来重原子核在恒星中的合成也是量子力学决定的。
大尺度上,我们的宇宙中有星系结构。追根溯源,宇宙结构的形成是因为最初量子力学导致的涨落,这是量子力学的概率本性决定的。
终结问题——为什么有宇宙存在,而不是什么也没有,也需要用量子力学去寻找答案,不管能不能找到。
各种材料的物理性质在很大程度上是因为材料中电子的量子力学行为。比如导体和绝缘体的区别,比如磁性的起源,超导电性的原因,如此等等。
量子力学带来了非常丰富的应用,深刻地改变了我们人类社会的文明。
它让我们拥有了新的能源:来自原子核的能量,也让我们能够更有效地利用太阳能。原子弹影响了世界历史,而核电则是原子核能量的和平利用。
量子力学为信息革命提供了硬件基础。
激光、半导体晶体管,芯片的原理都源于量子力学。量子力学也使得磁盘和光盘的信息存储、发光二极管、卫星定位导航等新技术成为可能。
从x射线到电子显微镜、正电子湮没、光学和核磁共振成像等等,量子力学为材料科学、医学和生物学提供了分析工具。
所以,量子是我们的老朋友,而不是最近才有的东西。事实上,1990年代,诺贝尔奖得主莱德曼就指出,量子力学贡献了当时美国国内生产总值的三分之一。现在更是很难找到与量子无关的新技术。所以说,量子力学是当代文明一个重要基础。
“量子”的三个含义
我将“量子”总结为三个含义。
“量子”的第一个含义是分立和非连续,比如在早期量子论中,轨道必须具有特定的半径,能量一份一份,分立的轨道,分立的能量。这是量子论先驱当时所用的含义。但是这种含义也被用于当代物理中,比如,“量子霍尔效应”就是指所谓霍尔电导只能取一些分立值。
“量子”的第二个含义就是指基本粒子,强调了粒子是量子场的激发。
量子场论告诉我们,每种基本粒子都是某种场的量子。第一个例子就是光量子,这是电磁场的量子。所以,电子是电子场的量子,夸克是夸克场的量子。另外,大量粒子构成的集体可以有集体运动的激发,也叫做量子,比如,固体振动的量子叫做声子。
“量子”的第三个含义是作为一个形容词或者前缀使用,“量子X”是指在将量子力学基本原理用于X,比如:量子物理、量子化学、量子统计、量子凝聚态物理、量子磁学、量子光学、量子电动力学、量子场论、量子宇宙学、量子信息、量子计算等等。相应地,X中不需要量子力学的部分就称作经典X。
量子叠加
量子叠加是基本的量子规律,代表“不同可能性都存在”的情况在量子力学中的形式。
在日常生活中,也有“不同可能性都存在”的情况,用概率描述。比如今天下雨的概率多大,不下雨的概率多大。
但是在量子力学中,我们先用概率幅,也就是“概率的开方”, 有时叫做波函数,最后才算出概率。这个基本原理导致了各种各样的量子现象,导致量子力学中的“不同可能性都存在”不同于日常生活中的“不同可能性都存在”。
假设我们从北京出发,随机到达几个目的地之一,其中有一定的概率抵达上海,而北京去上海又有很多道路,每条道路都有一定的概率,加起来就是从北京到上海的总概率。
假如一个量子粒子也从北京出发,通过这些道路去那些目的地。那么从北京抵达上海的概率就是总的波函数的平方,而这个总的波函数是每条道路的波函数相加。所以总概率是若干波函数相加以后再平方,而不只是将若干概率相加。
这就导致干涉现象,因为不同道路的波函数互相之间有可能相互抵消,也可能相互加强,导致总的概率不一定是各条道路的概率之和。
这就好比光通过几条缝再打到屏上,在屏上出现明暗条纹,也就是干涉,而不是像经典的子弹那样,屏上只是子弹通过每条缝的分布情况的直接相加。
量子比特
近年来,基于量子叠加的量子信息和量子计算得到很大发展。正如比特是信息和计算的单元,量子信息和量子计算的单元是量子比特。
我们将一个可能是0或1的数字叫做1个比特。与此类似,1个量子比特可能的基本状态是|0>态和|1>态,量子叠加态的一般形式是 a|0>+b|1>。
两个量子比特的4种可能的基本状态是|00>态, |01>态, |10>态和|11>态,量子叠加态的一般形式是 a|00>+b|01>+c|10>+d|11>。
n个量子比特有2n种可能的基本状态,量子叠加态的一般形式就是这2n个基本状态相加。
最近google的量子处理器用了53个量子比特,它们的基本状态就是 53个0或1组成的字符串,总共有253个,约等于1016,也就是1亿个亿!
在量子叠加态上得到某个测量结果的概率,就是将从每一个基本状态下得到那个测量结果的波函数或概率幅相加,然后再做平方。
除了干涉,量子叠加与经典概率的关键不同还在于,量子叠加态同时也是其他一组基本状态的叠加,比如每个量子比特的基本状态既可以选用|0>和|1>,也可以选用(|0>+|1>)/21/2和(|0>-|1>)/21/2。测量时,可以选择任意一套基本状态。对于每一套基本状态,都有一个概率分布。这提供了量子密码的基础[6]。
量子纠缠
量子纠缠就是一种特殊的量子叠加,比如a|00>+b|11>。这种情况下两个量子比特不互相独立。如果我们测量第一个量子比特得到|0>态,那么我们就知道第二个量子比特肯定处于|0>态。如果我们测量第一个量子比特得到|1>态,那么我们就知道第二个量子比特肯定处于|1>态。
请注意,是做测量的我们知道了,而第二个量子比特的观测者并不知道,除非我们告诉他们,而这是不能瞬时完成的,是受到相对论等各种物理规律的制约的。因此这里不存在违反相对论的瞬时超距传输。作为对比,a|00>+b|10>没有量子纠缠,因为在这种情况下,第二个量子比特总是|0>态。
另一方面,我们即使不知道某个量子比特的量子态,但如果和远方观测者还分别控制另外两个互相纠缠的量子比特,我们就可以对第一个比特以及我们所控制的纠缠比特进行测量,再通过经典通信,指导远方观测者的操作,就可以在远方的比特上重建第一个比特原来所处的量子态。这就是量子隐形传态[6]。
前面提到量子基本状态的可选择性,这也导致量子纠缠与经典关联的一个关键不同。比如,将一副手套分别送给两个人,其中一个人知道自己收到的是左手套或者右手套后,也就知道了对方是右手套或者左手套。而且,这是分配时就明确下来了,不管这两个人是否知道。但是对于量子纠缠的两个粒子,在其中任意一个被测量之前,连定义概率分布的基本状态都还没有确定!
前面提到的量子密码和量子隐形传态都属于量子信息,量子信息的另一个重要课题是量子计算。
量子计算就是巧妙地操纵量子叠加态,用量子力学原理作为计算逻辑,超出了经典计算使用的布尔代数的范畴。
我们目前用的计算机虽然硬件上用到了半导体,用到了量子力学,但是它的计算逻辑没有用到量子力学,因此叫做经典计算机。
因为量子力学的基本原理,量子叠加态中的每一个基本状态都在演化。所以一种说法是,量子计算过程实现了量子并行。通过巧妙地设计如何操作叠加态的演化过程,能够快速解决某些计算问题,比如因子化问题[7]——
两个整数相乘,不论这两个整数多大,经典计算机很快找到乘积。但是如果反过来,将这个乘积给你,只要它不是偶数,经典计算机不能有效地找到它的因子。“有效”的意思是说,计算机花费的时间或者资源是这个整数的二进制位数的有限幂次(1次方,2次方,如此等等)的组合。但是如果量子计算机能造出来的话,它就能够有效地找到任何一个大数的因子。
薛定谔猫、退相干和量子多世界
薛定谔猫和量子多世界是将量子叠加的概念直接延申到宏观物体和宏观世界。其实能否这么延申,如何延申,科学上还并不清楚。
薛定谔猫是说一个宏观物体,比如一只猫,也处于量子叠加态;或者按照最初的版本,猫与一个原子核发生量子纠缠。当初薛定谔提出薛定谔猫,是作为一个佯谬,说明量子力学不合理,因为虽然薛定谔方程是量子力学的基本定律,薛定谔本人却不同意波函数代表概率的开方。
量子系统与环境耦合或者被测量时,量子叠加遭到破坏,概率退化为经典概率,干涉效应消失,这叫做退相干。这也是量子计算机很难实现的主要原因。
现在我们可以在实验室让越来越大的系统实现量子叠加。但是要实现量子叠加,系统不能与环境耦合,否则就会出现退相干。
而越复杂的系统,与环境耦合越多,所以越容易退相干,越难实现量子叠加。
现实世界中的猫是个复杂系统,与环境有非常多的耦合,这很自然地通过极为迅速的退相干阻止了薛定谔猫的出现。
另一方面,不与环境耦合的系统,是不是总是可以实现量子叠加,还是说,系统复杂到一定程度,就不能有量子叠加呢?这个问题其实还没有答案,有待科学家的继续探索。
量子多世界的提出,是为了解决另一个困惑,就是量子态被测量的时候,有个随机的变化,突然变成了测量结果对应的新量子态,看上去与薛定谔方程描述的量子态演化不融洽。
一个解决方案是,量子态并没有突然随机改变,而是与测量仪器共同受薛定谔方程主宰,处在量子纠缠态中。如果忽略测量仪器的信息,系统就表现出随机的变化。与此类似,与环境耦合时,系统与环境处在量子纠缠态中。如果忽略环境的信息,系统就退化为经典的随机。这就是退相干。
多世界理论的支持者说,系统与测量仪器或者环境的量子纠缠态所描述的每一种可能都是真实存在的,或者说,世界劈裂成多个世界。对于每个世界而言,在下一次测量中,又会进一步劈裂成多个世界,如此等等。
在上面这个漫画中,一位帅哥邀请一位美女去喝饮料。一个可能结果是美女没有答应,后来两人不再相关。另一个可能是,美女答应了,最终两人成为两个孩子的父母。这是经典世界中的常见现象,并不是量子问题。
量子多世界理论是说,这些可能的结果都是存在的,每一次选择都产生了多个世界,在有的世界里,两人成陌路;在有的世界里,两人成眷属。这个说法有什么用呢?它避免了量子力学测量问题。
有些物理学家对量子力学测量问题感到困惑,发明了很多理论,多世界理论是其中之一。但是在实验已经证实的方面,这些理论是互相等效的;而它们不等效的地方,迄今又没有实验能够证实。
所以,一方面,量子叠加导致了量子现象与量子技术,导致量子信息。另一方面,量子力学中还存在尚未完全解决的基本问题。服从经典规律的系统都是由服从量子规律的微观粒子组成的。那么一个系统在什么情况下服从量子规律,什么情况下服从经典规律,二者边界在哪里?我们还不完全清楚。从技术到理论,我们都需要继续量子革命[4]。
参考资料
[1] 施郁,庆祝2015国际光之年、纪念早期量子论—从2014 年诺贝尔物理学奖与化学奖谈起,现代物理知识,2015年27 卷1期,32-34。
[2] 施郁,“爱因斯坦奇迹年”和五份手稿,知识分子,2017年10月15日;漫谈质能关系以及爱因斯坦奇迹年的5篇论文,科学,2018,70(4):20-22。
[3] 施郁,爱因斯坦的奇葩诺奖,知识分子,2017年10月3日;科学文化评论,2017,14(6):111-120。
[4] 施郁,继续量子革命,光明日报,2017年05月25日13版;知识分子,2017年6月13日,链接
[5] 施郁,规范理论一百年,知识分子,2019年3月31日;规范理论一百年(上),科学,2019,71(3)54-58; 规范理论一百年(下),科学,2019,71(4)49-53。
[6]施郁,揭秘量子密码、量子纠缠与量子隐形传态,自然杂志,2016年38卷4期,241-247。
[7] 施郁,量子通信与量子计算不可行吗?知识分子,2016年8 月25日; 施郁,量子信息、量子通信和量子计算释疑,现代物理知识,2016年28卷6期,19-21。29.