解释信息动力学第二定律及其影响「油管讲座」
讲座介绍
本讲座将系统阐述“信息动力学第二定律”这一引人深思的理论。讲者首先界定了该定律的核心观点——孤立系统的信息状态熵随时间推移将减少或保持不变,这与我们熟知的热力学第二定律中物理熵的趋势形成鲜明对比。为支撑这一论点,讲座将回顾相关的熵理论基础,并详细列举来自生物信息学(如对SARS-CoV-2病毒基因突变的研究)和数字信息存储领域的实验证据与模拟结果。进一步地,讲者将探讨该定律在更广阔物理图景中的应用潜力,包括其在宇宙学(解释宇宙熵问题)、原子物理(为洪特规则提供新视角)以及解释自然界普遍存在的对称性等方面的启示。尽管此理论曾因与“模拟宇宙”假说的关联而受到媒体的广泛关注,但本次演讲的核心目标是回归科学本身,清晰、冷静地剖析其内在逻辑与支撑依据,引导听众深入理解这一前沿概念及其可能带来的深远影响。通过本次演讲,听众可以对信息物理学这一交叉领域有一个初步且系统的认识。
内容纲要
解释信息动力学第二定律及其影响
├── 引言
│ ├── 演讲主题与目的
│ └── 框架设定:易于理解,避免过多数学细节
├── 信息动力学第二定律的提出
│ ├── 核心表述:孤立系统信息状态的熵减少或不变 ($\partial S_i / \partial t \le 0$)
│ └── 与热力学第二定律的对比 ($\partial S / \partial t \ge 0$)
├── 理论基础回顾
│ ├── 热力学熵
│ │ ├── 克劳修斯 (Clausius) 的贡献与热力学熵 ($dQ = TdS$)
│ │ └── 玻尔兹曼 (Boltzmann) 的贡献与统计熵 ($S = k_B \ln \Omega$)
│ ├── 香农信息熵 (Shannon Information Entropy)
│ │ ├── 香农的目标:通信理论与信息度量
│ │ ├── 信息的概率性质与公理化定义 ($I(P) = -\log_b P$)
│ │ └── 香农信息熵 ($H(X) = -\sum P_j \log_b P_j$)
│ └── 连接物理熵与香农信息熵
│ ├── 核心观点:信息增加熵,删除信息减少熵
│ ├── 思想实验:向物理设备写入信息
│ ├── 信息熵 ($S_i = N k_B H(X) \ln 2$) 的定义
├── 实验与观察证据
│ ├── 基因组学/病毒学证据 (SARS-CoV-2)
│ │ ├── 研究动机与背景 (COVID-19 大流行)
│ │ ├── 基因组作为信息存储系统 (四态概率系统)
│ │ ├── 基因突变与香农信息熵变化实例
│ │ ├── 研究步骤与数据来源 (SARS-CoV-2 变体)
│ │ ├── 突变类型对信息熵 $S_i$ 的影响分析 (替换、删除、增加)
│ │ ├── 关键结果:病毒基因组信息熵随突变数量增加而降低
│ │ ├── GenIs 软件及其在发现规律中的作用
│ ├── 数字数据存储证据
│ │ ├── 理论的普适性思考
│ │ ├── 数字数据存储的直觉观察 (信息不会自发产生,但会衰减)
│ │ ├── 微磁学模拟 (Boris 软件) 与弛豫时间 ($\tau = \tau_0 \exp(K_u V / k_B T)$)
│ │ ├── 模拟结果:数据自我擦除,信息熵 $S_i$ 降低
│ └── 论文发表 (2022): "信息动力学第二定律"
├── 普适性探索
│ ├── 宇宙学应用
│ │ ├── 宇宙的绝热膨胀 ($dQ=0 \Rightarrow dS=0$)
│ │ ├── 宇宙学悖论:熵恒定与熵增加的矛盾
│ │ └── 解决方案:引入宇宙信息熵 $S_i$,且 $dS_i/dt \le 0$
│ ├── 原子物理学应用 (洪特规则 Hund's Rules)
│ │ ├── 原子内电子态与泡利不相容原理
│ │ ├── 洪特规则的现象学本质
│ │ ├── 信息论方法分析电子排布的信息熵
│ │ └── 结果:洪特规则构型对应最低信息熵
│ ├── 自然界的对称性
│ │ ├── 对称性的普遍性与费曼的困惑
│ │ ├── 信息论方法量化几何形状的对称性与信息熵
│ │ └── 结果:对称性越高,信息熵越低
├── 深远影响与推论
│ ├── 模拟宇宙假说
│ │ ├── 类比:砖块与石块砌墙的效率差异 (智能设计)
│ │ ├── 推断:自然界对称性作为优化与计算过程的体现
│ │ ├── 论文发表 (2023) 与《现实重装》(Reality Reloaded) 书籍
│ ├── 其他物理学意义
│ │ ├── 质能信息等效原理 (2019)
│ │ ├── 与能量最小化原理的一致性
│ │ └── 作为确定系统平衡条件的工具
└── 总结与展望
├── 当前挑战:扩展定律的适用性
└── 期望:更多研究者参与验证与探索
引言
大家好,再次非常荣幸能做九月份的IPI讲座。热烈欢迎各位,特别是新加入IPI的成员,如果你们是第一次来,也热烈欢迎我们的外部嘉宾。我邀请了一些IPI小组之外的朋友。本次演讲的题目是《解释信息动力学第二定律及其影响》。大家注意到,在“影响”之后,我并没有具体提及任何影响,我是故意将其略去的。在已发表的一篇论文中,应用部分涉及到了模拟宇宙假说,但我特意将其排除在外。原因是这项工作吸引了媒体的极大兴趣,几乎每次我有机会谈论这个研究时,重点总是放在模拟宇宙这个方面,我从未真正有机会深入解释其背后的科学原理,以及什么是信息动力学第二定律。这正是我决定做这次演讲的原因。
所以,就这样开始了。为了设定框架,我设计的方式是让它相当容易理解,我不会涉及非常繁重的数学细节或推导。我会提到一些基本的基础知识,但它并非设计成一个非常“重”的讲座。
信息动力学第二定律的提出
我打算稍微倒过来讲,先从信息动力学第二定律的公式开始,然后再展示我是如何得出这个结论或结果的。信息动力学第二定律,这是你能给出的最凝练的定义,它指出:一个孤立系统的信息状态的熵随时间必须减少或保持不变。一个简单的数学表达式是:信息状态熵对时间的偏导数 $\partial S_i / \partial t \le 0 $,也就是说它必须随时间减少或为零。
之所以称之为信息动力学第二定律,主要是类比热力学第二定律,后者实际上是朝着完全相反的方向发展的。热力学第二定律有许多不同的定义,这是其中之一,它指出:一个孤立物理系统的熵必须保持不变或随时间增加,表达式是这样的:$\partial S / \partial t \ge 0 $。
理论基础回顾
1. 热力学熵
我们提到了热力学和热力学第二定律,那么让我们快速回顾一下熵是怎么回事。这要追溯到1865年,克劳修斯认识到在热力学系统状态变化过程中,系统会发生根本性的转变。他从希腊词“entropia”(我相信这里至少有一位懂希腊语的人可以解释,我认为它翻译为“转变”)创造了“熵”这个词。我们得到的表达式是这样一个能量平衡方程的偏导数形式,其中熵通过温度乘以熵的无穷小变化 与系统总能量或总热交换 联系起来:。我必须澄清,这是热力学熵。
大约过了12年,玻尔兹曼(在某种程度上吉布斯也参与其中)才理解熵具有统计基础。他们将熵与系统微观状态的数量联系起来。这个公式 ,玻尔兹曼本人对这个公式非常自豪,以至于他把它刻在了自己的墓碑上(至少我是这么听说的)。其中,大写字母 是系统中的微观状态数, 是玻尔兹曼常数。可以证明,它可以写成这样的表达式:对 求和,其中 是处于微观状态 的粒子数。如果我们把这些微观状态的占据概率 写成 (N为总粒子数),那么公式可以改写成包含概率的形式,例如 。
我称克劳修斯方程中的熵为热力学熵,而这是玻尔兹曼熵,与统计和微观状态数相关。我不会在这里展示,但有一个漂亮的推导可以证明,对于拥有大量粒子并达到玻尔兹曼平衡分布的系统,这两者是完全等价的。在这种框架下,这两个熵实际上是相同的,所以在大多数情况下(如果不是所有情况)将它们等同起来是相当安全的。这就是我们对热力学和统计学中熵的基本方面的简要了解。
2. 香农信息熵 (Shannon Information Entropy)
现在让我们转向信息。什么是信息?什么是香农信息熵?这里是一些快速的基本概念。香农,我记得他当时可能在IBM或贝尔实验室工作,他的目标是发展一种通信理论,研究如何通过有噪声的信道在A点和B点之间最有效地传输消息。他发展了所谓的经典信息论,被认为是数字计算之父,他给了我们信息的单位——比特。
他认识到,一个可用的信息度量可以从观察一个事件中获得,并且这与该事件发生的概率有关。这进一步与不确定性相关,因为不确定性显然与概率成反比。换句话说,一个事件越不确定,就需要越多的信息来消除其不确定性。所以信息应被视为我们消除不确定性的过程。
香农的天才之处在于认识到信息的这种概率性质,然后他采用了一种公理化的方法,将信息定义为一个函数,概率 的函数 。他通过公理引入了这个函数必须满足的一系列性质。例如,它需要是一个非负量;信息函数 ,也就是说,一个确定事件(概率为1的事件)不提供任何信息,如果你对某事确定无疑,你从中什么也学不到,所以从观察该事件中提取的信息为零;如果你有两个事件,它们的联合概率是两个概率的乘积,那么你从观察这两个事件中提取的信息将等于分别从单个事件中提取的信息之和;他还规定这是一个关于概率的连续函数。
根据这些要求,他得出结论,唯一满足所有这些要求的函数是对数函数。所以他将信息定义为: 或者等效地 (只需将负号移入对数即可)。这个底数 可以是任何数字,但它基本上给出了信息的单位。传统上,我们使用 ,这将给我们以比特为单位的信息量。这就是关于香农信息定义基础知识的一个非常浓缩的解释。
现在的问题是,如果你观察的不是单个概率为P的事件,而是要提取信息——记住他试图建立通信理论并进行优化等等——也就是说,你有一个消息,而不是单个事件,你有一系列事件或一系列字母,那么当你观察或阅读它时,与该消息相关联的信息量是多少呢?这显然取决于它有多大的可能性。消息越不可能发生,接收到它时获得的信息就越多。如果我们将消息视为一系列字母或一系列事件——我称它们为事件,因为在物理学中,将香农的消息和字母概念替换为物理事件和物理状态等是非常有用的,这样你就可以将他的理论外推到非常有趣的事物上,即信息物理学——让我们称这些事件为 ,那么你有一个离散概率分布 ,换句话说,事件 发生的概率是 ,这些概率是归一化的,所有这些概率之和必须为1。香农所做的是,他推导出了一个公式,这被称为香农信息熵 ,这个公式给出了从观察整个集合或整个包含N个事件的消息一次所能提取的信息量。你会得到这个函数,信息熵或 ,它看起来是这样的:。我不确定你是否还记得我展示玻尔兹曼熵统计表达式的第二张幻灯片,它与那个表达式高度相似。这就是为什么它被称为香农信息熵,因为两者之间的相似性。它们是相当不同的东西,不完全相同,但我会在最后一张幻灯片中对两者进行比较。但它就是这个样子,这件工作的妙处在于它相当容易理解,它的数学并不复杂,这里没有什么相对论性的东西,没有什么量子性的东西,一点也不复杂,实际上全是经典物理。但是从这个简单的表达式中,你可以得到非常丰富的东西,我们将看到一些由此产生的有趣结果。
3. 连接物理熵与香农信息熵
现在我们已经简要介绍了这两个概念——热力学熵或玻尔兹曼熵(它们是等价的)的概念,以及香农信息熵的概念。现在的问题是,熵和香农信息熵之间是否存在关系?这也许是本次演讲中最重要的一张幻灯片。一旦理解了这一点,或者一旦我成功地传达了这张幻灯片上的信息,我想我的工作就完成了。需要理解的关键是:信息增加熵,删除信息减少熵。如果你问别人——我多次在同事、物理学家、学者等身上做过这个小测试——嘿,我正在将一些信息(比如数字数据)写入某种设备,我是增加了熵还是减少了熵?一旦你说我正在创造秩序、信息和数据,直觉会告诉你,你实际上在减少熵,因为你在组织事物,期望是你在减少熵。实际上恰恰相反。
让我解释一下。这里这个灰黑色的方形物体象征着一块材料,一个数据存储设备,也许是一块硬盘的一部分,这不重要,它是一个物理对象。我们可以计算这个对象的熵,即物理熵,所有可能形成这个兼容宏观状态的微观状态,并计算出这个熵,这是完全可行的。然后我们做一些有趣的事情。这是一个思想实验,假设我们现在通过某种过程将数据和信息(让我们把它设为数字的)写入这个对象。所以当你通过某种过程向其中添加数字信息时,你实际上是在创建所有这些绿色的0和1,这些额外的比特状态或信息状态被添加到物理系统中,实质上创建了另一个熵分量。你通过拥有初始的物理熵,再加上由这些比特状态给出的额外信息熵,增加了系统的总熵。这是最基本的事情,一旦理解了,围绕信息物理学以及由此产生的一些有趣结论的整个事情就会自然而然地出现。
如果你有 个数字信息状态,那么可能的排列或香农称之为不同消息的总数将是 。注意,这里的2是因为数字状态是0和1,这就是为什么是2。如果你有一个包含四种不同字符的消息,比如基因组中有四种,那么这里就是4。这个 等于可能的排列数量。现在我做那个外推,我说这等同于系统可能具有的、与宏观状态兼容的玻尔兹曼微观状态的数量 。在比特的情况下, 的最大值是1,所以你最终得到 个可能的最大微观状态或信息状态。
让我们看看这是什么样子。如果你有 ,那就是一个比特,那么 是1,然后 就会变成2,基本上是 。你可以这样理解:存在两种可能的状态。所以这个香农消息或香农事件集 将只有两种状态,0和1。所以一个比特可以是0或1,你是这样理解的。如果我们有 ,那么你最终得到四种可能的状态,然后这些状态的排列将是——你有 ,所以每个状态有两个比特——所以两个比特,你看,00, 01, 10, 11。所以有四种状态,每种状态包含 个比特,以此类推。如果你增加到三个,那么你最终得到八个,你将拥有000, 001, 010等所有这些组合。它就是这样运作的。
我将继续稍微讨论这个概念,因为我将再次将微观状态数 与 等同起来,现在我将定义一个信息熵 。这不是香农信息熵,这是一个信息熵,就像玻尔兹曼信息熵一样,就像玻尔兹曼的定义,他刻在墓碑上的那个。我将引入这个,然后将这个 代入玻尔兹曼的定义,你最终会得到一个信息状态的熵 。它依赖于一系列常数,然后只有两个变量,一个是系统中的比特数 ,另一个是香农信息熵 。这就是香农信息 与信息状态熵之间的联系。当然,你可以代入 的完整表达式,包括那个带有概率的求和等等,它看起来像这样。但关键是,如果你想观察这个信息熵分量的变化,这些变化将来自于 或者来自于香农信息熵 。所以,这一点要记住。当我们谈论这个熵的时间演化时,它将仅由这两个分量决定,这两个变量。让我们记住这里的目标,我们是倒着开始的,我阐述了信息动力学第二定律,现在我们正在建立共识,我们同意这一点,并试图理解它来自哪里。所以我们的目标是证明这个熵项随时间减少或保持不变。
实验与观察证据
1. 基因组学/病毒学证据 (SARS-CoV-2)
那么我们如何做到这一点呢?实际上,这对我来说是相当偶然地发生的。当我第一次研究这个问题时,事实上,我当时研究的几乎是一个好奇心驱使的问题。我的兴趣是——我出于完全不同的原因一直在研究信息论,我当时在研究一个存储设备的问题,在2018年接触到了香农信息论,我对此非常着迷。然后我了解了兰道尔的工作以及这个研究领域的一些其他东西,即物理学、数字信息和数学等之间的交叉领域。
然后我偶然看到了一所暑期学校的一些讲义,那位先生名叫汤姆·卡特,他在圣塔菲信息论暑期学校,天知道是1990年代什么时候,我找到了PDF文件。总之,他谈到使用信息论,香农信息论来研究基因组。看到那个,我完全着迷了。当时COVID-19大流行正在逼近,我们进入了封锁状态,我想,好吧,这听起来像个有趣的项目。我已经在研究信息论了,我打算研究这个基因组问题。我的目标是开发一种数学方法,使用信息论来检测病毒变体中的基因突变,不是通过基因组与基因组的逐个字符比较,而是使用香农信息论,就像软件和这种数学方法一样。这就是我进行这些研究的历史背景。
那么,什么是基因组呢?DNA或RNA序列是双螺旋或单螺旋序列,这些是极其复杂的信息存储、数据存储系统,由自然设计,或者也许是某种智能设计,我们现在不讨论这个,但它们高度复杂,它们具有纠错码,可以自我复制,它们非常稳定。它们编码信息的方式是通过四种关键化学物质,称为核苷酸,我们通常将它们标记为字母A, C, G,在RNA中,U取代了其中一个。所以只有四个字母,而香农消息,也就是整个事件集,就是由这些字母组成的字符串,构成了基因组。一旦你有了某个东西的基因组序列,你就可以开始对这些字母和事件进行数学运算了。
那么它是什么呢?它是一个四态概率系统。所以你只有四种可能的独特状态,而香农意义上的事件集将是A, C, T, G,概率将是这四种状态发生的概率。然后,如果你使用以2为底的对数,显然你会得到比特,你最终可以这样将整个基因组重新转换为二进制。我是这样将每个状态关联为两位比特状态的:A是00,C是01,G是10,T是11。这就是它的来源,你计算出每个状态两位比特,它看起来就是这样,这是你能达到的最大信息熵。
请记住,我们的目标仍然是研究这个信息熵以及时间演化,并检查这是否真的减少、增加或发生了什么。所以第一个目标是——再次强调,我并不是在寻找这个,我当时试图检测基因突变——但在这个检测基因突变的问题中,第一个目标是确保信息论的数学能够帮助那些试图将基因突变与信息熵联系起来的人。这里有一个随机生成的包含34个字符的DNA基因组子集,我故意将一个T突变为一个A,这是一个替换突变。所以蓝色的那个与原始的绿色那个相比有一个突变。然后我所做的就是计算原始片段的信息熵,我得到的值略低于2(记住2是最大值),大约是1.978。然后我重新计算了这个T变成A之后的信息熵,得到了1.987。显然,这些概率中唯一的变化发生在T上,所以 原来是11/34,在突变后我们失去了一个T,所以变成了10/34,然后我们得到了一个A,所以 从原来的8/34变成了9/34。总之,这个小小的变化在这两个序列之间产生了0.009比特的信息变化。换句话说,这里证明了基因突变与该基因组的信息熵或香农信息熵密切相关。
基于此——我想我不是第一个做这个的人,我不确定,但我认为这已经是已知的,信息论自70年代以来就被用于研究基因组——是否是以这种方式,特别是关注突变,也许,也许不是以这种方式。但无论如何,我自己做了,我意识到,是的,这很有效。
现在是时候研究基因组的时间演化了。那么,什么是基因组的时间演化呢?它意味着基因突变随时间的动态变化。为了实验性地研究这一点,你需要找到某种生物体,它能在很短的时间内发生大量的基因突变。最理想的选择是病毒,它们确实在短时间内遭受大量突变。正如我所说,我们当时处于封锁状态,我开始这个研究正是因为COVID-19,其基因组已在世界各地测序,有大量数据可供免费下载。一旦我有了数学模型,我就下载了数据并开始处理数据。
流程如下: 第一点,找到这种病毒(SARS-CoV-2,导致COVID-19大流行的病毒)的原始RNA序列,即2019年12月的武汉株,找到这个序列,然后计算该序列的信息熵。 第二点,找到该病毒的变体的RNA序列,这些变体具有不同数量的基因突变,也就是说,它们突变的数量不是相同的,而是比如说递增的基因突变数量。关键是只找到那些完全确定的序列。我这么说是什么意思呢?当他们测序基因时——我不是遗传学家,我不研究生物学之类的东西,但我不得不学习一些这方面的知识——所以当他们实际测序基因组时,有时会出现错误,在那个由A, C, T, G字符组成的字符串中,如果某个核苷酸没有被确定,你会得到一个N或者某种缺口或其他字符,用来表示无法确定那里是什么。所以这在香农信息熵方面行不通,至少我开发的软件不行。所以我必须只选择COVID-19的完全确定的变体才能进行我的分析。 第三点,现在计算每个变体的香农信息熵,并提取每个变体中的突变数量。 第四点,将信息熵值绘制成基因突变数量的函数图。换句话说,2019年的武汉株将有零个突变,因为它是参考基因组,没有突变,然后随着它们发展和突变越来越多,你将有递增数量的基因突变。这就是你需要的流程。
在我向你们展示数据之前,我需要解释另一件事。当我们谈论基因组的时间演化,以及本质上的基因突变时,这些可以通过三种不同的机制发生。一种是替换(substitution),替换的关键特征是核苷酸的数量保持不变。记住,你可以改变 或 ,这意味着 是恒定的,你只能改变 或香农信息熵,以产生信息状态熵的变化。所以这里有一个大大的问号,当你开始分析这样的系统时,对于恒定的 和替换,会发生什么。
删除(deletion),这意味着核苷酸从基因组中被物理移除,这意味着 ,即字符数或消息集中的字符数减少。所以这将保证——我在这里放了一个绿色标记——这将保证信息状态熵的减少,因为 自动成为那个公式中的一个因子, 减少,它将拉低整个项。
然后是增加(addition),这是 增加的情况,换句话说,基因组变长了,这是坏消息,我在这里放了一个红叉,这表明如果发生这种情况,情况不妙。
这是我从数据中提取的结果。我找到了448万个完整的、完全确定的SARS-CoV-2变体序列,提取时间从2020年1月到2022年1月。这是我一直在研究的时间段的数据集。在这近450万个序列中,替换型突变,即 保持不变(顺便说一下,SARS-CoV-2原始株的 是29903个字符),有48450个序列的 是恒定的,也就是说它们发生了替换型突变。增加型突变,这对我们来说是坏消息,在近450万个序列中,只有一个发生了增加,从29903增加到29904。我相信这在统计上是不相关的,实际上我认为这是一个假象,测序可能出了问题。所以我完全排除了这种机制,它不发生,它不占主导,它不相关。而删除型突变占了所有突变的98.92%,换句话说,在98.92%的情况下,基因组中信息状态的信息熵,在这个RNA基因组中,保证会减少,因为 减少了。
那么,增加型突变就不用考虑了,它不发生。唯一的问题是那些 保持不变的情况发生了什么,因为这是独特的方面。当 保持不变时,你需要开始改变A, C, T, G这些概率,使得整体的香农信息熵,即那个 函数减少,如果这是正确的。所以这是一个非常有趣的命题。我们需要验证这一点。我这里有一个问题,突变真的能以一种方式发生,使得概率 被修改,从而减少整体信息熵吗?这可能吗?
这是我使用的数据集,如你所见,有不同的国家,中国、美国、埃及、厄瓜多尔。我有测序日期,第三列是每个变体中统计到的突变数量。这些都是完全引用的,你可以在文章中找到参考文献。实际上,我的一位朋友兼合作者,他令人难以置信地花时间下载了所有这些序列,并重新计算了信息熵,重新复制了数据,证实了我发现的结果。老实说,我对此印象非常深刻,他花时间去检查和验证,并且他确实得到了相同的结果。
这就是结果。纵轴是信息熵,单位是比特,这是针对整个RNA基因组的,每个病毒的。横轴是突变数量。零突变意味着原始的2019年12月武汉基因组,显然是参考基因组,没有突变。然后,随着突变数量的增加,信息熵持续降低。这里对数据进行了一定程度的精心挑选,我必须承认这一点。我保留了——我有点像气候科学领域的人做的那样,你知道,当他们展示数据时,或者宇宙学领域的人,但我必须这样做才能让它看起来比实际情况好得多。但我可以向你保证,每一个都显示出相对于原始基因组的信息熵减少。
它会围绕这条直线散布吗?是的,会有散点之类的,但它们总是会低于初始值。所以关键是——记住我这里没有考虑任何因素,比如疫苗接种,或者环境因素,或者任何其他可能导致信息熵减少的力量,我什么都没考虑。关键在于它减少了,它总是减少。
所以我们说,基因突变似乎是以一种减少其基因组信息熵的方式发生的。换句话说,信息动力学第二定律得到了验证,或者也许不是验证,因为这是倒推的,它是对这个结论或这个信息动力学第二定律的一个支持,一个非常非常强有力的支持。
但还有更多。抛开信息动力学第二定律不谈,你拥有一个数学物理参数(如果你愿意这么称呼它)与基因突变之间的这种相关性,这是一件大事,实际上是一件非常大的事。原因是,它与共识相悖。科学共识,达尔文的进化论指出,基因突变是完全随机的事件,驱动进化的唯一因素是自然选择。所以任何相关性或这里的这条直线,本不应该发生。所以这不应该在这里。换句话说,因为它的存在,你就可以开始寻找一个首先驱动基因突变的机制,也许你可以将同样的机制作为一个预测算法,在基因突变发生之前预测它们,知道它们必须减少,并找到基因组中的关键位置,薄弱点,或者天知道是什么驱动了那里的机制。但是,说在这个基因组的这个位置,在某个时间点发生突变的可能性很高,我们无法确定时间,但我们可以说将会有一个突变,从而降低那里的信息熵。然后你就可以接入计算机和算法之类的东西,看看那个突变的影响会是什么,它会有益吗,它会损害你的有机体吗,或者会有什么好处。所以,利用这一观察结果预测基因突变的这一部分意义重大,因为它在某种程度上挑战了整个达尔文主义。
我使用了LabVIEW。LabVIEW是我们用于实验室环境中进行自动化、计算机接口等工作的软件。我对LabVIEW非常熟悉,所以我用了LabVIEW,因为它对我来说最方便。它不是进行这类工作的最理想平台,但我对现成的软件解决方案不感兴趣,不是为了销售或其他什么,我只是想测试这些想法。你在这里看到的是所谓的GenIs(基因信息熵谱),这是设计用来检测病毒及其变体中基因突变的软件,计算整个基因组的信息熵,并生成你在前面幻灯片中看到的数据。我所做的就是将整个基因组作为一个片段,因为在这里我做的是将基因组分成称为窗口的片段,每个窗口有给定的大小,然后我计算每个窗口的信息熵,然后将其绘制成窗口索引位置的函数,你就得到了这个红色的谱图,这就是基因组本身的数值表示,我现在称之为基因组的条形码。然后,你可以用它做两次,一次是原始的,一次是突变的,然后用一个除以另一个或者用一个减去另一个,你就会得到突变的确切位置,你看这个黑色背景上的白线,你会得到突变的确切位置和它们的索引值。我所做的就是将基因组的大小设为一个窗口,然后你看整个基因组的整体信息熵,这是对设计用于做其他事情的软件的一个小小的“取巧”的改编,用来解决一个它最初并非打算解决的问题。
我决定向你们展示这个的原因是,这就是我如何得出这个有趣结果的。你看这些白线上的尖峰,如果你用一个基因组除以另一个,原始的和突变的,如果它们相同且没有突变,你会得到一条在1处的直线,没有尖峰,没有拐点,什么都没有,就是一条直线1,它们是相等的。如果你有任何微小的变化,数百万个核苷酸中只有一个核苷酸发生微小变化,那么你会得到一个小尖峰,它确实能检测到这个,它确实有效。但我注意到,有时尖峰向上或向下,换句话说,基因组突变导致熵增加或减少,有时我会漏掉一些突变。这是一个非常复杂的软件,我在这里使用了M-blocks,然后我明白使用M-blocks不是一个好主意,我改回了计数单个核苷酸,换句话说,M-block为1。当你这样做时,所有这些尖峰突变总是指向同一个方向,表明突变的基因组熵减少了而不是增加了。这引起了我的兴趣,为什么会发生这种情况?这现在很有趣,我不仅检测到了所有突变,而且它们实际上是以一种特定的方式突变的,总是以减少熵的特定方式突变。所以这就是激发我兴趣的地方。
这项关于基因突变的工作是与我的同事Sam(一位生物信息学专家)共同发表的。然后我继续研究这个基因突变的预测算法,大约在2021年或2022年发表了相关成果。这就是这项工作。
2. 数字数据存储证据
这让我立刻在我完成这项工作后问了自己一个非常有趣的问题。我想知道这种行为是否可能超越这些有机系统,超越DNA、RNA信息系统,也许这实际上是更普适的,也许它在其他系统中也有效。我的背景是,我攻读了数字数据存储材料的物理应用博士学位。我很幸运有机会在希捷公司短暂工作过,担任高级研发,他们是磁性数据存储、硬盘驱动器领域的行业领导者。所以我在数字数据存储技术方面拥有广泛的知识和研究专长。我学到的一件事是,信息永远不会自发地出现在存储设备中,我希望你们同意我的这个观点。你永远不会有一个空白硬盘,然后视频、图片或文档自己从无到有地出现在上面,或者信息、数据之类的。然而,信息会自发地衰减,你会遇到比特错误率和各种数据擦除,可以说是自我擦除。这是可能的,但信息自己出现是完全不可能的。
所以我大概知道,数字数据或多或少符合信息状态熵随时间减少或保持不变的这一观察结果。所以我大概知道这一点,这是一个非常直观、众所周知的结果,尤其是在数据存储领域。原因在于 ,你有比特的自我擦除,你减少了 的数量,然后自动地,你最终会得到更少的信息状态。
我如何证明这一点呢?我联系了我的朋友兼合作者Serban,他是中央兰开夏大学的一名学者,我实际上是在那里攻读博士学位的。他开发了一个名为Boris的软件——抱歉我不记得这个缩写代表什么,也许它不代表任何东西——但这个软件旨在进行复杂的微磁学建模,它内置了各种附加的改进功能,比如温度和各种相互作用,包括蒙特卡洛方法等。所以我联系了Serban,我说,看,我们知道这种情况正在发生,我只需要以某种方式展示它,只需要模拟它。
所以我们所做的是,我们取了单词“information”。因此,每个字母将由一个8比特的字符串或一个字节表示。我把它们写在了中间的图表中。我们创建了一个样本,其中有11行,或者说11个字节,你只需在这个空间中以数字方式写入单词“information”。这就是它的样子。颜色编码是:蓝色代表0,红色代表1。所以你使用颜色编码来实际执行此操作。
当他进行微磁学研究时——这显然是磁性数据存储——当我们设计磁性器件和磁性数据存储时,我们使用一个公式,就是你左边看到的这个弛豫时间方程。它给出了一个磁畴甚至一个磁比特的弛豫时间。这个时间在行业标准中选为10年。换句话说,当我们设计这些设备时,它们被设计成能够承受高温、使用和各种情况达10年而不出现任何比特错误率。我们做到这一点的方法是选择这个弛豫时间 年,然后反向求解这个方程:。其中 是尝试频率,大约是 赫兹,然后你有玻尔兹曼常数 ,温度 (取室温),然后你有一个磁各向异性 (这是一个材料参数),以及你的磁颗粒体积 。所以你看,你不能改变很多东西,只能改变各向异性和体积。所以你减小体积,就必须增加各向异性来保持这个比率 恒定。事实证明,大约40的比率 会给你10年的弛豫时间,换句话说,一个能稳定10年的数据存储设备。
总之,Serban和我,或者说Serban用他的软件,我们故意减小了体积 ,以缩短这个弛豫时间,从而以加速的方式展示数据的衰减或自退化或自擦除。基本上是用软件。记住,当这种情况发生时,这个 会减少,那么你所有的微观状态数量都会减少,所以信息状态的熵会减少。当你这样做时——我忘了放那个迭代次数的图——但你从原始状态开始,然后写入数据(B是原始状态,C是写入数据),然后D是经过一段时间后,让它受到温度效应和其他因素的影响,经过足够长的时间后,它会自我擦除。它确实会指向信息状态熵的减少。
所以我非常兴奋,我和我的朋友兼同事在2022年发表了一篇名为《信息动力学第二定律》的文章。这有点牵强,因为它仅基于两个系统的证据——一个是有机生物信息系统,另一个是数字数据存储系统——并且或多或少是基于我的直觉,即这确实正在发生,我们可以称之为一条定律。但我对整个想法有点担心,因为要将基于如此少证据的东西推广为物理定律,有点牵强。自从发表那篇文章以来,我的目标一直是扩大其适用范围,并检查它是否在其他系统中也能得到验证。那是2022年,2023年,我成功地在2023年发表了一些东西,我相信,我相信我确实成功地改进了这一点,这就是我现在要向你们展示的,这项工作的扩展,2022年之后的内容。
普适性探索
1. 宇宙学应用
我想指出的第一件事是,这个第二定律在宇宙学中的应用。我希望我们都同意,关于宇宙,我们知之甚少,我们真的不知道这个宇宙是怎么回事,它是如何产生的。我的意思是,老实说,我们知道的太少了,我们知道的并不多。但有一点是共识,那就是它在绝热膨胀。我们知道它在膨胀,这是一个事实,而且是绝热的,因为如果它不是绝热膨胀,那就意味着宇宙将被包含在其他东西中,就像一个物体在另一个物体内部,它们会交换能量或热量。我希望我们同意情况并非如此。巧合的是,即使你假设宇宙是一个模拟,它也将在模拟内部绝热膨胀,它将被包含在其中,不与任何东西交换任何东西。换句话说, 必须为零。然后如果你将此与温度乘以熵变的乘积 (即热力学熵)等同起来,那么温度 显然不是零,它不可能是零,那是第三定律,你会违反那个定律。所以 必须为零。 为零意味着宇宙的绝热膨胀要求熵保持不变,宇宙的熵保持不变。
现在我需要指出,这个 对于可逆过程是有效的,这只是一个近似,即宇宙绝热且可逆地膨胀。但是如果你说,好吧,我不打算强求,我假设宇宙绝热且不可逆地膨胀,那么这个等号就变成了一个不等号,即 。我很高兴地告诉你们,我实际上已经做到了,这是一个非常代数的、非常容易的重新排列和非常快速的推导,你可以实际证明,它确实指向宇宙的信息熵分量,这个分量必须减少。那里有一个缺失的组成部分,它确实在减少。所以即使你把它当作不可逆的,它仍然成立。
但有趣的是这里。在一个不断膨胀的宇宙中,你实质上是在为现有的物质粒子、波、辐射等不断创造新的微观状态。这在这里象征性地表示出来了。红点象征着宇宙中所有的物质和一切,然后边界,也就是宇宙从大爆炸开始不断成长和膨胀的边界,就是这个越来越大的黑圈。但是这个圆圈里面的东西总是一样的,所以如果你数红点的数量,它应该是相同的。然而不同的是,它们可以在这个已经膨胀并且持续膨胀的时空结构中占据更多的位置。换句话说,宇宙随时间膨胀,熵必须增加,这就是热力学第二定律告诉我们的,在一个孤立系统中,熵必须随时间增加或保持不变。
那么,这就是悖论所在:熵如何能同时保持不变又增加呢?由于绝热膨胀,它必须保持不变,我们刚刚在上一张幻灯片中讨论过。而由于我刚刚展示的原因——宇宙的膨胀创造了新的微观状态,热力学第二定律实际上告诉我们这一点——它又必须增加。那么,你如何在这两个矛盾之间取得平衡呢?这是一个有点悖论的问题。
我想出的答案是,宇宙的熵预算必须包含一个之前没有被考虑到的熵项,我称之为宇宙中信息的熵 。当你引入这个项时,你很快就会得到 (物理熵变化率)和 (信息熵变化率),而总熵(例如对于可逆近似 )保持不变或按预期变化。信息动力学第二定律 很快就从这里推导出来了。同样,这是针对可逆变换近似的,如果你使用不可逆过程,你同样可以重现这个结果,它确实有效,但我现在不打算详细讨论这些细节,你们暂时需要相信我这一点。
2. 原子物理学应用 (洪特规则 Hund's Rules)
这是我们涵盖的一个案例。第二个案例,我称之为原子物理学,我不确定这是否完全准确,但其思想是,当你取一个原子,它有一定数量的电子,比如一个随机原子和它的一些电子,原子中的电子态完全由四个主量子数描述,它们是n, l, ml和ms(自旋量子数有两个,次级和主级)。
这是一个钴2+离子的图。钴有27个电子,那么钴2+会失去两个电子,所以它是一个离子,有25个电子。如果你填充轨道,你有s轨道,你看这里的n代表能级,所以能量向上增加,1, 2, 3等等,这些是能量的本征态,主量子数。然后你有轨道,你有s轨道,n等于2允许两个轨道,s和p,p有三个不同的态,然后n等于3有s, p, d轨道,d轨道有五个子壳层,可以容纳10个电子,这个(p)可以容纳6个,这个(s)可以容纳2个,以此类推。
这就是我们所知道的。关键在于,你如何将这些电子填充到原子轨道上?是使用两个现象学规则。一个是泡利不相容原理,它指出,你不能有两个或多个相同的费米子(实际上不仅仅是电子,是费米子)同时占据相同的量子态。换句话说,在这四个量子数中,至少有一个必须不同,它们必须是可区分的。电子必须是可区分的,它们不能占据相同的状态。电子彼此是相同的,但在原子内部,它们在轨道上的行为和功能必须是可区分的,你不能让它们相同。如果你取s轨道,比如这个s轨道,两个电子的n都相同,等于1,它们的l也相同,等于0,它们的磁量子数ml也为0,所以它们有三个量子数是相同的。那么,它们自旋不都向上或都向下的原因是,那样会违反泡利不相容原理,所以它们必须一个向上一个向下,它们的自旋量子数必须不同。这是第一条规则。
现在问题来了。如果你去到一个像这样的d轨道,它有5个亚层,可以容纳10个电子,但你只有7个电子。我们称之为未填满的轨道。在泡利不相容原理的框架内,你可以有多种方式用这7个电子填充这个d轨道而不违反泡利不相容原理。它可以以多种方式填充,然而只有一种构型是正确的,其他的都不正确。
这就引出了洪特规则。弗里德里希·洪特是一位德国物理学家,他在1927年提出了这个现象学规则,它规定了在多电子原子中,电子如何填充原子轨道的亚层。这是一个例子,我只是提取了一个例子。你有一个d轨道,有四个电子,d轨道有五个亚层,总共可以容纳10个电子,但你只有四个,所以你有六个空位。你如何放置这四个电子?原子乐于接受它们的正确方式是什么?事实证明,只有这个绿色的构型,编号为四的构型,这个绿色的构型实际上是正确的。这就是洪特告诉我们的,电子占据这些亚层时,会单个占据且自旋平行,从而给出可能的最大总自旋。所以它们矢量相加,你得到最大的自旋。你在这里看到的所有其他构型都满足泡利不相容原理,但只有一个是正确的,即洪特规则。你需要记住,两者都是现象学的,这些观察结果没有推导过程,我们只知道它们是这样的,我们称它们为现象学规则。
我所做的是,我对这些系统使用了香农信息论,将自旋向上和自旋向下分配为两个香农事件。在香农信息熵框架中,你最终得到一个包含两个状态的系统:自旋向上和自旋向下。它们有向上和向下的概率。你有 个电子,这将是轨道上自旋向上和自旋向下电子数量的总和。然后你得到一个看起来像这样的香农信息熵:。我将其分解为这些对数项的求和。
我对s, p, d和f轨道都做了这个计算,使用了所有可能的排列组合。例如,f轨道总共可以容纳14个电子,所以我从1个电子开始一直到14个。d轨道可以容纳10个,我从1到10都做了。我计算了所有可能的排列和组合,然后计算了它们每一个的信息熵,并将其绘制成总自旋的函数图,就像我对基因组所做的那样(注意,这里横轴是总自旋,而不是熵)。
一个非常有趣的观察结果是,总是,总是那个正确的构型,即具有最高自旋的构型,对应于最小的信息熵值。所以总是,你看S(总自旋)向右增加,所以这里所有的最小值都对应于每种可能的电子数量排列的最大自旋值。而且它在信息熵方面总是一个最小值。换句话说,信息动力学第二定律确实得到了验证。这里并非真正的时间演化,它们已经处于平衡状态,它们的最小信息熵状态。记住这些是基态,在零开尔文下——嗯,我们无法达到零开尔文,但它们是在非常低的温度下的基态。所以它们已经处于——你应该这样看,如果你加入其他能量项,比如温度或其他什么,你开始激发这些电子到不同的轨道,不同的能级,当然你会破坏这种排列,你当然会这样做。但是如果你然后让系统弛豫回平衡态,它将在平衡态的基态下将其信息熵降低到你在这里看到的样子。如果你加入过多的能量,你开始电离系统,电子完全从原子中飞出等等。
所以我在这里假设,洪特第一规则(它是现象学的)实际上是信息动力学第二定律的结果:电子以最小化其信息熵的方式占据壳层。这是一个漂亮的结果。
3. 自然界的对称性
我现在快结束了。我想谈的最后一件事是对称性问题。如果你环顾四周,自然界中的一切似乎都具有一定程度的对称性。对称性主导着宇宙,从亚原子尺度到宇宙尺度。它们跨越了从化学到生物学到数学的各个学科,它似乎是宇宙的一个基本属性。
然而,自然界中这种对称性主导地位的奇异之处在于:我们知道宇宙向高熵、高无序状态演化。那么问题是,一个向更多无序和高熵演化的宇宙,怎么可能表现出如此丰富的对称性而不是不对称性呢?这怎么可能?我们甚至如何开始解释这一点?实际上,我想在这里引用伟大的理查德·费曼的话,他确实认识到了这个问题,他说:“我们的问题是要解释对称性从何而来,为什么自然如此对称?没有人知道为什么。”所以这是一个巨大的谜题,一个巨大的困境,为什么对称性主导一切。
这种简单的信息论方法可以用来研究对称性问题。这就是我所做的。你在这里看到的是,我取了最基本的二维欧几里得形状,即三角形。这是一个没有对称性的普通三角形。首先,你如何量化对称性?我通过计算对称元素来量化对称性。你可以计算你能做的对称操作,有不同的方法。在这项研究中,我计算了对称元素。左上角的这个三角形绝对没有对称元素,这个形状没有任何对称性。如果你想定义这个形状,你需要知道边长a, b, c和角度 。如果我们抛开我们已知的其他数学知识,比如角度之和是180度和勾股定理等等——假设你对数学一无所知,你想画出这个形状,你需要知道角度和每条边的长度。这构成了一个包含六个字符(三角形的边和角)的香农信息熵框架中的消息集合X。它们各自出现的概率都是1/6,因为它们都只出现一次,这里没有对称性。当你计算这个三角形的信息熵值,即每个字符编码了多少信息时,你得到2.585比特的信息。
然后你向下移动到其他具有对称性的形状。当你做同样的事情时,你最终会观察到,某个物体或形状中的对称性越多,与该物体相关的信息熵就越低。这就是图表:左边是信息熵,水平方向是对称元素,然后是这些三角形的形状。
然后我转向四边形。我取了所有可能的排列,从零对称元素(顶部那个)一直到一个正方形(有五个对称元素和最对称的形状)。同样,你将所有这些图形的信息熵绘制成对称元素的函数,你会得到一条直线,其中信息熵的减少与对称性的增加是一致的。换句话说,这证明了——并且这对3D几何以及你想检查的一切都适用,如果你想做这个练习的话——自然界中的对称性,这个困扰费曼和其他许多人的问题,是信息动力学第二定律的结果。它要求这个信息熵随时间减少,这就是它变得非常有趣的地方。
我于2023年发表了这项成果,你看这里的标题,它引出了模拟宇宙假说的概念。所以在这篇文章的标题中,我在这里介绍的所有内容以及一些额外的细节,实际上都在这本书《现实重装》(Reality Reloaded) 中给出了。它不是一本很厚的书,是我发表的论文的合集,略有扩展,大约140-150页。但是你会得到比手稿更多的东西。手稿可以免费下载,是一篇开放获取的论文。这本书是商业发行的,你可以通过二维码或网站以及亚马逊等渠道购买。
深远影响与推论
1. 模拟宇宙假说
现在是讨论环节,我快结束了。现在讨论的是,这信息动力学第二定律意味着什么?这是我希望你们注意并努力跟上我的思路的地方,因为我现在告诉你们的非常重要。
想象你有一堆砖块,就像左边这张图。你有一堆砖块,你想建造某种建筑,比如说一堵墙。我不想听起来像特朗普,但你真的想建一堵墙。要做到这一点,你需要投入一些能量,你需要做一些功,在这个过程中,你需要一些材料,水泥等等,你还需要动脑筋,付出体力劳动等等,然后你用这些砖块砌成了一堵墙。
现在你想象你有一堆类似大小、相同体积、也许相同质量的石头,但这次不是砖块,而是一堆形状不规则的石头,它们没有对称性。这些是完全破碎的石头或砖块,没有对称性等等。你能用这些石头砌成一堵墙吗?答案是肯定的,是的,你可以砌成一堵墙。你向系统做一些功 ,然后你最终得到一堵看起来像这样的墙。然而,功 远大于 。为什么呢?因为当你用这些不规则结构的材料砌墙时,你必须使用更多的认知能力,你必须更多地思考,你必须使用更多的材料,更多的水泥。看看石头之间的空隙,你实际上用了更多的水泥来填补空隙,以弥补缺乏平坦表面、90度对称性等等的不足。换句话说,用这种结构的材料建造同样的墙,比使用具有平坦表面、漂亮的90度顶点对称性等等的砖块,需要消耗更多的能量。
但关键在于,那堆砖块里的砖不是凭空出现的。那块砖是智能设计的产物。是人类,某个设计了砖块的人,为了某个目的,赋予了砖块那些对称性和它所具有的特性,以便在建造那堵墙的过程中让我们的生活更轻松。那块砖背后有智能设计,它不是凭空出现的。
好吧,现在让我们将这个概念外推到整个宇宙。就像砖块是智能设计的产物一样,那么自然界中的对称性呢?它们是否也可能是智能设计的产物?它们存在的理由,它们与物理学相悖——热力学第二定律要求混乱和无序,而我们到处都有对称性——这怎么可能呢?因为这完全是一个矛盾。那么问题是,就像那些砖块一样,它们不是自然形成的,它们是为特定目的而智能设计的产物,宇宙中对称性的背后是否也是同样的机制呢?
那么,为什么会这样呢?那是因为对称性,就像砖块的情况一样,有助于优化能量和计算能力。换句话说,信息动力学第二定律表明宇宙有可能优化信息内容,也就是说,它进行了数据压缩。因为这条信息动力学定律似乎是普适的——我希望你们同意我们已经看到许多系统确实符合这一点——所以它似乎是普适的,它表明宇宙本质上遵循一个计算过程。换句话说,通过外推,我们可以说它是一个基于这些观察的模拟构造。
这些结果源于信息论——正是这个理论给了我们数字计算、比特单位等等——这一事实,进一步强化了这种可能性:我们之所以看到这些特征,是因为宇宙本身就是一个计算程序,一个计算构造体,一个模拟。
最后,也许我会引用另外两位伟人的话,爱因斯坦和玻尔。爱因斯坦曾质疑现实是否真实,他说现实是一种幻觉。而玻尔说,我们称之为真实的一切,都是由不能被视为真实的东西构成的。当然,这两位先生是在量子力学的背景下使用这些格言的,我相信是这样。但他们并不是唯一感觉到物理学中有些东西缺失,有些东西在现有物理学范式内无法解释的人。我们需要一些跳出框框的思考,来解释它们,或者至少开始理解某些事情。
2. 其他物理学意义
哦,还有一张幻灯片。那么我在这里想说什么呢?抛开这个模拟宇宙的结论不谈,这项研究还引出了另一个有趣的事情,那就是存在一个等效原理,2019年发表的,叫做质能信息等效原理。这基本上是说信息是物理的,这并非由我提出,是兰道尔在60年代提出的,但他将信息等同于能量。我所说的是,如果能量是质量,质量是能量,而信息是能量,那么质量、能量、信息必须是等效的。所以这是2019年提出的一个扩展的等效原理。
现在,信息动力学第二定律要求信息内容被压缩,或者信息减少。如果信息是一个像质量、能量一样的物理量,那么这本质上意味着能量的减少,系统能量的减少。这是另一种表述。这就是当你想在物理学中计算任何系统的平衡时,你寻找的是最小能量,你最小化能量,我们就是这么做的,系统向最小能量演化。
所以我在这里想说的是,信息动力学第二定律与能量最小化高度一致,与系统趋向最低能量的趋势高度一致。这正是在信息动力学第二定律的驱动下我们所看到的,系统向最小信息状态移动,如果信息是物理的,那本质上就意味着最小能量。
总结与展望
最后,信息动力学第二定律可以被视为物理学中建立和寻求系统平衡条件的工具。因此,除了能量最小化之外,我们还需要考虑其他因素,特别是系统信息内容的最小化。这对于那些没有太多能量的系统尤其重要,例如,在接近零开尔文的基态下填充的轨道,那里几乎没有任何热能,你可能有其他形式的能量和势能,但没有热能。但是一个三角形的能量是什么?一个几何形状没有能量,但它却有一个最小信息含量状态,在高度对称的情况下。
所以这是需要牢记的一点,未来的研究在寻找平衡态时,确实应该同时考虑信息动力学第二定律,看看它是否能带来任何额外、有用的东西。
挑战在于——这也是我现在正在努力的方向——进一步扩展这个定律的适用性,并找到更多适用此定律的系统。我越是研究,就越相信它确实是普适的。但是事情现在有点慢,我在这方面还没有取得太大进展,我同时在进行多项工作。但这是我的挑战,希望其他人能够继续这项工作,也许能提出其他系统,并说,嘿,这确实表明信息熵是一个动态参数,在向平衡演化的过程中减少或保持不变。这就是我希望在未来听到和看到的。
就此,我要感谢大家,非常感谢。哦,天哪,已经6点半了,这太不可思议了,时间太长了。非常抱歉,我没有意识到完成这个花了这么长时间。我就以最后这张幻灯片结束,然后我们来回答问题。
要点回顾
引言
- 演讲主题:解释信息动力学第二定律 (Second Law of Infodynamics) 及其影响。
- 演讲目的:深入解释该定律背后的科学原理,而非媒体关注的“模拟宇宙”假说。
信息动力学第二定律的提出
- 信息动力学第二定律核心表述:一个孤立系统的信息状态的熵随时间必须减少或保持不变。
- 数学表达式: (其中 代表信息状态的熵)。
- 与热力学第二定律的对比:热力学第二定律指出孤立物理系统的熵随时间必须增加或保持不变。
- 数学表达式:。
理论基础回顾
1. 热力学熵
- 克劳修斯 (Clausius) 的贡献 (1865):
- 认识到热力学系统状态变化时发生的根本性转变。
- 创造了“熵”(entropy)一词,源于希腊词“entropia”,意为“转变”(transformation)。
- 表达式: (其中 是热量交换, 是温度, 是熵的无穷小变化)。此为热力学熵。
- 玻尔兹曼 (Boltzmann) 的贡献 (约1877年,与吉布斯部分工作相关):
- 揭示了熵的统计学基础,将熵与系统的微观状态数量联系起来。
- 玻尔兹曼熵公式: (其中 是玻尔兹曼常数, 是系统微观状态的数量)。
- 另一种表达形式: (其中 是粒子总数, 是粒子处于微观状态 的概率)。
- 对于大数量粒子且达到玻尔兹曼平衡分布的系统,热力学熵与玻尔兹曼熵等价。
2. 香农信息熵 (Shannon Information Entropy)
- 香农 (Shannon) 的目标:
- 发展通信理论,研究通过含噪声信道最有效地传输信息。
- 被认为是数字计算之父,引入了“比特”(bit)作为信息单位。
- 信息的度量:
- 从观察一个事件中可获得的信息量与该事件发生的概率相关。
- 信息与不确定性相关:事件越不确定,解决其不确定性所需的信息就越多。信息是解决不确定性的过程。
- 香农的信息定义 (公理化方法):
- 信息是概率 的函数 。
- 属性:非负性; (确定事件不提供信息);独立事件的联合信息等于各自信息之和;关于概率是连续函数。
- 满足所有这些要求的唯一函数是对数函数: 或 。
- 当底数 时,信息单位是比特。
- 香农信息熵 :
- 对于包含 个事件 (或字母) 的消息 (事件集 ,对应概率分布 ),观察一次该消息所能提取的信息量。
- 公式:。
- 此公式形式上与玻尔兹曼熵的统计表达式相似。
3. 连接物理熵与香农信息熵
- 核心观点:信息增加熵,删除信息减少熵。
- 思想实验:向物理设备(如硬盘)写入数字信息(0和1),会在原有物理熵的基础上增加一个由这些信息位态(bit states)贡献的信息熵分量,从而增加系统的总熵。
- 信息状态数量:对于有 个数字信息状态的系统,可能排列或不同消息的数量为 (对于二进制状态, 是香农信息熵)。
- 这被等同于玻尔兹曼微观状态数 。
- 信息熵 () 的定义 (类玻尔兹曼形式):
- 。
- 的变化来源于 (系统中的比特数) 或 (香农信息熵) 的变化。
实验与观察证据
1. 基因组学/病毒学证据 (SARS-CoV-2)
- 研究动机:在COVID-19大流行期间,使用信息论方法检测病毒变体的基因突变。
- 基因组作为信息存储系统:
- DNA/RNA序列由四种核苷酸 (A, C, G, T/U) 组成,构成一个四态概率系统。
- 每个核苷酸状态可编码2比特信息 (例如 A=00, C=01, G=10, T=11)。
- 基因突变与香农信息熵变化:
- 示例:DNA片段中一个T突变为A,导致概率 和 改变,从而使信息熵 发生变化 (示例中增加了0.009 bits)。
- 研究步骤 (SARS-CoV-2):
- 获取原始病毒株 (武汉2019) RNA序列,计算其信息熵 。
- 寻找具有不同数量基因突变的病毒变体RNA序列 (要求序列完全确定,无未知碱基'N')。
- 计算每个变体的信息熵 ,并统计其突变数量。
- 绘制信息熵 随突变数量变化的图表。
- 突变类型对信息熵 的影响:
- 替换 (Substitution):核苷酸数量 保持不变,仅 可能改变。
- 删除 (Deletion):核苷酸数量 减少,这将保证信息熵 减少。
- 增加 (Addition):核苷酸数量 增加,这对假设不利。
- 数据分析 (2020年1月 - 2022年1月,448万条完整SARS-CoV-2变体序列):
- 替换型突变占约0.11% (原始 个字符)。
- 增加型突变仅1例 (从29903到29904),被认为统计上不显著或为测序伪影。
- 删除型突变占98.92%,这些情况下信息熵 必然减少。
- 关键结果 (替换型突变):
- 图表显示,随着突变数量的增加,病毒基因组的整体信息熵 持续降低。
- 这一结果支持信息动力学第二定律。
- GenIs软件:
- 用于检测病毒及其变体中的基因突变,计算全基因组信息熵。
- 将基因组分割成窗口,计算每个窗口的信息熵,绘制“条形码”图谱。
- 通过比较原始和突变基因组(相除或相减),精确定位突变。
- 关键发现:当使用单核苷酸分辨率时,突变(谱线上的尖峰)始终指向熵减少的方向,这激发了对信息动力学第二定律的思考。
2. 数字数据存储证据
- 普遍性思考:该定律是否适用于非有机系统?
- 数字数据存储的直觉:
- 信息不会自发地出现在存储设备中。
- 但信息会自发衰减(比特错误率,数据自我擦除),这意味着信息比特数 减少,从而导致信息熵 减少。
- 微磁学模拟 (Boris软件):
- 将单词 "information" 编码为8位比特串。
- 磁性颗粒的弛豫时间公式: (其中 是磁各向异性, 是磁颗粒体积)。工业标准设计目标是10年。
- 实验中故意减小体积 以加速数据衰减/自擦除过程。
- 模拟结果显示,随着时间推移,数据确实会自我擦除,信息熵 降低。
- 论文发表 (2022):“信息动力学第二定律”,基于有机生物信息系统和数字数据存储系统的证据提出。
普适性探索
1. 宇宙学应用
- 宇宙的绝热膨胀:
- 宇宙绝热膨胀意味着 。对于可逆过程,,即宇宙的物理熵保持不变。
- (演讲者提及,即使考虑不可逆过程 ,推导结果依然指向信息熵 )。
- 宇宙学悖论:
- 绝热膨胀要求熵恒定。
- 但宇宙膨胀为现有物质粒子创造了新的微观状态,根据热力学第二定律,这应导致熵增加。
- 解决方案:
- 宇宙的总熵预算必须包含一个之前未被考虑的信息熵项 。
- 为了在宇宙膨胀、可用微观状态增加(导致物理熵有增加趋势)的同时,保持总物理熵 恒定(或在不可逆情况下不减少),信息熵 必须减少。
- 这直接导向 。
2. 原子物理学应用 (洪特规则 Hund's Rules)
- 原子内电子态:由四个主量子数 (n, l, ml, ms) 描述。
- 泡利不相容原理 (Pauli Exclusion Principle):没有两个或多个相同的费米子可以同时占据相同的量子态(至少一个量子数不同)。
- 洪特规则 (Hund's Rules, 1927, 现象学规则):规定了在多电子原子中,电子如何填充原子轨道的亚层(例如,最大化总自旋)。
- 信息论方法:
- 将自旋向上和自旋向下视为两个香农事件。
- 计算了s, p, d, f 轨道上不同电子排布构型的信息熵 。
- 结果:
- 遵循洪特规则的构型(具有最高总自旋)总是对应于最低的信息熵值。
- 推论:洪特第一规则是信息动力学第二定律的一个结果,即电子占据亚层的方式使其信息熵最小化。
3. 自然界的对称性
- 观察:对称性在自然界中无处不在,从亚原子尺度到宇宙尺度。
- 费曼的困惑:如果宇宙向高熵、高无序状态演化,为何自然界表现出如此多的对称性而非不对称性?
- 信息论方法应用于几何形状:
- 比较不同对称性程度的三角形(从0个对称元素到多个)。
- 比较不同对称性程度的四边形(从0个对称元素到正方形的5个对称元素)。
- 结果:
- 形状的对称性程度越高,其关联的信息熵越低。
- 结论:自然界中的对称性是信息动力学第二定律的结果,即系统演化倾向于降低其信息熵,从而表现出更高的对称性。
深远影响与推论
1. 模拟宇宙假说
- 类比:用规则的砖块(对称)砌墙比用不规则的石头(不对称)砌墙需要更少的能量和认知努力,因为砖块是为特定目的而“智能设计”的。
- 推断:自然界中的对称性是否也是为了优化能量和计算能力而被“智能设计”的?
- 信息动力学第二定律的启示:
- 宇宙倾向于优化其信息内容(数据压缩)。
- 该定律的普适性表明宇宙遵循一个计算过程。
- 结论:通过外推,宇宙可能是一个模拟构造体。
- 引用爱因斯坦和玻尔关于现实本质的言论。
2. 其他物理学意义
- 质能信息等效原理 (Mass-Energy-Information equivalence principle, 2019):信息是物理的。根据信息动力学第二定律,信息内容的减少(压缩)意味着系统能量的减少。
- 与能量最小化原理的一致性:物理系统演化到最低能量状态。信息动力学第二定律驱动系统向最小信息状态演化,如果信息是物理的,则等效于向最小能量状态演化。
- 作为物理学工具:
- 信息动力学第二定律可用于确定系统的平衡条件,特别是在能量最小化不那么直接的系统中(如几何形状,其本身没有能量,但有最小信息含量状态)。
总结与展望
- 当前挑战:进一步扩展该定律的适用性,寻找更多符合该定律的系统。
- 期望:希望其他研究者能够验证并在更多系统中发现信息熵作为动态参数,在系统向平衡演化过程中减少或保持不变。