语言文字、思维活动和大脑的功能逻辑——基于逻辑存储结构的推理模型

(摘要)

本文从当前人工智能领域中的热点——大语言模型(LLM)开始,

依据语言学的有关研究成果,分析了大语言模型(LLM)能够输出高质量文本内容和出现“智能涌现”现象的部分原因,讨论了语言文字与思维活动之间的关系;

依据数学方面的有关理论,探究了思维活动通过语言文字展现出的一些数学特征,即可以将思维活动的单位——概念视为数学中的集合,则思维活动通过语言文字进一步展现出群论中的幺半群和拓扑学中的拓扑空间的特征;

依据德国马克斯•普朗克人类认知与脑科学研究所创始人安吉拉 D·弗里德里希(Angela D·Friederici)的有关脑科学的研究成果——发现了大脑中BA44区的腹侧部分是基本句法运算“合并”这一操作的生物基础,提出基本句法运算“合并”这一操作的本质实际是思维活动通过语言文字所展现的概念进行的组合操作,或者说是具有相应概念的事物组成的集合进行的交集运算,为前面提出的思维活动通过语言文字展现出的幺半群和拓扑空间等数学特征的观点给出了生物基础证据;

最后对大脑中信息的逻辑存储结构进行了推测,提出基于逻辑存储结构的推理模型。

摘要一: 语言文字的形成是基于社会的约定,具有任意性,从数学的角度看,其呈现出非确定性的、随机的特征。这个特征与大语言模型(LLM)通过概率来判断语言文字输出的运行机制在一定程度上是契合的。

摘要二: 大语言模型(LLM)出现“智能涌现”现象的部分原因在于,人们往往将语言文字和思维活动相混淆,且当大语言模型(LLM)输出高质量的文本内容时,其就可能会被部分的人误以为是出现了“智能涌现”现象。

摘要三: 语言文字是高维空间的思维活动在低维空间上最重要的投影。其中,语言是高维空间的思维活动在一维空间上最重要的投影;文字是高维空间的思维活动在二维空间上最重要的投影。

摘要四: 场景信息分为感知场景信息和抽象场景信息;感知场景信息是由人类的感觉器官从现实世界中感知各种维度的信息而获得;抽象场景信息是由人类的抽象思维能力构建的场景信息,第一层的抽象场景信息是由人类的抽象思维能力在感知场景信息的基础上构建而来的,即由人类所特有的抽象思维对来自感性思维的信息进行抽象、概括而建立的各种概念,第二层的抽象场景信息是在第一层的抽象场景信息上构建而来的,以此类推。

摘要五: 语言文字具有人们可以共同理解的内容,也有每个人自己理解的内容,且场景信息的唤醒与具体的语言文字无关,不同民族的语言文字可以唤醒相似的场景信息。

摘要六: 语言文字的背后实则隐藏着海量的各种维度的信息,语言文字不会也不可能事无巨细地将思维活动的内容全部反映出来,语言文字是抽象思维对所想要表达的内容具有的部分概念、属性或特征的表达。

摘要七: 思维能力是全人类共同的,但语言文字是各民族不同的,因此需要从各民族不同的语言文字中找到与思维活动相关的共同的部分,通过这些共同的部分来研究思维活动。

摘要八: 语言的单位是词和句子,思维的单位则是概念、判断、推理;概念的载体是词语,判断是以句子为形式,推理涉及一组句子。以上语言文字与思维活动之间的对应关系,与具体的语言文字无关,任何民族的语言文字都有这样的对应关系,这是各民族不同的语言文字所体现的、与思维活动相关的共同的部分。

摘要九: 概念是对事物本质属性的概括,即概念可以反映具有共同本质属性的所有事物,从数学的角度看,概念可以看成具有共同本质属性的所有事物的集合,即思维活动通过语言文字展现出概念具有数学中集合的特征。

摘要十: 语言学中的普遍语法研究认为基本句法运算是“合并”,且脑科学的研究则发现了大脑中BA44区的腹侧部分是基本句法运算“合并”这一操作的生物基础。基本句法运算“合并”这一操作的本质实际是思维活动通过语言文字所展现的概念进行的组合操作,或者说是具有相应概念的事物组成的集合进行的交集运算。

摘要十一: 思维活动借助语言文字呈现出了一个关于概念的集合,显然这是一个集合的集合,其进一步展现出群论中的幺半群和拓扑学中的拓扑空间的特征。

摘要十二: 大脑中信息的存储应符合世界的规律,即在生理层面,信息的存储需遵循生物或物理规律,而在逻辑层面,信息的存储则应遵循数学规律,即应当有相应的数学工具可以进行描述或解释,若现有数学工具无法胜任,则创造新的数学工具进行描述或解释。

摘要十三: 推测大脑中信息的逻辑存储结构是一种三维空间点阵形式。这是一种既极其简单又可理解,还可以高效地存储和操作超大规模各类信息的存储结构。

摘要十四: 语言文字天生就不是用来完整地描述事物的工具,而是通过抽取事物的部分特征来描述事物的,语言文字无法承载表示事物的完整信息量。

摘要十五: 三维空间点阵形式的逻辑存储结构,可以有效解决世界模型中超大规模原始感知信息的存储和理解的问题,并且这种逻辑存储结构更为基础和纯粹,只涉及数学原理,不受任何语言符号和信息类型等因素的影响,从而更能从本质上揭示生命的思维从简单到复杂的进化历程。

摘要十六: 基于逻辑存储结构的推理模型的两点基本内容:根据场景信息在三维空间点阵中存储结构的相似性,构建事物的概念;根据场景信息生成的先后顺序,建立事件的因果关系。

关键词:人工智能 大语言模型 语言文字 思维活动 大脑的功能逻辑 逻辑存储结构 三维空间点阵 推理模型

目 录

第一部分 关于大语言模型(LLM)
一、大语言模型(LLM)能够输出高质量文本内容的部分原因
二、大语言模型(LLM)出现“智能涌现”现象的部分原因

第二部分 关于语言文字和思维活动
三、语言文字与思维活动之间的关系
四、思维活动通过语言文字表达一种什么样的信息
五、思维活动的单位与语言文字的单位的对应关系
六、思维活动通过语言文字展现出的一些数学特征

第三部分 关于大脑的功能逻辑
七、大脑中信息的逻辑存储结构
八、基于逻辑存储结构的推理模型

主要参考文献