Vol.3,No.3 第3卷第3期 ComputerScienceandTechnology 计算机科学与技术 September,2024 2024年9月 生成式AI与通用人工智能(AGI)基础理论最新研究成果综述 邹晓辉1,2,* 1模型链(重庆)科技有限公司,重庆401120 2北京大学跨学科知识建模课题组,北京100871 摘要:本文聚焦于生成式AI,作为当代人工智能(AI)与通用人工智能(AGI)典型代表,旨在深入探讨其基础理论方面的最新研究进展。其方法是通过对比分析传统AI与当代AI在底层逻辑、形式化理解上的差异,并进一步探讨传统AI的三个核心观点(符号主义、联结主义、行为主义)与当代AI三大流派(基于大型语言模型 (LLM)的生成式AI/AGI,如ChatGPT;以小模型为特征的新质生产力AGI,如I3DNA;兼容于大小两类模型的基于孪生图灵机双重形式化理解模型)之间的区别。其结果是揭示出了AI与AGI基础理论的核心构成:序位逻辑、联动函数以及基于数智文本的广义双语与广义翻译所遵循的三大基本定律。其意义在于:不仅增强了以ChatGPT为代表的基于LLM的生成式AI/AGI的可解释性,而且还为以小模型为特征的新质生产力AGI及其复杂的宇宙智能论和天下模型理论提供广义翻译,同时展示了孪生图灵机作为兼容并蓄的智能体在整合数据、知识、算力、算法及人机互助新时代认知范型的潜力,为构建超级智慧系统奠定了基础。 关键词:生成式AI;通用人工智能;符号主义;联结主义;行为主义;大型语言模型;孪生图灵机;新质生产力AGI DOI:10.57237/j.cst.2024.03.004 AReviewoftheLatestResearchAchievementsintheBasicTheoryofGenerativeAIandArtificialGeneralIntelligence(AGI) XiaohuiZou1,2,* 1ModelChain(Chongqing)TechnologyCo.,Ltd.,Chongqing401120,China 2InterdisciplinaryKnowledgeModelingResearchGroup,PekingUniversity,Beijing100871,China Abstract:ThispaperfocusesongenerativeAI,atypicalrepresentativeofcontemporaryartificialintelligence(AI)andartificialgeneralintelligence(AGI),aimingtodelveintothelatestresearchprogressinitsbasictheory.TheresearchmethodinvolvesacomparativeanalysisofthedifferencesinunderlyinglogicandformalunderstandingbetweentraditionalAIandCurrentAI,furtherexploringthedistinctionsbetweenthethreecoreviewpointsoftraditionalAI(symbolism,connectionism,behaviorism)andthethreemajorschoolsofCurrentAI(generativeAI/AGIbasedonlargelanguagemodels(LLMs)suchasChatGPT;newqualityproductiveforceAGIcharacterizedbysmallmodels,suchas *通信作者:邹晓辉, 收稿日期:2024-07-31;接受日期:2024-08-28;在线出版日期:2024-09-09http://www.computscitech.com 83邹晓辉:生成式AI与通用人工智能(AGI)基础理论最新研究成果综述 I3DNA;andtwinTuringmachinesbasedondualformalunderstandingmodelsthatarecompatiblewithbothlargeandsmallmodels).TheresearchrevealsthecorecomponentsofthebasictheoryofAIandAGI:bit-listlogic,linkagefunctions,followedbygeneralizedbilingualismorgeneralizedtranslationbasedondigitalandintelligenttextwiththethreefundamentallaws.ThesignificanceofthisresearchliesinnotonlyenhancingtheinterpretabilityofgenerativeAI/AGIbasedonLLMsrepresentedbyChatGPTbutalsoprovidinggeneralizedtranslationsforthenewqualityproductiveforceAGIcharacterizedbysmallmodelsanditscomplextheoriesofcosmicintelligenceandtheuniversalmodelseries.Atthesametime,itdemonstratesthepotentialoftwinTuringmachinesasinclusiveintelligentagentsinintegratingdata,knowledge,computingpower,algorithms,andhuman-computermutualassistanceintheneweraofcognitiveparadigms,layingthefoundationforconstructingsuperintelligentsystems. Keywords:GenerativeAI;ArtificialGeneralIntelligence(AGI);Symbolism;Connectionism;Behaviorism;LargeLanguageModels(LLMs);TwinTuringMachines;NewProductiveForceAGI 1引言 随着人工智能技术的飞速发展,生成式AI作为当代AI与AGI的重要分支,展现出了前所未有的创新潜力与应用价值。本研究致力于探索生成式AI及其所属AGI领域的基础理论最新成果,以期为该领域的深入发展提供理论支撑。[1,2]近年来,人工智能技术取得了巨大的进步,其中生成式AI作为当前AI和更广泛的人工通用智能(AGI)领域的一个重要分支,展现出极大的创新潜力和广泛的应用价值。简单来说,生成式AI能够创造出新的内容,比如文本、图像或者音乐,这在很多领域都有着革命性的应用前景。本研究主要目标是探索生成式AI及其所属的AGI领域在基础理论 方面的最新成果,希望通过这样的研究,为这一领域的深入发展提供坚实的理论支持,推动其更好地应用于实际生活中。 2传统AI与当代AI的底层逻辑 传统AI主要基于符号处理、模式识别与算法优化,其核心理念包括符号主义、联结主义和行为主义。而当代AI,特别是生成式AI,则侧重于数据驱动的深度学习模型,尤其是大型语言模型(LLM)的应用,实现了从规则驱动到数据驱动的根本转变。[3-5] 表1传统AI与当代AI(特别是生成式AI)的多因素平行比较 因素 传统AI 当代AI(特别是生成式AI) 核心理念 符号主义、联结主义、行为主义 数据驱动的深度学习 主要方法 符号处理、模式识别、算法优化 深度学习模型,尤其是大型语言模型(LLM) 逻辑基础 规则驱动 数据驱动 处理方式 基于预设规则和模式进行推理和判断 通过大量数据进行学习和自我优化 应用场景 专家系统、模式识别、算法优化等 自然语言处理、图像识别、智能推荐等 优势 在特定领域和规则明确的任务中表现优秀 在复杂、多变的任务中表现出更强的适应性和学习能力 挑战 难以处理大规模数据和复杂任务 需要大量数据和计算资源,且存在可解释性差等问题 由表1可见,a核心理念与方法:传统AI主要基于符号主义、联结主义和行为主义,采用符号处理、模式识别和算法优化等方法。当代AI,特别是生成式AI,则侧重于数据驱动的深度学习模型,尤其是大型语言模型(LLM)的应用。b逻辑基础与处理方式:传统AI是规则驱动的,它依赖于预设的规则和模式进行推理和判断。当代AI是数据驱动的,它通过大量数据进行学习和自我优化,从而适应不同的任务和环境。c 应用场景与优势:传统AI在专家系统、模式识别、算法优化等领域有广泛应用,并在特定领域和规则明确的任务中表现出色。当代AI在自然语言处理、图像识别、智能推荐等领域展现出强大的能力,特别是在处理复杂、多变的任务时表现出更强的适应性和学习能力。d挑战与展望:传统AI面临难以处理大规模数据和复杂任务的挑战。当代AI则需要大量数据和计算资源,并且存在可解释性差等问题,但其在未来的发展 http://www.computscitech.com 计算机科学与技术2024,3(3):82-8884 中仍具有巨大的潜力和价值。总之,传统AI与当代AI在底层逻辑上存在显著差异。传统AI主要是基于符号处理和规则驱动,而当代AI则侧重于数据驱动的深度学习模型。这种转变使当代AI在处理复杂、多变的任务时表现出更强的适应性和学习能力,但同时也带来了新的挑战和问题。 3形式化理解上的差异 在形式化理解层面,传统AI倾向于构建明确的规则体系,通过符号操作和逻辑推理实现问题求解。而当代AI则通过深度学习实现了对复杂模式的隐式理解与生成,这种转变不仅提升了处理复杂问题的能力,也带来了可解释性上的新挑战。[6,7] 传统AI 当代AI 核心方法 构建明确的规则体系 通过深度学习实现隐式理解与生成 实现方式 符号操作和逻辑推理 神经网络模型 问题求解 依赖于预设的规则和逻辑 自动学习数据中的复杂模式 处理复杂问题的能力 受限,难以处理非结构化数据 升华,擅长处理大规模非结构化数据 表2进一步阐述传统AI和当代AI在形式化理解层面上的区别 由表2可见,传统AI采用了类似决策树或流程图结构,表示其基于明确的规则和逻辑进行问题求解。当代AI则采用了神经网络的简化结构,表示其通过深度学习模型自动学习数据中的复杂模式。通过表2可看到传统AI和当代AI在形式化理解层面上的主要区别,包括其核心方法、实现方式、问题求解能力、处理复杂问题的能力等。 4当代AI流派的对比 传统AI的符号主义、联结主义、行为主义三大观点,分别强调了符号操作、网络连接与行为模拟的重 要性。相比之下,当代AI的三大流派展现了更加多元化与深层次的技术探索与实践: 以ChatGPT为代表的基于LLM的生成式AI/AGI,通过大规模语料库训练实现了自然语言生成与理解的能力; 以小模型为特征的新质生产力AGI(如I3DNA),注重模型的高效性与实用性,在特定领域展现出强大的应用能力; 兼容大小模型的孪生图灵机,通过双重形式化理解模型实现了对数据与知识的深度整合与智能处理。[8-10] 表3进一步阐述ChatGPT、I3DNA以及孪生图灵机之间的区别 生成式AI/AGI(如ChatGPT) 新质生产力AGI(如I3DNA) 核心特点 基于LLM训练,自然语言生成与理解 小模型,高效实用,特定领域应用 模型规模 大 小 计算资源消耗 高 低 通用性 高(自然语言处理) 高(新质生产力) 通用人工智能AGI(如兼容大小模型的孪生图灵机TwinTuringMachine) 由表3可见,ChatGPT采用了类似神经网络的结构,表示