AIGC发展研究 清华大学 新闻学院人工智能学院 元宇宙/虚拟数字人/大数据/AI系列研究 2023 AIGC发展研究报告2.0 AIGC发展研究报告1.0人形机器人发展研究 2022 大语言模型综合性能评估报告 虚拟数字人系列 虚拟数字人发展研究报告3.0 ——产业发展与技术标准 虚拟数字人发展研究报告2.0 ——社会价值与风险治理 虚拟数字人发展研究报告1.0 ——溯源应用与发展 大数据/AI/5G生态报告新媒体系列报告2015年开始 元宇宙发展研究报告4.0新媒体发展研究报告9.0 2021 元宇宙系列 数字藏品发展研究报告1.0时空智能发展研究报告1.0韩国元宇宙动态研究报告 2020 元宇宙发展研究报告3.0版元宇宙发展研究报告2.0版元宇宙发展研究报告1.0版 2019 2016 5G下一代风口:AR 2017 VR的新浪潮 2015 2007 虚拟社区与虚拟时空隧道4 一 AI哲学 主题 经典哲学理论 AI引发变化 怀疑论 笛卡尔“我思故我在” AI思考所带来的怀疑论危机:OpenAIo1的推理能力是否意味着“思维”?AI的存在挑战了笛卡尔的怀疑论,促使我们重新审视“思维”与“存在”的关系。 主体间性 胡塞尔“主体间性” AI作为“具备主体间性的主体”:AI的训练文本由多主体提供,使其似乎具备某种“主体间性”。但它究竟是“具备主体间性的主体”,还是“主体性之集合”?或许,AI的主体间性不过是人类意图的映射,而非真正的主体性。 他者经验 “他者经验”的可获取 AI与“他者经验”的议题:AI的存在使得他者经验的获取成为可能,这挑战了胡塞尔认为他者经验无法被完全获取的观点。AI甚至可能成为他者经验的载体,研究者需要重新审视主观经验与客观信息的融合。 儒家之信 儒家“信”的思想 AI幻觉对“信”的冲击:AI虚假信息的出现使传统儒家五德思想中的“信”重新获得重视,人们意识到“无信”对日常生活带来的痛苦和不便。 回归对话 苏格拉底和孔子对于对话的偏爱 AI对对话的依赖:AI依赖对话形式促进交流,类似于苏格拉底和孔子的教学方式。然而,AI的对话模式也促使我们重新审视理性、知识本质和人际互动方式,挑战了传统对话的深度与真实性。 历史唯物 马克思的社会阶段理论 AI与实现共产主义的曙光:AIGC大幅提高了社会生产力,为实现更高级社会形态提供了技术支持,这在某种程度上印证了马克思关于社会阶段演进的预言。AI的发展为技术革命助力,推动了社会向更理想形态的迈进。 技术问询 海德格尔对技术的批判 形而上的技术与思想的重塑:技术不仅是工具,更是一种形而上的力量,深刻改变了人类理解世界的方式。AI的出现加剧了这一影响,使人类思维逐渐依赖技术逻辑。这种重新审视表明,技术不仅在塑造认知方式,还在重构对自身和现实的理解。 环形监狱 福柯对权力的批判 AI本身便是一个具象化的环形监狱:AI的应用使用户既是“监视者”,也是“被监视者”,这强化了福柯对权力结构的批判。AI的存在挑战了对隐私、自我监控和权力关系的理解,促使我们重新审视技术对个人自由和社会控制的影响。 哲思问道:思辨革新微调经典 中国古典哲学中的“天人合一”理念强调人与自然的深层和谐,将心或灵魂视为个体与宇宙沟通的纽带,展现内在精神与外在自然的紧密联结。随着人工智能时代的到来,这一理念逐步向“天人智一”转变,即通过AI技术延展人类智慧,攻克诸如意识起源、历史谜题等人类难题,大幅提升生产效率,从而解放人类劳动力,赋予更多时间与空间去追求个人的诗意生活,实现人与自然、技术的全面和谐。 天人智一:融通物我和谐共生 天(自然) 人(人类)智(人工智能)一(三者共生) “天”不仅象征自然环境,还代表更广泛的宇宙秩序。被视为至高的存在,其运作规律是人类应当遵循和学习的。 “天人合一”强调人是自然的一部分,能理解并与自然和谐共处。人的行为和生活方式应与自然法则一致,以实现内外和谐。 作为不同于人类和自然的第三方,人工智能的介入帮助人类提升生产力,并更深入地理解世界与自身,进而实现人、自然和技术的和谐共处。 人工智能同人类灵魂融合为一,进而极大的解放人类生产力,提升工作效率。借此,人类得以更深入理解世界,实现人、机、自然和谐共处。 问行合一:主动深思创新执行 在人工智能语境下,“问行合一”是指一种高效的人机交互理念,它融合了深度查询与精准执行。其中,“问”代表对未知或复杂问题的深度挖掘与探索,体现了人类对知识与智慧的追求;“行”则代表基于AI分析结果的迅速且精准的行动实施,彰显了人类对于机器智能输出的高效利用与转化。 此理念倡导在AI技术的辅助下,人类应持续深化提问的质量与深度,充分利用AI的数据挖掘与模式识别能力,探寻数据与知识背后的深层逻辑与规律。同时,人类需对AI的输出进行精准解读,并迅速转化为具有实际操作性的策略与行动,以实现人机协同的最大化效益。 问 探索性:“问”体现了对知识的主动探求,尤其是在使用AI时,用户通过提问来挖掘数据、寻找答案或解决问题。 互动性:提问是用户与AI系统进行交互的一种方式,通过提问,用户可以引导AI提供更符合需求的信息。 开放性:好的问题往往是开放性的,能够激发新的思考和发现,不局限于已有的知识和观点。 行 实践性:“行”是将知识和信息转化为实际行动的过程,它强调实践和应用。 目标导向:行动是为了实现特定的目标或解决问题,具有明确的方向性。 动态调整:行动过程中需要根据实际情况进行灵活调整,以达到最佳效果。 虚实存在论:互融交汇流转不息 虚实连断性(天) 身心流固性(人) 觉识拟创性(智) 认知融合,思维拓展,全景理解 人类世界 AI“主导”的世界 嵌套模拟理论 模拟意识: 创建一个能够进行自我反思、决策并具备 学习能力的系统 模拟生命: 模拟生命体的复杂性,包括自我复制、进化 和适应环境的能力 模拟元宇宙: 模拟宇宙的物理法则、结构和演化历史,宏 观层面反映宇宙起源 镜像进化论:逆序生成模拟宇宙 内外认知论:认知外赋决策自持 内化 外包 内联 外挂 内卷 外延 认知融合时代 •如果将人类以往的一切认知定义为“人类普遍认知” (HumanGeneralCognition),而将AI产生的认知定义为“AI生成认知”(ArtificialIntelligenceGeneratedCognition),那么我们当前正处于一个重要的临界点。 •认知外包的同时,决策需要内源化 提示范畴论:任意为根潜在为机 01 任意有多元宇宙上一切可 能的知识或信息 语言哲学、自然语言、检索语言、编程语言、AI原理 AI可能给出之结论 的集合 AI给出的作品在现实世界被创造 潜在有 可以有AI交流时实际给出的结论 实际有 02问、改、创、优 03提示的边界就是想象的边界 04单一模态到多模态 AI三用:重构万象感知超凡 AI再创AI拟真 AI异感 创新与灵感源泉 心理与情感体验 教育与训练 探索与实验 社会与文化批判 未来预演 概率预测(快速反应模型,如ChatGPT4o) 链式推理(慢速思考模型,如OpenAIo1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能的答案 基于链式思维(Chain-of-Thought),逐步推理问题的每个步骤来得到答案 决策能力 依赖预设算法和规则进行决策 能够自主分析情况,实时做出决策 创造力 限于模式识别和优化,缺乏真正的创新能力 能够生成新的创意和解决方案,具备创新能力 人机互动能力 按照预设脚本响应,较难理解人类情感和意图 更自然地与人互动,理解复杂情感和意图 问题解决能力 擅长解决结构化和定义明确的问题 能够处理多维度和非结构化问题,提供创造性的解决方案 伦理问题 作为受控工具,几乎没有伦理问题 引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合适的模型,实现最佳效果。 快思慢想:效能兼顾全局视野 AI自动化L1-L5:渐进提升全能自理 ReasonersInnovators Chatbots AgentsOrganizations 辅助自动化 部分自动化条件自动化高级自动化 完全自动化 两者均以“AI自动化程度”为线索,但“L1-L5阶段”更为贴近该线索,强调AI在逐步减少人类干预的过程中实现完全自主,聚焦自动化发展的渐进演变。相较之下,Altman的AGI五阶段更具实践导向。 对比维度 SamAltman的AGI五阶段 AI自动化L1-L5 异同点 辅助性阶段 阶段1:狭义AI,AI在特定任务中提供辅助。 L1:辅助自动化,AI简化流程,提供工具支持。 两者均以AI提供辅助为基础,帮助人类提高效率。 部分自主阶段 阶段2-3:AI在复杂任务中提供帮助,需人类监督。 L2-L3:AI部分自动化,能独立生成内容但需人类设定条件。 均强调AI在逐步减少人为干预的过程中具备部分自主能力。 高级自主阶段 阶段4:通用AGI,AI具备高度自主性,解决广泛任务。 L4:高级自动化,AI独立创作,有一定创新能力。 都体现了AI的自主性,但Altman更关注形成可落地的应用节点。 完全自主阶段 阶段5:超级AGI,AI超越人类,具备自我反思与创新能力。 L5:完全自动化,AI超越人类水平,具备自我反思与创新能力。 两者都预见AI超越人类,但Altman更侧重于实践,L5侧重自动化的程度。 生成边界与思维滞环:僵局显现破题之道 生成边界指AI模型在理解、创造与创新方面的能力极限,体现了其认知能力的实际限制。当用户的交互触及或超越这一边界时,AI无法突破自身局限,进而引发思维滞环现象。该现象表现为AI在多轮对话中重复内容、缺乏新意或无法满足用户的新增需求。这一现象反映了AI模型在复杂互动中的认知限制,影响了其响应的多样性和实用性。 思维滞环可能出现原因: 1.重复内容:AI生成的回答重复相似,缺乏新意 2.推理不变:即使改变提问,AI的逻辑仍然不变,无法提供不同的结论 3.回答表面化:AI只给出浅显的回答,无法深入分析 4.语言模式相同:输出的句式和结构没有变化,显得单调 5.忽略反馈:AI无法根据用户的反馈调整回答 如何判定触及生成边界: 1.指令执行分析:检查AI是否按要求添加或修改内容 2.回答多样性测量:评估AI回答的新信息量和多样性 3.上下文适应测试:观察AI能否根据新上下文调整回答 4.情感语气变化检测:检测AI回答的情感和语气是否变化 5.逻辑推理验证:观察AI在条件变化时是否调整推理 思维滞环现象解决思路: 1.调整提问:改变问题方式,引导AI生成不同的回答 2.优化训练:使用更多样的训练数据和算法,提高AI的多样性 3.提供外部信息:引入新的知识库,帮助AI生成新内容 4.调整模型参数:优化训练参数,避免模型陷入局部最优 5.增加反馈回路:通过即时反馈修正AI的推理过程 未来学科划分:共生拓展智启新程 人工智能科学人机共生科学 优化和提升人工智能的能力。主要涉及AI的技术创新与发展,涵盖基础理论、应用技术以及未来可能的智能演进 人类如何驾驭人工智能/机器。实现更高效、更和谐的协作,提升人类的生活质量和社会效率,提高生产效率 •机器学习算法:研究自我学习算法。 •自然语言处理:AI理解和生成语言。 •计算机视觉:AI解析图像和视频。 •人类增强技术:提升人类能力的研究。 •人机交互设计:优化人与机器的互动。 •情感计算研究:AI识别和表达情感。 •智能机器人学:开发智能机器人系统。•社会共生理论:探索AI融入社会方式。 •生成式AI技术:AI生成内容研究。 •通用人