目录 一、大模型发展的前世今生4 1.AI大模型的进化简史:从神经网络到预训练大模型4 2.5年后全球大模型市场规模破千亿美元,国内破千亿元人民币5 3.小结8 二、大模型进入“百模混战”时代9 1.全球已发布大模型超200个,中美数量占全球的九成9 2.美国大模型投资热度不减,国内机构出手谨慎12 3.“龙头大模型+”是当前大模型发展主要模式18 4.国内外代表性大模型介绍19 5.小结29 三、中美AI大模型在千行百业的赋能表现31 1.AI+办公:美国巨头引领潮流,国内厂商奋起直追32 2.AI+金融:美国发展较成熟,国内也已进入应用阶段36 3.AI+医疗:数据制约下,国内渗透缓慢,美国数据优势明显,青睐研发环节40 4.AI+文娱:美国发展遇阻力,我国有望弯道超车44 5.AI+教育:美国侧重辅助教师,中国侧重应试47 6.AI+交通:交通应用中国具备优势,智能驾驶中美处于竞争状态50 7.AI+能源:中美在该领域渗透率均较低,处于探索时期65 8.总结67 四、参考来源:69 前言 康波周期是描述宏观经济增长与技术革命间内在关系的重要模型,第一次工业革命以来,人类已经完整经历了纺织和蒸汽机技术、钢铁和铁路、电气和重化工业、汽车和电子计算机四轮康波周期,目前处于信息技术周期的萧条阶段,AI驱动的第六轮康波周期一触即发。 以ChatGPT为代表的AI大模型的诞生,意味着强人工智能的时代即将到来,AIGC正在成为引发生产力变革的引擎,为了抓住第六轮康波周期的机遇,更是在未来的科技竞争中占领先机,中美两国在大模型的布局上不遗余力,两国的竞争不仅仅体现在大型科技企业之间,更是在应用领域也展开了对决。 2023年以来,不仅仅是行业先行者,如谷歌、百度等大型科技企业纷纷推出自己的AI大模型,后来者如Adept、Inflection、Cohere、Minimax名之梦、光年之外等创业公司也加紧融资,投身大模型创业。 不过也应该看到基础模型的研发和训练非常昂贵,非常有实力的企业才能支撑起来,留给创业者的机会更多是在基础模型上做场景应用,这在一级市场上也有所反映。 业内普遍认为,大模型只是配菜,真正要服务行业还需要上主菜,而这个主菜就是与实际业务场景相结合,商业模式自洽的应用,中美两国在各行业的应用上也进行了不同的探索。 一般而言,具有数据量大、质量高、多样性强,技术需求高、创新能力强等特点的行业对大模型的接受程度也会更高,这也造成了在不同行业,大模型的渗透率也有所不同,其中在金融、政务、文娱、教育等渗透率最高,而相对在医疗、 制造、能源、建筑等渗透率较低,从上半年一二级市场AI这波投资热可以看出, 金融、政务、文娱、教育等渗透率较高的多个场景均得到了资金的青睐,而在渗透率较低的行业,资金并不活跃。 本报告从大模型的发展脉络展开阐述,并根据大模型在各行业的渗透进度,结合一二级市场的热度,对中美大模型在金融、办公、文娱、教育等行业的应用进行梳理,对比中美在大模型商业化场景价值各自的探索,旨在发掘中美在人工智能发展之间各自的优势,并以此提出中国人工智能发展的相关建议。 本报告由钛媒体宏观研究部政策组资深分析师刘洋雪、能源组分析师谷硕、钛媒体国际智库总监何俊妮共同撰写。同时钛媒体技术与产业组体资深作者林志佳、副总编辑胡润峰对本报告亦有贡献,谨此致谢。 一、大模型发展的前世今生 1.AI大模型的进化简史:从神经网络到预训练大模型 自1956年,“人工智能”概念提出开始,已经有了近70年的发展历史,经历了三个发展阶段,即萌芽期(1950-2005),探索期(2006-2019),发展期(2020年以后),不过真正大模型的历史还要从2006年DeepLearning首次在Science上发表开始,不过在2012年之前,大模型的探索与学习的关注度并不是很高。2012年,AlexNet战胜ImageNet这一标志性事件,引发了行业对深度学习 的关注和研究,而谷歌、百度等行业先行者也是在这一时期开始重视AI的发展。2013年,GoogleBrain项目发布了深度学习模型DistBelief,为大规模分布式训练奠定基础。2014年,被誉为21世纪最强大算法模型之一的GAN(对抗式生成网络)诞生,标志着深度学习进入了生成模型研究的新阶段。2017年,Google又提出了Transfomer,这成为GPT发展的基础。 说起Transfomer,那就不得不提那篇传奇论文《AttentionIsAllYouNeed》, 这篇论文不仅仅成为大模型研究的必读参考文献,该论文的8位作者也成为大模 型创投圈炙手可热的人物,据悉,该论文的8位作者,仅有一位留在了谷歌,剩 下的7位纷纷加入了创业大军,他们创立的4家公司中,有3家成为独角兽,其中包括Adept、Character.AI、Cohere,而在这些独角兽背后站着的是谷歌、英伟达、Salesforce等行业先行者。 不过让人意外的是,作为行业先行者,谷歌并没有率先发布令市场轰动的产品,反而是一家2015年12月成立的创业公司,引领了接下来大模型的发展,这家公司便是OpenAI。 2018年,OpenAl发布GPT-1模型,标志着预训练模型在自然语言处理领域的兴起。2019年,OpenAI和Google又分别发布了GPT-2与BERT大模型,意味着预训练大模型成为自然语言处理领域的主流。 2020年,大模型进入快速发展阶段,当年OpenAI推出了GPT-3,模型参数规模达到了1750亿,成为当时最大的语言模型,并且在零样本学习任务上实现了巨大性能提升。随后,更多策略如基于人类反馈的强化学习(RHLF)、代码预训练、指令微调等开始出现,被用于进一步提高推理能力和任务泛化。 2022年11月,OpenAI推出了搭载GPT3.5的ChatGPT,其逼真的自然语言交互与多场景内容生成能力,迅速火爆全网,2023年上半年的AI热潮也就此展开。 2023年,OpenAI发布超大规模多模态预训练大模型——GPT-4,具备了多模态理解与多类型内容生成能力。谷歌推出PaLM2模型,Meta发布LLaMA-13B,微软基于ChatGPT打造NewBing,Windows全面集成Copilot。 国内,百度率先发布文心一言,随后阿里、商汤、360、华为等企业纷纷发布自己的大模型,复旦、清华、哈工大、中科院等学院派,也发布了各自的大模型,中小非上市公司印象笔记、医联科技、左手医生等也推出了行业大模型,市场进入了“百模混战”格局。 2.5年后全球大模型市场规模破千亿美元,国内破千亿元人民币 大模型作为通用性技术,在自然语言处理、计算机视觉、语音识别、文本识别、推荐系统等多个领域均能展现其突出的作用,如何判断其市场规模在学术上仍有较多的争论,不同机构根据统计方法的不同,所得出的结论也有所出入。 其中,根据大模型之家的测算,预计到2023年,全球大模型市场规模将达 到210亿美元,到2028年,其规模将达到1095亿美元。 图表1数据来源:大模型之家,钛媒体整理 根据国际数据公司IDC预测,全球AI计算市场规模将从2022年的195.0亿美元增长到2026年的346.6亿美元。其中,生成式AI计算市场规模将从2022 年的8.2亿美元增长到2026年的109.9亿美元。 而中国庞大的市场需求和丰富的人才储备,为大模型的发展壮大提供了有利的客观条件,大数据之家预测,中国大模型产业市场规模将达到147亿元人民币, 并在2028年达到1179亿元。 图表2数据来源:大模型之家,钛媒体整理 而IDC对基于大模型的AI市场规模进行了预测,预计中国人工智能市场规模在2023年将超过147亿美元,到2026年这一规模将超过264亿美元。 图表3数据来源:IDC,钛媒体整理 尽管不同机构对大模型市场规模的测算有着明显的差距,但不可否认的是,对于大模型,市场都抱有较强的期待和较乐观的预期,这与近几年中美在大模型发布上的突飞猛进是分不开的。 3.小结 通过对AI大模型发展史的梳理可以发现,AI的基础研究发源并发展于美国,在基础大模型方面美国具有开创性作用,而国内大模型厂商更多扮演者追随者的角色,不过国内人工智能市场规模大,增长速度快,这又对人工智能的发展集聚数据燃料,提出新的落地需求,中国人工智能或在这样的环境下,率先在场景落地上赶超美国。 二、大模型进入“百模混战”时代 1.全球已发布大模型超200个,中美数量占全球的九成 虽然ChatGPT点燃了大模型发布的热情,不过早在ChatGPT发布之前,全球已经发布了不少大模型,《中国人工智能大模型地图研究报告》显示,2019年美国已经有了4个大模型,而中国2020年有了2个大模型,此后每年都有大模型发布,仅仅2023年的前五个月,中美分别有19、18个大模型发布。 截至2023年5月底,国内10亿级参数规模以上基础大模型至少已发布79 个,而美国这一数字为100个,全球累计发布大模型202个,中美两国大模型的数量占全球大模型数量的近90%,中国大模型数量已进入第一梯队。 图1注:数据截至2023年5月,数据来源:中国人工智能大模型地图研究报告。 企业 产品 特色应用 互联网公司 百度 文心一言 聊天互动、回答问题、文本生成、图片生成 阿里 通义千问 聊天互动、回答问题、文本生成、翻译 腾讯 混元 文本生成、文生图 字节跳动 飞书“MyAI” 华为 盘古 文档搜索、智能ERP财务检测、阿拉伯语 京东 言犀 内容生成、人机对话 知乎 知海图AI 内容聚合、整理,提炼成摘要展现给用户 360 360智脑 语音交互和文字输入 网易 玉言 复旦大学 MOSS 文本生成、文本摘要、翻译 清华大学 ChatGLM 回答问题、文本生成 智源人工智能 悟道2.0 研究院 学术 武汉大学 CheeseChat / 研究 IDEA研究院 二郎神 中科院自动化所 紫东太初 以文搜图、以音生图 机构 上海人工智能 天气预报大模型“风乌” 实验室阿里达摩院 八卦炉 浙大杭州国际 蛋白质大模型 科创中心 AI公司 澜舟科技 孟子 智谱AI ChatGLM 商汤科技 日日新 文本生成、图片生成、视频生成、 3D内容生成、数字 昆仑万维 天工 云从科技 行业精灵 科大讯飞 讯飞星火 文本、语义、数学、推理、代码、 知识问答 出门问问 序列猴子 MiniMax 自研大模型 元语智能 ChatYuan APUS 天燕 毫末智行 DriveGPT 竹间智能 魔力写作 聆心智能 超拟人大模型 火山引擎 火山方舟 行业公司 网易有道 子曰 学而思 MathGPT 中国农业银行 ChatABC 江苏银行 智慧小苏 度小满 轩辕 孩子王 KidsGPT 达观数据 曹植 浪潮信息 源1.0 回答问题、翻译和古文 同花顺 HexinGPT 数慧时空 长城大模型 我司我家 房产经纪大模型 联发科 BLOOM-zh 航天宏图 天权大模型 企查查 知彼阿尔法 中国电信 TeleChat大模型 数据来源:公开信息整理,钛媒体整理。 发布大模型的机构可以分为四种类型,互联网公司、学术/研究机构、AI公司及行业公司。 国内大模型呈快速发展之势,在以下几个方面表现突出: 一是,大模型应用越来越广泛,在自然语言处理、图像识别、语音识别、内容生成等多个领域有着广泛应用。 二是,大模型算法丰富,国内的模型上除了GPT之外,还对BERT、ALBERT、NEZHA等进行了广泛的探索。 三是,大模型性能不断提升,国内大模型玩家纷纷加大对AI的研发投入,据钛媒体·钛度图闻不完全统计,2022年,华为在研发费用上投入1615亿元,成为研发投资资金最多的企业;其次,腾讯以614亿元排名第二,阿里以555亿元排名第三,他们在硬件和软件领域的大规模投入,大大提高了大模型的运算速度和效率。 四是,大模型研究成果不断涌现,国内以清华、复旦、哈工大等高校也推出