国产AI大模型应用报告 2024年6月 报告摘要 发力规模商业化应用,国产AI大模型追赶进行时 2 来源:点点数据自主研究及绘制 ©2024DianDian.AllRightsReserved. 继2022年11月,OpenAI发布旗下AI聊天机器人应用ChatGPT后,大模型逐渐走入公众视野。2023年被视为中国大模型的发展元年。这一年里,中国本土厂商、各大科技巨头、科研院所、初创公司 都纷纷下场,部署自己的大模型。从优化算法全面追赶头部大模型水平到创新应用落地全面开花,国产AI正待走出一条属于自己独特节奏的发展之路。 本报告将回顾国产AI大模型的发展历程,分析当前国产大模型落地应用的数据表现,结合赛道头部和特色产品案例,帮助用户读者更好地把握国产AI大模型的发展现状和未来趋势。 3 01 AI大模型发展历史与现状 目录 02 国产AI大模型应用落地与数据情况 catalogue 03 国产AI大模型应用未来发展趋势 AI大模型的发展历程 1 起步-AI学术研究 2 发展-AI初步应用 3 突破-AI大模型风起云涌 从学术猜想到应用发展,当前已经进入规模化应用阶段 •1950年图灵在其论文《论数字计算在决断难题中的应用》提出了著名的“图灵测试”,测试能否使机器模仿人类思考模式和行为,标志着人工智能行业开始迎来发展。 •1956年举办的达特茅斯会议上“人工智能”(ArtificialIntelligence)的概念被首次提出,人工智能,即AI正式进入公众视野。 •上世纪八十年代初,日本富士通公司推出了世界上第一台具备语音识别功能的PC,开启了AI在语音识别领域商业化应用的序幕。 •1984年,苹果和IBM相继推出预装如语音识别、专家系统等AI软件的AppleMacintosh和IBMPC面世,也标志着AI开始进入家庭应用市场。 •九十年代至二十一世纪初,神经网络的发展也推动AI在图像识别领域的应用,同时经AI赋能的搜索引擎也成为互联网行业在此阶段实现大发展的标志性产物。 21世纪初,随着计算能力的提升和大数据的崛起,AI大模型从无到有,从简到繁快速被发掘和发展。 •专家系统:根据系统中的知识与经验,进行推理和判断,模拟人类专家的决策过程。 •决策树:采用树形结构,使用层层推理来实现最终的分类。 •SVM:用于分类和回归问题,通过在特征空间中找到最大边距的超平面。 •深度学习架构:优化神经网络的结构,提高计算效率和模型的准确率,使得神经网络在各种任务中表现更优。 通过发掘一系列大模型架构的潜力,最终向仿生的形态演化。 4 来源:点点数据自主研究及绘制 5 主流AI大模型类别 NLP(自然语言处理)大模型为目前应用主流 NLP(NaturalLanguageProcessing,自然语言处理)大模型:LLM为NLP大模型的一种,主要用于处理自然语言文本数据,具备强大的语言理解和生成能力,帮助人类完成问答、创作、文本等工作,例如OpenAI的GPT系列模型。 CV(ComputerVision,计算机视觉)大模型:主要用于处理图像和视频数据,具备强大的图像识别和视频分析能力,如人脸识别、物体检测等,具体可以在智能驾驶、安防等领域进行利用,例如腾讯的PCAM大模型。 科学计算大模型:主要用于解决科学领域的计算问题,如生物信息学、材料科学、气候模拟等,需要处理大规模数值数据,例如华为的盘古气象模型。 模态大模型:可以同时处理多种类型的模态数据,如文本、图像、语音等,实现跨模态搜索、跨模态生成等任务,已有的渗透应用具体包括搜索引擎、办公工具、金融电商等,例如谷歌的VisionTransformer模型。 来源:点点数据自主研究及应用商城产品详情页 ©2024DianDian.AllRightsReserved. 国产AI大模型发展历程 OpenAI打响发令枪,国内厂商奋起直追 OpenAI在2019年发布了GPT-2大模型,国内互联网科技厂商也集中在2020-2022三年期间相继发布了自己的大模型。ChatGPT的发布,掀起一波发展热潮,席卷国内科技圈和投资圈。很快,各大科技巨头、科研院所、初创公司都纷纷下场,部署自己的大模型。自此开始,相关技术迭代日新月异,行业趋势不断变化。2023年3月16日,百度正式推出了基于百度新一代大语言模型的生成式AI产品“文心一言”,此后,阿里、华为、腾讯、京东、科大讯飞、360、字节跳动等科技公司纷纷发布了自家的大模型。科研院所及创业公司同样有“悟道”、“书生”、”智谱“等大模型问世。截止2024年4月,中国的大模型数量已近200个,通用大模型数量40个左右。 2021年3月21日智源:悟道1.0 2021年7月 2023年3月16日百度:文心一言 2023年4月13日知乎:知海图 2023年7月7日华为:盘古3.0 2023年11月 MiniMax:Abab 2019年3月16日 百度:ERNIE1.0 中科院&武汉人 工智能研究院: 2022年8月 2023年4月 阿里巴巴:通义千问 2023年5月6日 科大讯飞:讯飞星火 2023年8月31日 百川智能:百川 2024年1月12日 同花顺:HithinkGPT 紫东太初 清华大学:GLM-130B 智谱华章:智谱清言 2021年9月28日浪潮信息:源1.0 2021年4月 华为:盘古 2023年3月14日澜起科技:孟子 2023年2月 复旦大学:MOSS第四范式:式说 2023年4月18日金山:WPSAI 2023年5月18日云从科技:从容 2023年7月13日京东:言犀 2023年9月7日 腾讯:混元 2023年10月12日 汉王科技:汉王天地 2024年5月16日 小米:MiLM 6 ©2024DianDian.AllRightsReserved. 2021年11月17日 商汤:书生1.0 2023年4月10日 商汤:日日新 2023年6月13日 360:360智脑 2023年10月 月之暗面:Kimi 国产AI大模型发展现状 多方协力奋起追赶,应用层面寻求突破 ChatGPT的发布让国内科技圈看到了差距,也促使国产AI大模型加快了前进的速度。在过去的一年里,几乎所有科技公司都押注大模型,加之政策与监管层面的大力扶持,与代表了官方科研力量的科研院所也加入其中。结果便是,大模型数量迅速增长的同时,技术创新也在不断涌现,从而推动着国产大模型的技术水平快速提升。与此同时,基础大模型的发展为应用层的繁荣提供了必要的条件,也让聚焦于垂直应用的AI创业公司的成本大大降低。因而在大势之下,众多创业公司也开始在应用层面寻求发展和突破。 政策驱动 近年来,我国始终高度重视人工智能发展时机和顶层设计,发布多项人工智能支持政策。2024年《政府工作报告》中提出开展“人工智能+”行动。 当前,北京、深圳、杭州、成都、福建、安徽、上海、广东等地均发布了关于AI大模型的相关政策。 多方押注 技术创新 应用突破 大模型日益增高的创业门槛促使创业公司和团队另辟蹊径,挖掘出更多蕴藏在应用层面的机会。 同时,得益于现有大模型的发展,又降低了垂直领域的创业门槛,催生了众多可行性强,便于落地的应用产品。 7 各大科技巨头、科研院所、初创公司都纷纷下场,部署自己的大模型。 截止2024年4月,中国的大模型数量已近200个,通用大模型数量40个左右。 ©2024DianDian.AllRightsReserved. 资源投入 许多企业和研究机构投入大量资源,开发出拥有数十亿、甚至百亿级别参数的大模型。 国内庞大的市场和用户基础,更容易获取大量的用户数据和应用场景,能为大模型的应用提供丰富的数据资源。 多方力量和头部优势资源的整合下涌现出多种优化算法和并行计算技术,显著提高了训练速度和效率。 同时,针对大模型的推理速度问题,也有一系列轻量级大模型和模型压缩技术的出现。 8 01 AI大模型发展历史与现状 目录 02 国产AI大模型应用落地与数据情况 catalogue 03 国产AI大模型应用未来发展趋势 9 国产AI大模型应用落地情况 AppStore中国大陆地区已上线AI大模型应用(截止2024年6月15日) 应用名 上线时间 所使用大模型名称 厂商/机构/院校 简介 海螺AI 2023.3 abab6.5 MiniMax 智能搜索识别图片语音通话写作助手文件速读 文心一言 2023.6 文心大语言模型 百度 百度旗下AI智能问答助手,搜索写作识图翻译有求必应 讯飞星火 2023.6 讯飞星火大模型 科大讯飞 科大讯飞开发的大模型,AI对话问答助手 天工AI智能助手 2023.7 天工大模型 昆仑万维 搜索对话写作画画作曲编程的AI助手 360智脑 2023.7 360智脑 360 有灵魂更懂你的AI智能助手 豆包 2023.8 豆包大模型 字节跳动 AI全智能聊天对话问答助手,搜索写作翻译编程全能工具 智谱清言 2023.8 ChatGLM 智谱华章(清华大学) 文案生成编程辅助文档解读AI作图智能问答工具 通义 2023.10 通义千问 阿里巴巴 日常办公、学习提效、生活娱乐的AI超级助理;为您提供全方位、方便快捷的协助。 紫东太初 2023.12 紫东太初多模态大模型 中国科学院自动化研究所&武汉人工智能研究院 人工智能、AI写作、AI对话、AI绘画 Kimi智能助手 2024.1 Kimi 月之暗面 AI智能聊天对话问答助手智能搜索高效阅读辅助创作 汉王天地 2024.2 汉王天地 汉王科技 汉王旗下智能AI大模型,你的生活小助理 腾讯元宝 2024.5 混元大模型 腾讯 轻松工作,多点生活 来源:综合了企业财报、专家访谈、市场公开资料等,根据点点数据统计模型核算后,由点点数据自主研究及绘制。 ©2024DianDian.AllRightsReserved. 10 2024H1国产AI大模型应用下载量Top10 依托字节旗下短视频社交平台《抖音》的庞大用户和流量优势,《豆包》数据领先优势明显,2024上半年该应用在中国大陆地区共拿下超过3309万的下载量,断层领跑一众AI大模型应用。 中国大陆地区已上线AI大模型应用下载榜(2024H1) 排名 icon 应用名 上线时间 所使用大模型名称 厂商/机构/院校 下载量 下载数据(万) 1 豆包 2023.8 豆包大模型 字节跳动 3309 2 天工AI智能助手 2023.7 天工大模型 昆仑万维 1089 3 Kimi智能助手 2024.1 Kimi 月之暗面 1086 4 文心一言 2023.6 文心大语言模型 百度 669 5 讯飞星火 2023.6 讯飞星火大模型 科大讯飞 405 6 通义 2023.10 通义千问 阿里巴巴 249 7 智谱清言 2023.8 ChatGLM 智谱华章(清华大学) 169 8 海螺AI 2023.3 abab6.5 MiniMax 168 9 腾讯元宝 2024.5 混元大模型 腾讯 17 10 紫东太初 2023.12 紫东太初多模态大模型 中国科学院自动化研究所&武汉人工智能研究院 5 来源:综合了企业财报、专家访谈、市场公开资料等,根据点点数据统计模型核算后,由点点数据自主研究及绘制。 ©2024DianDian.AllRightsReserved. 11 2024H1国产AI大模型应用月活Top10 字节旗下《豆包》月活数据同样领跑,2024上半年该应用在中国大陆地区月活量超过2104万,百度《文心一言》同样坐拥庞大用户体量浏览器产品,月活数据逆袭下载数据更为出色的《天工AI智能助手》。 中国大陆地区已上线AI大模型应用月活榜(2024H1) 排名 icon 应用名 上线时间 所使用大模型名称 厂商/机构/院校 月活量 月活数据(万人) 1