AI智能总结
AI技术迭代与政策⽀持加速⾏业转型01 ⽬录C O N T E N T ⼤模型的新进展与突破02 AIGC写作及PPT制作产品测评洞察03 AI技术迭代与政策⽀持加速⾏业转型 ⾏业巨头技术快速迭代发展,拓展应⽤范围 •在⾏业层⾯上,本季度OpenAI、NIVIDA等⾏业巨头从基础设施到上层应⽤均在迅速迭代技术,并扩展应⽤⾏业范围。 ⽂⽣视频⼤模型 多部⻔联合频频发布的国家级政策 《“数据要素×”三年⾏动计划(2024—2026年)》 《⼯业和信息化部等七部⻔关于推动未来产业创新发展的实施意⻅》 2024年第⼀季度地⽅新发布⼤模型相关政策 ⼈⼯智能已上升为国家战略,成为驱动新质⽣产⼒的关键引擎 2024.3.4-3.11 2024.3.24 2024.2.19 国务院国资委召开中央企业人工智能专题推进会 中国发展高层论坛国务院发展研究中心主办 2024年全国两会 随着人工智能得到高度重视,政府机构、央国企和高效或科研机构纷纷开始行动,例如在2024年第一季度陆续成立智算中心,为各类创新主体提供普适普惠的算力服务。 •人工智能在全国两会中成为焦点话题之一。“人工智能+”在我国政府工作报告中第一次被提出,意在鼓励各行各业重视人工智能技术的应用和落地,象征着人工智能正在成为产业创新的关键抓手和驱动新质生产力的关键引擎。 •中国发展高层论坛将人工智能AI作为重要议题。人工智能将成为第四次工业革命的标配,中国政府高度重视人工智能发展,通过加强人工智能领域科技创新、推动人工智能深度赋能实体经济、推进人工智能伦理治理等方面发展。 •会议认为,加快推动人工智能发展,是国资央企发挥功能使命,抢抓战略机遇,培育新质生产力,推进高质量发展的必然要求; •会议强调,中央企业要把发展人工智能放在全局工作中统筹谋划,深入推进产业焕新,加快布局和发展人工智能产业。 基础设施建设得到⼴泛关注,也是AI未来发展的关键缺⼝ •随着⼈⼯智能技术的快速发展和应⽤场景的不断拓展,对于AI算⼒、数据服务和云服务等基础设施的需求⽇益增⻓。商汤科技智能产业研究院与中国信息通信研究院云计算与⼤数据研究所、中国智能算⼒产业联盟、⼈⼯智能算⼒产业⽣态联盟联合发布的《新⼀代⼈⼯智能基础设施⽩⽪书》显示,过去四年,⼤模型参数量以年均400%复合增⻓,AI算⼒需求增⻓超过15万倍,远超摩尔定律。 •智能算⼒成为AI产业发展的关键⽀撑要素,但在资源上仍然存在⽋缺,这促使政府、企业和研究机构正在积极采取措施,加快建设来满⾜市场需求。IDC预测,中国智能算⼒规模预计到2027年将达到1117.4EFLOPS,2022⾄2027年期间,中国智能算⼒规模年复合增⻓率达33.9%,同期通⽤算⼒规模年复合增⻓率为16.6%。 InfoQ研究中⼼调研显示,⽣成式AI开发者表示企业AI研发⼯作普遍存在GPU资源紧张,算⼒不⾜问题。解决算⼒资源不⾜成为11.0%的开发者最希望解决的问题。 “算⼒太贵,训练研发周期⻓,成品收益不明显”“因为算⼒的原因,⽆法使⽤更⼤规模的模型”“算⼒不⾜,模型调优进度慢,赶不上业界变化”“私有部署模型,算⼒成本巨⼤,且⽆法很好满⾜⽤户并发需求” 11.0% 国家重磅政策⽀持下,央国企加速智算中⼼建设 要夯实发展基础底座,把主要资源集中投⼊到最需要、最有优势的领域,加快建设⼀批智能算⼒中⼼,进⼀步深化开放合作,更好发挥跨央企协同创新平台作⽤ •国资委召开“AI赋能产业焕新”中央企业⼈⼯智能专题推进会,要求央企重点关注算⼒基础设施构建与多模态产业赋能 开展AI+专项⾏动,强化需求牵引,加快重点⾏业赋能,构建⼀批产业多模态优质数据集,打造从基础设施、算法⼯具、智能平台到解决⽅案的⼤模型赋能产业⽣态 山东能源集团 国家电网 国铁集团 中国联通 鄂尔多斯市创新投资集团 •联合华为云发布盘古矿⼭⼤模型和最佳实践⽩⽪书,并将其应⽤于采煤、掘进、主运、辅运、提升、安监、防冲、洗选、焦化等9个专业40多个应⽤场景,持续改善煤矿⼯⼈作业环境,减少安全事故,提升⽣产质量。 •通过应⽤百度⼤模型技术,实现AI预测⽤电的⾼峰波⾕,为电⽹调度提供建议,⽤智能巡检减少安全隐患,保障供电平稳。 •借助华为云铁路⼤模型“训练”TFDS系统,将⼈⼯检⻋升级为“AI检⻋”系统,实现了以铁路货⻋拦停重点故障为主的380+余种故障的智能识别,效率更⾼、可靠性更强,⽬前已从郑州北⻋辆段试点逐步推⼴到全国多个路局试⽤。 •致⼒打造算⼒丰富、运⼒充沛、多云协同、算⽹⼀体的算⼒精品⽹,规划主包括三⽅⾯:•丰富多级算⼒供给,完善多级架构;•提升算⼒输送⽹能⼒,筑牢超强运⼒、智能开放的全光传送底座;优化⽹络架构布局,构建东数⻄算低时延平⾯;•优化算⽹调度体系。 •与华为共同打造⾸个以盘古⼤模型为核⼼的⼯业互联⽹平台,以AI和矿鸿为核⼼,包含有智算算⼒、矿⼭⼤模型、多个预置算法以及应⽤开发环境等全套能⼒,开放普惠给产业链伙伴,以此解决AI开发⻔槛⾼、周期⻓等难题。 ⼤模型的新进展与突破 Sora来袭,这⼀局要不要跟! •2⽉16⽇,OpenAI发布的⽂⽣视频⼤模型Sora。Sora凭借其连贯流畅并细节饱满的视频⽣成能⼒与⻓达60秒的⽣成视频时⻓,给市⾯上已有的⽂⽣视频模型带来了降维打击的同时,也宣布了⽂⽣图⼤模型的发展进⼊新篇章。 •Sora在运动连贯度、背景细致程度、真实度等⽅⾯表现亮眼。但是,最值得关注的点为⽣成视频时⻓与分辨率。 •各⼤媒体与互联⽹平台迎来⼀波Sora流量⾼峰。•官⽅媒体:央⼴⽹、央视财经⽹等官⽅媒体也对Sora进⾏了报道。•证券研报:平安证券、国盛证券、⺠⽣证券等券商纷纷发布Sora相关技术与产业链等不同⻆度研报进⾏解读。•专家解读:各⾏业专家从技术、⾏业影响、投资价值等各个⻆度对Sora进⾏讨论与解读。 ⽣成视频时⻓ 分辨率 百度搜索指数140,305微信指数231,682,175 预计第⼆季度会出现⽣成能⼒接近Sora的⽂⽣视频⼤模型 开源领域技术成果斐然,多模态与MOE双轨共进 •2024年第⼀季度,开源领域的积累主要在多模态和MOE架构两⽅⾯。多模态领域,在Sora发布后,开源领域迅速跟进,复现流程并开源模型,图⽂模型仍然是多模态成果积累的主⼒军。此外,MOE模型因其计算效率的优势⽽在⼀季度⼴受关注,众多知名企业开源MOE模型。 视频⽣成模型 图⽂模型 •1⽉22⽇,零⼀万物开源YiVision Language(Yi-VL),包括Yi-VL-34B和Yi-VL-6B两个版本•2⽉1⽇,⾯壁智能开源MiniCPM-V-2.8B和OmniLMM-12B•2⽉6⽇,美团公司及浙江⼤学的研究者发布MobileVLM V2视觉语⾔模型 •3⽉27⽇,Databricks公司发布了DBRX开源MOE模型,模型包含1320亿参数,16个专家⽹络。•3⽉28⽇,通义千问团队宣布推出Qwen系列的⾸个MoE模型,Qwen1.5-MoE-A2.7B•3⽉28⽇,以⾊列⼤模型研究机构A21Labs宣布开源MOE模型Jamba。 ⼤模型开闭源争论不断,各公司⽤脚投票开闭源路线 •⼤模型发展阶段中,关于开闭源发展的路线之争从未停歇,各类⼤咖隔空喊话,仅⼀季度,⻢斯克提诉OpenAI,投资机构创始⼈Marc Andreessen和Vinod Khosla之间展开推特⼤战。再到国内近期百度李彦宏、360董事⻓周鸿祎、猎豹移动CEO傅盛的先后发声。不仅如此,各家公司也在⽤实际⾏动,为开闭源路线投票。 •国际⽅⾯,以Mistral-7B引发⼤量关注的MistralAI,在2⽉1⽇发布的MistralLarge也并未开源,加⼊开闭源并⾏发展路线。「OLMo」、Nomic Embed的发布,则是传统开源理念践⾏者迈出的⼀步。两个模型不仅选择开放了模型权重,还包括数据集、训练代码和训练过程。 •国内,在2024年第⼀季度有更新的模型当中,坚持纯开源和纯闭源路线的也是少数,以百川、智谱、通义为代表的开闭源并⾏路线⼤⾏其道。 2024年Q1有更新的中国通⽤⼤模型发展路线图 2024年Q1海外开闭源路线讨论涉及重点模型 艾伦⼈⼯智能研究所等5机构公布了开源模型「OLMo」,开放权重、数据集、训练代码和所⽤⼯具包。 2⽉1⽇ 2⽉2⽇ AI初创公司Nomic AI推出Nomic Embed,开放权重、数据集、训练代码和训练过程 2⽉27⽇ 以开源模型起家的MistralAI,发布其闭源旗舰模型MistralLarge ⼈形机器⼈技术侧尝试搭载⼤模型“⼤脑”,应⽤优先汽⻋制造 •2024年第⼀季度,搭载了⼤模型的Figure01和Ameca先后发布更新视频,展现了⼈机交互的流畅性。2024年3⽉19⽇,在NvidiaGTC2024⼤会上发布了⼈形机器⼈通⽤基础模型ProjectGR00T——业界⾸个专为⼈形机器⼈训练打造的AI模型,这将为⼈形机器⼈实现更智能的指令理解能⼒和新领域的学习模仿能⼒打下基础。 •应⽤⽅⾯,2024年第⼀季度中,优必选WalkerS和Apptronic旗下的Apollo⼈形机器⼈先后宣布进⼊蔚来和奔驰⻋间探索⼈形机器⼈在汽⻋组装和质检中的应⽤。 2024年第⼀季度⼈形机器⼈产品及应⽤更新 宇树科技:⾃研硬件融合软件智能的⼈形机器⼈探路者 Devin横空出世,国产代码⼤模型产品出炉,竞速赛⼤幕被拉开 •2024年第⼀季度,国产代码⼤模型产品—新⼀代智能编程助⼿开始⼤规模公测,国内市场上已存在⾄少12款产品。 •国际市场中,Devin的出现引发了⼤家对于⼤模型驱动的编码智能体的⼴泛讨论,开源领域OpenDevin、SWE-Agent、Devika也接连发布。微软发布的AutoDev则在⾃动化(版本管理、项⽬管理)⽅⾯迈出了新的⼀步。•但本质上新⼀代智能编程助⼿和编码智能体是编码产品的不同发展阶段,编码助⼿因为IDE插件的产品形态优先落地,编码智能体在响应速度、应⽤成本和⽤户体验上仍存在较⼤提升空间,但这是对编码产品下⼀个阶段的重要尝试。 编码产品的四个发展阶段 多编码智能体协作 吴恩达教授将现在主流的Agent设计模式分为以下四种: •⼯具使⽤(ToolUse) •规划拆解(Planning) •多智能体协作(MultiagentCollaboration) BaiduComate:研发、测试、产品、⽣态优势于⼀身的智能编码助⼿ 战略先⾏,头部硬件⼚商纷纷官宣All in AI •AI已通过硬件设备变得⽆处不在,⼴泛应⽤于各⾏各业。然⽽,以⼿机市场为代表的⼀些硬件设备市场已进⼊存量竞争时代,需要通过拓展竞争赛道或者升级发展阶段来寻找新机遇。2024年,随着AI⼤模型取得突破性进展,许多智能终端⼚商纷纷官宣All in AI,期待通过AI重构业务。 AI让手机从电子消费品升级为随身助力 l为AI整合OPPO全球研发资源,“举全公司之力”,抓住时代机会;l面向行业,主张AI从尝鲜到常用;l面向用户,把复杂留给AI,把简单留给用户。 l宣布将停止传统智能手机新项目的开发,全力投入“明日设备”(AI ForNew Generations)。未来不仅仅是手机厂商,还将与AI设备厂商展开正面竞争。 •生成式AI在办公、图片处理、内容生成等领域逐渐落地,手机作为多项功能的集合体,借助AI之风进入下一个发展阶段已成为必然. •打造AI Device产品、重构Flyme系统和建设AI⽣态;•进⾏系统更新,构建AI时代操作系统的基建能⼒;•今年将发布⾸款全新AI终端产品。 •成⽴AI中⼼;•三级⼤模型部署策略:将Titan超⼤模型、Turbo⼤模型、Tiny轻量级模型实现端云联合部署;•1+N智能体⽣态战略:OPPO AI超级智能体+基于OPPO AI Pro智能体开发平台所赋能的全新智能体⽣态。 智能手机时代 功能手机时代 AIGC写作及