您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[头豹研究院]:教育大模型:AI赋能智能教育,塑造未来学习新生态 头豹词条报告系列 - 发现报告

教育大模型:AI赋能智能教育,塑造未来学习新生态 头豹词条报告系列

文化传媒2024-11-03常乔雨头豹研究院机构上传
AI智能总结
查看更多
教育大模型:AI赋能智能教育,塑造未来学习新生态 头豹词条报告系列

常乔雨等2人 版权有问题?点此投诉 2024-09-26未经平台授权,禁止转载 信息传输、软件和信息技术服务业/软件和信息技术服务业/信息技术咨询服务/信息系统服务 行业: 信息科技/软件服务 摘要教育大模型作为AI技术在教育领域的深度应用,市场规模持续增长,受政策利好、消费者偏好及技术进步驱动。其通过个性化教学、智能推荐等功能提升教学质量,同时推动商业模式创新。然而,高昂价格成为市场扩张的阻力。未来,随着技术成熟与成本降低,教育大模型有望进一步普及,深化教育变革。 行业定义[1] 教育领域是最受关注的大模型落地应用场景之一,教育大模型的使用是必然趋势。教育大模型是指利用人工智能技术,基于海量的教育数据,构建能够理解、生成和应用教育内容的深度学习模型,是适用于教育场景、具有超大规模参数、融合通用知识和专业知识训练形成的人工智能模型,是大模型技术、知识库技术及各类智能教育技术的集成,能推动人类学习和机器学习的双向建构。 行业分类[2] 按照产业化应用发展路径的分类方式,教育大模型行业可以分为如下类别: 行业特征[3] 教育大模型行业的特征包括技术驱动明显、商业模式创新、竞争态势日益激烈。 1技术驱动明显 教育大模型行业的技术驱动特性显著,它基于人工智能大模型技术,特别是具有数十亿至数百亿参数的深度学习模型,这些是深度学习、GPU硬件与大规模数据集等技术融合发展的结晶。教育大厂如猿辅导通过其“看云大模型”,运用丰富的行业数据,专注于数学教学场景,实现解题与题目批改的精细化处理,体 现技术针对特定需求的优化与创新。同时,企业如网易有道通过其子曰大模型,专注于口语陪练与翻译领域,展示了人工智能大模型在教育中的高度定制化潜力,如AI虚拟口语教练Hi Echo,旨在成为杀手级应用,这说明教育大模型在技术层面具备高度的适应性和差异化的服务策略。 2商业模式创新 教育大模型的引入促使传统教育机构盈利模式发生变革,教育大厂与科技巨头如科大讯飞和百度,乃至新兴玩家如精准学,均在构建以技术为核心的服务模式。这些企业不仅利用大模型技术提升教学质量,还通过大数据分析优化资源,实现个性化推荐等增值功能,从而开辟收入新渠道,这表明商业模式正向着以用户为中心、服务订阅制和智能化解决方案方向发展。 3竞争态势日益激烈 教育大模型领域的竞争已步入白热化阶段,不仅教育独角兽和科技巨头积极布局,还吸引了大量中小型企业入局。竞争焦点集中在技术创新,如不同企业的专属大模型针对特定教育场景的解决方案,以及用户体验的持续优化。为应对激烈的竞争环境,企业采取多元化策略,包括但不限于加快产品迭代速度、深化细分领域解决方案(如K12、成人教育)、探索新的应用领域和深化B端服务的合作模式,如智慧校园建设、个性化学习计划定制等,以此稳固市场地位并开拓增量市场。此等举措不仅丰富了行业生态,也反映了市场竞争如何驱动教育技术向更深层次应用发展。 发展历程[4] 2008年-2022年,教育科技公司着手技术积累与产品布局。2022年底ChatGPT横空出世,教育大模型的研发与应用就此启程。2023年7月26日网易有道率先将AIGC技术落地到教育场景内。此后至今,教育大模型热度持续攀升,教育科技企业纷纷入局推出自己旗下专属的教育大模型,抢占市场份额。 萌芽期2008~2022 2008年,有道就推出自主研发的国内首家统计机器翻译线上引擎。2017年科大讯飞成立了讯飞教育技术研究院,致力于人工智能赋能教育教学等方面的研究。2022年底ChatGPT横空出世。 2008年-2022年,教育科技公司着手技术积累与产品布局。2022年底ChatGPT引爆全球,引得庞大资金和技术资源爆发式投入AI大模型,大模型技术便迎来了一段崭新的快速发展期,为通用大模型在教育领域的应用以及教育专有大模型的发展奠定基础。此外,在ChatGPT问世后,不少教育板块相关的上市公司透露了在该领域的观点和计划,引得股价一时齐涨。 启动期2023~2023 2023年7月26日,教育科技公司网易有道发布了国内首个教育领域垂直大模型“子曰”,以及六个基于“子曰”大模型的应用。 2023年9月,作业帮发布了自主研发的银河大模型。2023年10月,科大讯飞发布了讯飞星火认知大模型V3.0。 2023年11月,松鼠 AI教育大模型、好未来旗下的大模型MathGPT和网易有道旗下的子曰大模型通过了《生成式人工智能服务管理暂行办法》备案及审核,正式面向市场开放注册。 2023年11月,“子曰”率先通过完整的国家备案,成为首批获得国家备案认可的教育大模型。 2024年1月3日,网易有道宣布正式推出子曰教育大模型2.0版本、虚拟人口语教练Hi Echo 2.0版本、有道速读、AI家庭教师小P老师等。 2024年1月5日,AIAED智适应教育大模型学术研讨会上,松鼠Ai正式发布国内首个教育智适应大模型。 2024年1月8日,小度推出学习机新品小度学习机K16,该产品搭载基于百度文心大模型独创的AI互动大语文体系等20项AI功能。 2024年1月11日,知乎宣布联合面壁智能推动“大模型+Agent”融合技术在职业教育领域的应用落地。 2024年3月,教育部启动实施“LEAD行动(人工智能大模型应用示范行动)”,并推动师生一同创造教育领域的专有大模型(GEST)。 2024年4月12日,蚂蚁云科技集团成功举办“智以育人、慧正无界——以正教育大模型产品发布会”,该产品致力于智慧教育变革,让因材施教成为可能。 2024年5月,猿辅导推出了看云大模型。 2024年6月28日,山东财经大学“AI才”专业大模型是全国高校首个新文科人工智能教育大模型,其发布标志着文科教育在应对技术变革、推动教育创新方面迈出重要一步。 2024年8月3日,第二届飞象星球合作伙伴大会在京召开,并公布了首个落地基础教育领域的作文辅导大模型产品“飞象AI作文”。 2023年7月26日网易有道率先将AIGC技术落地到教育场景内。此后,教育大模型热度井喷式爆发,教育科技企业纷纷入局推出自己旗下专属的教育大模型。目前教育大模型的研发和投入还处于初级阶段。 产业链分析 教育大模型行业产业链上游为算力(芯片、云计算)、数据(数据基础服务、开源数据集、向量数据集)、算法(算法框架、AI开发平台)提供商,主要为教育大模型提供技术及基础设施支持;产业链中游为教育科技公司、教育企业、科技企业,主要研发教育大模型并将其与公司旗下软硬件产品结合;产业链下游为G端(教育部门)、B端(学校、教育机构)、C端(教师、学生、家长),主要支付教育大模型及其相关产品,以获取更高水平的教育。[7] 教育大模型行业产业链主要有以下核心研究观点:[7] 上游:供需错配是算力市场的长期痛点,在一定程度上制约下游产业发展;但智能算力高速发展、数字教育设施平台逐步完善使得教育大模型方兴未艾。 供需错配主要体现在,算力供需的结构化失衡,即现有算力供给结构与用户实际的算力需求不匹配(通用算力的利用率不高、低端算力供给过剩,而大模型等AI任务需要的智算算力则供给不足、高端算力的缺口大),进而出现供需错位的情况。但中国智能算力正处于高速增长阶段,2022年智能算力规模与2021年相比增加了41.4%,规模占比为22.8%,超过全球整体智能算力增速(25.7%)。而教育行业作为大模型的高频落地场景,其人工智能渗透度从2021年的25%提升到27%,可见其应用程度均呈现不断加深的趋势,应用场景愈加广泛。 中游:搭载了教育大模型的各式硬件产品营收增长,软件应用也赢得了资本市场的关注。 大部分教育硬件产品都有一个趋同的核心卖点,即将AI大模型与旗下的硬件产品相结合,这使得中游厂商可以通过卖硬件的方式增加营收。科大讯飞公告显示,2023年5月-6月,大模型加持后,科大讯飞学习机GMV分别同比增长136%和217%。大模型在教育领域软件落地方面,2023年高途考研发布了考研智能助手类应用高途考研AICan,全年高途股价上涨25%,目前市值接近10亿美元。 下游:教育大模型助力实现教师“精准化的教”和学生“个性化的学”,提高教育质量。精准化的教:大模型充当智能助教,协助教师便捷开展交互式创新性的课堂教学活动。科大讯飞内部调研数据显示,其推出的启发式互动课堂“奇思妙问”上线以来,试点区域学生的问题解答率从原有的23%提升到95%;课堂互动参与率也从40%以下提升至80%以上。个性化的学:1.引入苏格拉底提问式的人机交互的方式,引导学生学习和探究,从而对学生进行更为精准而全面的教学和评价;2.通过大数据分析学生的学习行为和学习习惯,依据学生的学习需求与知识掌握情况,为学生提供动态反馈信息,同时让教师及家长更好地关注学生学习情况。[7] 产业链上游上 生产制造端 算力(芯片、云计算)、数据(数据基础服务、开源数据集、向量数据集)、算法(算法框架、AI开发平台) 上游厂商 英伟达半导体科技(上海)有限公司 英特尔(中国)有限公司 超威半导体产品(中国)有限公司 查看全部 产业链上游说明 算力供需结构性失衡和地域时域不平衡导致整体算力利用率不高,随着智能算力需求的爆发性增长,优化算力资源配置变得愈发紧迫 供需错配体现在以下几个方面:首先,算力供需的结构性失衡:当前算力供给的结构与用户实际需求不匹配,例如,通用算力利用率偏低、低端算力供给过剩,而大模型等AI任务所需的智能算力则供给不足,高端算力存在较大缺口,导致供需错位,整体算力利用率不高。根据中国信息通信研究院发布的《中国综合算力评价白皮书(2023年)》显示,当前算力规模中,通用算力占比高达76.7%,而智能算力仅占22.8%。随着AI大模型的快速发展,模型训练和推理需求激增,智能算力需求呈爆发性增长。其次,全球数据量的快速攀升进一步推升了算力需求:未来三年新增的数据量将超过过去三十年的总和,预计到2024年,全球数据总量将以年均26%的复合增长率达到142.6ZB,这将导致数据存储、传输和处理需求呈指数级增长,进一步加剧对算力资源的需求。第三,算力供需在地域和时间上的不平衡,如年底购物节期间算力需求的暴增。最后,部分地区的数据中心建设过度超前部署且无法调配:作为算力的物理载体,数据中心建设成为各地提升数字实力的主要手段之一,但部分地区忽视了当地需求不足的现状,急于求成,导致局部算力资源闲置。此外,由于算力资源的灵活性受限(不同应用场景对AI算力的精度、能效、速度、交互性、部署方式以及网络安全和带宽的要求各异,部分场景难以通过网络实现算力的灵活高效调度,无法满足人工智能推理和训练需求),即使算力不足,也难以高效调配和利用。2023年10月,工业和信息化部等六部门联合发布了《算力基础设施高质量发展行动计划》,明确了高质量算力的发展方向。2024年,中国已正式启动全国一体化算力网建设工作,为国产算力探索资源配置的最优解决方案。 算力技术单点突破转向算网构建,让算力产业链上各价值主体“用得上、用得起、用得好”算力技术。 支撑算力技术的领先企业自主延伸技术链,扩展自身在算网中的范围边界,扩大单点技术应用与嵌入多场景,进而带动整个产业链发展。例如,超聚变数字技术有限公司从自身独有的算力技术出发,结合算力网络场景的特定需求,通过打破“三重边界”来构建节能算网。一是打破处理器边界,在传统服务器中提供CPU+GPU+NPU+DPU等异构计算和多样性算力;二是打破服务器边界,从原来基于服务器的算力转向无服务器算力,实现算力卸载与存算一体;三是打破数据中心边界,通过重构算力产品的底层架构,打造云、边缘、超边缘计算的多形态算力产品。 中国数字教育设施平台逐步完善。 国家互联网信息办公室发布的《数字中国发展报告(2022年)》显示,截至2022年底,中国开通5G基站231.2万个,移动物联网终端用户数达18.45亿,数字基础设施的规模能级大幅提升。此外,全国中小学互联网接入率已达100%,未联