您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [安信证券]:星火燎原起、AI场景落 - 发现报告

星火燎原起、AI场景落

2023-05-10 赵阳,夏瀛韬 安信证券 改变命运
报告封面

星火大模型发布,积极掌握AI源头技术 2023年5月6日,公司成功举办“讯飞星火认知大模型”成果发布会。讯飞星火大模型是公司面向通用人工智能的技术探索,也是对标海外头部产品如ChatGPT的技术演进。发布会主要展示了星火大模型的七大能力:多风格、多任务长文本生成;多层次、跨语种语言理解; 泛领域、开放式知识问答;情境式、思维链逻辑推理;多题型、可解析数学能力;多功能、多语言代码能力;多模态输入和表达能力。 围绕1+N大模型体系,首发四类应用场景 结合公司在垂直行业多年的深耕优势和产品,公司此次发布会了搭载星火大模型的四大类应用产品。分别为:1)AI+教育:发布搭载星火大模型的AI学习机新品,实现中英文作为的自动化批改;2)AI+办公:发布搭载星火大模型的智能办公本,实现会议语音转写和纪要的语篇规整和一键成稿;3)AI+汽车:发布搭载星火大模型的汽车座舱人机交互系统,提供多轮、多人、多区域、多模态的智能汽车人机交互范式;4)AI+数字员工:发布搭载星火大模型的AI虚拟数字助手,实现导购、线上营销等多种功能,以及实现工作流程的自动化(RPA)。 未来,讯飞还将探索星火大模型在医疗、智慧城市、司法、工业等场景下的落地产品。 我们认为,大模型能力和垂直场景的结合才能凸显相应的竞争优势,讯飞在教育、医疗、消费者业务等领域深耕多年,掌握了大量垂直行业的专业数据,有助于实现模型的产品级应用,从而真正跑通大模型的商业模式。 投资建议: 科大讯飞作为国内人工智能产业的领军企业,当前正处于人工智能战略2.0阶段,逐步形成“数据-算法-产品”的闭环,有望摆脱以项目制、定制化为主的商业模式,依托GBC联动的发展战略,实现人工智能技术的规模商用。另一方面,公司依托通用认知智能大模型——星火大模型,实现垂直领域的场景和产品落地,有望进一步提升自身竞争优势 。 我们预计公司2023/24/25年实现营业收入256.0/328.8/418.2亿元,实现归母净利润16.6/23.9/30.2亿元。 维持买入-A的投资评级,给予6个月目标价88.16元,相当于2023年8倍动态市销率。 风险提示:技术研发进度不及预期;客户需求不及预期;供应链风险。 1.星火大模型发布,积极掌握AI源头技术 1.1.从讯飞超脑到星火大模型,认知智能技术持续积累 认知智能多年积累,AI源头技术持续研发。科大讯飞坚持源头核心技术创新,人工智能关键核心技术始终保持国际前沿水平。公司承建有国家首批新一代人工智能开放创新平台、全国首个认知智能国家重点实验室(首批标杆全国重点实验室),以及语音及语言信息处理国家工程研究中心等国家级平台。科大讯飞多年来积累了认知智能大模型综合研发实力、持续关键技术突破和创新能力,相关积累包括:1)在认知智能大模型最核心的Transformer深度神经网络算法方面拥有丰富的经验,Transformer算法已广泛应用于科大讯飞的语音识别、图文识别、机器翻译等任务,并已经开源了6个大类、超过40个通用领域的系列中文预训练语言模型,相关模型库月均调用量超1000万,在Github平台获得星标数位列同类中文预训练语言模型第一;2)在多年认知智能系统研发推广中积累了丰富的行业数据,为认知智能大模型的研发和专业领域优化提供了扎实基础;3)牵头国家专项,在国产化训练推理平台建设和优化方面持续投入形成的扎实积累。 “讯飞超脑2030”计划牵引,促使机器从“能听会说”向“能理解会思考”演进。2014年,公司发布讯飞超脑计划,明确提出要让机器像人一样具备能理解会思考的能力。2023年初,公司正式迭代并发布“讯飞超脑2030计划”。“讯飞超脑2030计划”将构建基于认知智能的人机协作、自我进化的复杂智能系统。即让机器的感知能力超过人类,深度理解领域专业知识,具备持续自主进化的能力;让机器全方面感知人和环境,懂各行各业知识,有通识和情感,能灵活运动,会多维表达,打造可持续自主进化的复杂智能系统,助力家庭陪伴机器人走进千家万户,造福亿万百姓生活。 讯飞超脑2030计划分为三个阶段,每个阶段都围绕“懂知识、善学习和能进化”,将软硬一体机器人和数字虚拟人向前推进。其中,第一阶段,在2022-2023年,科大讯飞将打造可养成的宠物机器人和专业虚拟人家族;第二阶段,时间为2023-2025年,将打造自适应行走的外骨骼机器人和陪伴虚拟人家族;第三阶段,时间为2025-2030年,将打造软硬一体懂知识会学习的陪伴机器人和自主学习虚拟人,帮助人类更好地应对未来。 图1.讯飞超脑2030计划分阶段目标 从“讯飞超脑2030”到星火大模型,认知智能技术迭代突破。以“讯飞超脑2030计划”为牵引,公司关键技术持续突破,同时,公司布局认知智能大模型关键技术,不断推动认知智能技术迈向新台阶。2017年,讯飞智医助理首次通过国家执业医师考试临床综合笔试,并以456分的成绩超过了96.3%的人类考生,让机器首次具有担任全科医生的能力;在2019年全球机器阅读理解顶级水平测试SQuAD2.0中,科大讯飞系统效果首次超过人类平均水平;2022年4月的CommonsenseQA 2.0常识推理挑战赛中,科大讯飞以76.06%的成绩获得第一;2022年7月,面对特定领域的知识推理,科大讯飞在OpenBookQA科学知识推理挑战赛中刷新最好成绩,成为全球首个超越人类平均水平(91.7%)的单模型;2022年12月,在多模态阅读理解评测VCR(Visual Commensense Reasoning)中再次获得第一,标志机器的阅读理解能力实现了从单模态到多模态的跨越。 2022年12月,科大讯飞启动了“1+N认知智能大模型技术及应用”专项攻关,其中“1”指的是通用认知智能大模型算法研发及高效训练方案底座平台,“N”指的是将认知智能大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域。2023年5月6日,公司成功举办“讯飞星火认知大模型”成果发布会。讯飞星火大模型是公司面向通用人工智能的技术探索,也是对标海外头部产品如ChatGPT的技术演进。与其他的大模型厂商产品发布不同,讯飞的星火大模型系列成果不仅包含了通用人工智能大模型,还包含了多种搭载了大模型的产品和落地场景,一方面展现了具体的应用方向,另一方面也将为大模型的持续迭代提供丰富的数据入口和数据资源。 图2.讯飞认知智能技术发展时间轴 星火大模型有望持续升级,年内仍有三大关键里程碑值得期待。根据发布会的介绍,星火大模型仍将持续迭代升级。6月9日首先将突破开放式问答(即实时问答),不是简单搜索,而是通过类搜索插件抓取知识,以更人性化的方式呈现结果;再次升级多轮对话能力;数学能力还会再上一个新的台阶。8月15日,将会突破代码能力,让开发者、合作伙伴非常方便地调用使用;多模态的交互能力也将正式开放。到今年10月24日的“1024开发者节”,希望星火大模型能够在通用的认知大模型能力上,通过科学的评测体系实现对标ChatGPT,在中文上实现能力超越,在英文上实现能力的对齐。 图3.星火大模型年内三大关键里程碑 1.2.星火大模型聚焦七大核心能力,向通用人工智能迈进 发布通用认知智能大模型测评体系,聚焦七大核心能力。科大讯飞和中国科学技术大学共同承建的认知智能全国重点实验室牵头设计了面向通用人工智能大模型的测评体系,从7个主要方向、481个细分任务类型对模型效果进行细化评价,包括文本生成、语言理解、知识问答、逻辑推理、数学能力、编程能力和多模态能力等,从而促使大模型的能力呈现更加客观。 图4.通用认知智能大模型评测体系 具体到星火大模型而言,发布会从七个方向对模型能力进行了全方位的展示,具备包括:多风格、多任务长文本生成;多层次、跨语种语言理解;泛领域、开放式知识问答;情境式、思维链逻辑推理;多题型、可解析数学能力;多功能、多语言代码能力;多模态输入和表达能力。 图5.通用认知智能大模型评测体系 一是多风格、多任务长文本生成。星火大模型可以实现多种文本生成功能,比如生成欢迎词,创作一个特定要求的故事,还可以根据要求写作工作邮件等公文。此外,星火大模型可以实现用多种语言生成文本,例如用英文生成一个品宣文案,并支持对文案进行翻译。不仅如此,星火大模型还可以对文字用不同的风格进行再次创作,例如用小红书的风格重写文案等。我们认为,多风格、多任务的长文本生成式大预言模型的基础应用之一,星火大模型已经具备了相应的能力,为其他的应用奠定了基础。 图6.星火大模型生成欢迎词 图7.星火大模型生成英文文案 图8.星火大模型生成文案风格重写 二是多层次、跨语种语言理解。星火大模型可以实现不同层次的语义理解。如最细粒度的单词和语法方面的检查,以及对于句子含义的理解,乃至最高层次的关于句子情感的分析。语义理解是认知智能大模型的主要应用领域和研究方向之一,能够准确进行分词和情感识别,也是未来复杂场景下任务处理的基础。 图9.星火大模型进行语法纠错 图10.星火大模型进行语义理解 图11.星火大模型进行情感分析 三是泛领域、开放式知识问答。星火大模型针对生活常识、科学知识、工作技巧以及医学知识等大众关注的领域,可以进行相应的回答,且仍在不断地丰富学习和完善中。例如,可以询问专有名词的解释,一些医学领域的常识等,这类应用有望部分取代搜索引擎的功能,实现知识的快速查询。 图12.星火大模型进行知识问答 图13.星火大模型解答医学知识 四是情境式、思维链逻辑推理。星火大模型可以实现常识推理、科学推理以及时空推理等多方面的逻辑推理。我们认为逻辑推理能力是未来通用人工智能产生质变的重要能力,当前各家大模型厂商均在尝试,客观而言逻辑推理能力相比人而言仍有较大差距,但是这是值得研究和突破的重要方向。星火大模型具备了初步了逻辑推理能力,未来有望持续迭代升级。 图14.星火大模型回答逻辑谬误 五是多题型、可解析数学能力。数学能力包括计算、代数、几何、解方程、情景应用等。数学能力一定意义上代表了通用人工智能认知大模型的智慧水平。公司目前的星火大模型,已经初步具备一定的数学解题能力。 图15.星火大模型给出数学解题过程 图16.星火大模型列方程求解数学问题 六是多功能、多语言代码能力。这一能力星火大模型仍在迭代过程中,根据发布会的时间表,公司将在8月15日的新版本中进一步突破代码能力,从而实现为开发者赋能。 图17.星火大模型进行代码生成 七是多模态输入和表达能力。星火大模型一方面搭载了讯飞多年积累的语音识别和合成技术,能够实现语音的输入和输出。另一方面,发布会展示了星火大模型对图像的识别,以及生成虚拟数字人视频的场景。我们认为这些能力仍将进一步持续迭代,从而拓展星火大模型的应用范围和场景。 图18.星火大模型进行图片文字识别翻译 图19.星火大模型生成虚拟人宣传视频 大模型持续迭代,仍有问题亟待攻克。虽然包括星火在内的大模型已经具备了在多种下游任务中的通用化能力,但是目前仍有部分问题亟待解决。例如对于新知识难以及时更新的问题,对于时事类问答容易“张冠李戴”的问题,对于史实、传统典籍等容易“编造情节”的问题,以及对于数学和逻辑推理方面仍需进一步提升。我们认为这是模型演进的未来方向,讯飞有望在原有模型的基础上,通过多轮迭代,继续提升产品性能,真正向通用人工智能迈进。 图20.大模型技术的几大待攻克问题 2.从技术探索到场景落地,星火首发四类应用场景 围绕1+N大模型体系,首发四大类应用产品。科大讯飞除了做到核心技术“顶天”之外,也在多个垂直应用领域建立了“根据地”优势。结合公司在垂直行业多年的深耕优势和产品,公司此次发布会了搭载星火大模型的四大类应用产品。分别为:1)AI+教育:发布搭载星火大模型的AI学习机新品,实现中英文作为的自动化批改;2)AI+办公:发布搭载星火大模型的智能办公本,实现会议语音转写和纪要的语篇规整和一键成稿;3)AI+汽车:发布搭载星火大模型的汽车座舱人机交互系统,提供多轮、多人、多区