您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[民生证券]:计算机行业AI应用侧系列报告:微软拉开AI应用序幕 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业AI应用侧系列报告:微软拉开AI应用序幕

信息技术2023-03-08民生证券杨***
计算机行业AI应用侧系列报告:微软拉开AI应用序幕

最新版Windows 11加入人工智能体验,从“开始”菜单开启PC端AI应用的序幕。2023年3月7日,微软发布Windows 11重要更新,相关更新将重塑和提升人们通过PC完成各项事务的使用体验。人工智能驱动的“开始”菜单,有望成为PC端AI应用的起始。此次Windows11的人工智能更新开始于“开始”菜单,从第一入口带来由AI驱动的推荐内容。通过Azure Active Directory (AAD)实现会议准备、快速访问正在协作处理的文件、快捷搜索本地及云端文件等核心功能。 新一代GPT-3.5-Turbo与Whisper models正式发布,文本与语音应用率先接入。2023年3月2日,OpenAI推出自然语言对话模型GPT-3.5-Turbo和语音转文本模型Whisper models的开发者API。ChatGPT-3.5-Turbo模型具有高准确性、可靠性和可扩展性,具有更强大的抽象能力和语法识别能力,能够准确理解人类语言的含义和上下文,并将其转化为精准的文本输出。Whisper的自动语音辨识模型,将各种语言的语音变成文本,识别准确率高,无需联网,本地运行。目前已有多个应用程序通过API的方式将ChatGPT融入到服务之中,从社交到购物再到学习,扩大ChatGPT的应用生态,并优化应用的AI商业模式。 10倍的成本降低有望催动海量应用迈入AI新时代。OpenAI发布的ChatGPT API访问的模型被称为gpt-3.5-turbo,定价只要0.002美元/1000 tokens,相当于企业付费2美元就可以输出75万单词。费用门槛的大幅下降带来ChatGPT被集成到更多的APP应用的可能性。目前海外多家宣布接入ChatGPT API,涉及行业和领域包括照片分享、生鲜电商平台、单词背诵软件、跨境电商、微软新版Bing、C3.AI赋能海量应用、AIGC,形成OpenAI和微软现有的合作伙伴相互赋能的应用格局。 GPT将率先赋能于海外业务,映射至国内率先布局海外应用的相关企业将优先收获GPT赋能。截至目前,中科创达已与多家海外厂商建立密切合作,在边缘计算和行业领域初具规模;梦网科技、金桥信息等厂商找到ChatGPT相关业务突破口,有望加快推进AI应用侧产品落地;昆仑万维、万兴科技等厂商已与OpenAI达成合作,即将接入ChatGPT相关功能;福昕软件、汤姆猫等厂商的海外业务收入占比超30%,有望于GPT领域充分受益。 投资建议:从顶层设计向应用侧迈进是所有新技术的生命脉络。本次由ChatGPT引爆的技术变革,在短短几个月中已经于海量应用中全面开花。微软作为PC、云、移动终端集大成的AI厂商,在OpenAI的赋能下,从应用的制高点层层推进,此次PC端“开始”菜单的重构和GPT API接口开放将成为应用端迈进AI时代的起点。重点推荐率先布局海外并全面对标C3.AI的中科创达以及海外业务领先厂商梦网科技、金桥信息;建议重点关注福昕软件、万兴科技、昆仑万维、汤姆猫等具备海外应用布局的应用层企业。 风险提示:技术落地不及预期风险,行业竞争加剧风险。 重点公司盈利预测、估值与评级 1ChatGPT开放API接口,引领AI领域新革命 1.1OpenAI开放ChatGPT API接口 2023年3月2日,OpenAI推出了自然语言对话模型GPT-3.5-Turbo和语音转文本模型Whisper models的开发者API。ChatGPT-3.5 Turbo模型是GPT-3.5系列中最快速、最便宜、最灵活的模型,具有高准确性、可靠性和可扩展性,能以极低的成本获取精准的结果。GPT-3.5 Turbo作为新型自然语言处理模型,使人类与计算机之间的交流更加顺畅和高效。Whisper是Open AI在22年9月开源的语音转文本模型,支持其它98种语言的自动语音辨识。Whisper系统所提供的自动语音辨识模型能将各种语言的语音变成文本,接受m4a、mp3、mp4、mpeg、mpga、wav、webm等多种格式,其核心业务是语音辨识与翻译任务。Whisper无需联网,完全在本地运行,识别准确率高,可称为本地类脑。 图1:ChatGPT和Whisper APIs GPT-3.5-Turbo和Whisper models的API价格低廉, 功能强大。 GPT-3.5-Turbo模型定价0.002美元/ 1000 tokens,价格是GPT 3.5模型额1/10;参数数量更多,能够生成更准确、更具上下文相关性的响应;包括额外的训练数据和微调,进一步提高了性能,适合应用于语言翻译、聊天机器人开发、内容生成等。与传统的自然语言处理算法相比,GPT-3.5 Turbo有着更强大的抽象能力和语法识别能力,能够准确地理解人类语言的含义和上下文,并将其转化为精准的文本输出。Whisper的英文语音辨识能力已达到人类水准,可以用来转录或翻译音频,识别准确率相当高,可以在本地运行,费用为每分钟0.006美元。 表1:GPT-3.5-Turbo、GPT-3.5和Whisper Model对比 图2:GPT-3.5-Turbo收费 1.2ChatGPT API应用走入千行万业 目前已有多个应用程序通过API的方式将ChatGPT融入到服务之中。 OpenAI向企业开放API端口,社交软件SnapChat、购物软件Instacart、学习软件Quizlet和Speak等均已嵌入ChatGPT API。IT之家2月28日消息,2023年3月7日,微软发布Windows 11重要更新,相关更新将重塑和提升人们通过PC完成各项事务的使用体验。微软作为PC、云、移动终端集大成的AI厂商,在OpenAI的赋能下,从应用的制高点层层推进,此次PC端“开始”菜单的重构将成为应用端迈进AI时代的起点。多个应用程序通过API的方式将ChatGPT融入到服务之中表明两个新的API有利于扩大AI的应用场景,丰富ChatGPT的应用生态,优化人工智能应用的商业模式,为人工智能的发展和应用带来巨大推动力。 此外,ChatGPT模型还在不断改进、自我完善,未来将有更多增强功能供APP开发人员使用,ChatGPT的应用场景或将更加丰富。 表2:ChatGPTAPI和Whisper API的早期应用 表3:ChatGPT API和Whisper API的早期应用 2成本降低有望催动海量应用进入AI时代 2.1新模型gpt-3.5-turbo发布,成本降低90% 与传统搜索引擎相比,聊天机器人的运营成本高昂。摩根士丹利的分析表示,谷歌去年共计3.3万亿次搜索,每次搜索的成本仅为0.2美分。而此前有分析师指出,ChatGPT的一次回复则会产生2美分的成本。摩根士丹利预计,若将谷歌旗下聊天机器人Bard引入搜索引擎,并用其处理谷歌一半的搜索和提问,按照每次答案50词计算,该公司2024年的成本可能会增加60亿美元。专注于芯片技术的咨询公司SemiAnalysis表示,受到谷歌的内部芯片Tensor Processing Units等的影响,将聊天机器人添加至搜索引擎中,可能会导致该公司额外花费30亿美元。 OpenAI新模型使成本大幅降低。3月1日,OpenAI正式宣布,开发者现在可以通过API将ChatGPT和Whisper模型集成到他们的应用程序和产品中。此次ChatGPT API访问的模型被称为gpt-3.5-turbo,gpt-3.5-turbo和ChatGPT产品使用相同的模型,定价只要0.002美元/1000 tokens,后者可以看作一个非结构化的单词,1000个相当于750个单词,算下来就是企业付费2美元就可以输出75万单词。现在这个价位做到了让人类普惠性使用AI,也是其他AI公司目前做不到的价位。随着ChatGPT开放API,很多公司可以正式接入ChatGPT的AI服务。 2.2GPT-3.5的三大优势 与GPT-3相比,GPT-3.5增加代码训练(Code-training)与指示微调(Instruction-tuning)两个训练步骤:1)代码训练:经过前期的代码训练,GPT-3.5模型具备更好的代码生成与代码理解能力,同时间接拥有了使用思维链进行复杂推理的能力;2)指示微调:经历Instruction-tuning,GPT-3.5具备更好的模型泛化能力,同时模型的生成结果更加符合人类的预期。 GPT-3.5具备三大优势,ChatGPT实现优势融合。基于模型训练的持续优化,与GPT-3相比,GPT-3.5具备三大优势:更强的复杂推理能力,更好的人类指令响应,更全面的文本、代码生成能力。作为基于GPT-3.5的模型微调产物,ChatGPT实现了Code-training、Instruction-tuning、RLHF等训练的优势整合,我们针对ChatGPT优势进行能力溯源: 1)预训练大模型:ChatGPT具备的语言生成能力、基础世界知识、上下文学习能力等基本能力均来源于基于Transformer的模型预训练;大量知识的存储能力依托于庞大的模型参数(GPT-3模型参数为1750亿); 2)代码训练:ChatGPT具备较好的代码生成与代码理解能力,同时具备执行复杂推理的能力,主要得益于代码训练Code-training的引入;初代GPT-3未进行过专门的代码训练,因此在代码生成、理解方面能力相对较差,同时推理(思维链)能力也较差;因此可以判断,代码训练是ChatGPT上述能力的重要来源; 3)人类反馈强化学习:ChatGPT具备更好的问答能力,同时可以拒绝不当的问题、拒绝知识范围之外的问题,这些在对话问答上的突出表现,得益于人类反馈强化学习RLHF的训练,让ChatGPT更加遵循人类的价值观,同时拥有了建模对话历史、增加对话信息量等能力。 表4:GPT系列产品升级情况每代GPT时间 2.3ChatGPT改变应用生态,赋能千行百业 2.3.1Bing&Edge+AI 2023年2月8日,微软公司发布了新版必应AI搜索引擎和Edge浏览器,采用了ChatGPT开发商OpenAI的最新技术AI模型GPT-3.5的升级版,率先提供更具对话性的网络搜索和创建内容的替代方式,集搜索、浏览、聊天于一体,带来前所未有的全新体验。新版必应还更加“人性化”,不仅会为用户提供问题选项,还会在回复中使用表情符号;新版必应更加“严谨”,会在回复中标注所引用的来源,并列出对应网站;新版必应更加智能,AI聊天搜索能够通过自然语言处理技术对用户提出的问题进行分析和理解,从而能够给出更加智能化的搜索结果;新版必应更加个性化,通过对用户提出的问题进行分析和理解,AI聊天搜索可以给出更加个性化的搜索结果,满足用户不同的需求;新版必应更加便捷,AI聊天搜索可以通过对话的形式进行搜索,用户可以通过直接与搜索引擎进行对话的方式获取所需的信息,更加便捷快捷。 AI聊天搜索可以应用于各种不同的场景。例如: 1.旅游出行:在旅游出行过程中,用户可能需要查询各种信息,例如交通路线、景点介绍、天气预报等。通过AI聊天搜索,用户可以直接向搜索引擎提出问题,获取所需的信息。 2.学习研究:在学习和研究过程中,用户可能需要查询各种资料和文献。通过AI聊天搜索,用户可以直接向搜索引擎提出问题,获取所需的资料和文献。 3.工作咨询:在工作中,用户可能需要查询各种信息,例如公司资料、行业资讯等。通过AI聊天搜索,用户可以直接向搜索引擎提出问题,获取所需的信息。 微软企业副总裁兼消费领域首席营销官Yusuf Mehdi公布的最新推文称,在新版Bing上线48小时内,已经有超过100万人申请加入。 图3:Bing&Edge+AI:一种全新的搜索方式 2.3.2美股AI龙头C3.AI启示录:聚焦AI应用侧最佳“掘金铲” C3.AI在赋能海量应用的同时,也不断拔高自身的稀缺性,而看似无解定制化开发的恶性循环,也在生成式AI与边缘AI的相结合下,有望迎来真正的突破。 边