您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国泰君安证券]:国君:OpenAI首届开发者大会重大更新20231107 - 发现报告

国君:OpenAI首届开发者大会重大更新20231107

2023-11-06 国泰君安证券 Lumière
报告封面

核心要点 GPT-4Turbo将大量功能集成,调用API更容易。使用GPT4Turbo的ChatGPT可以将编写和运行代码、分析数据、生成图像等功能集成。其支持128000个tokens,上下文长度多达32K。JSON模式也确保了模型有效响应,使调用API变得更加容易,实现模型的更高程度控制。GPT4Turbo拥有截至2023年4月的世界知识,并可以将来自外部文档或数据库知识带入构建的内容中。 推出GPT商店,应用生态将快速繁荣。微调API旨在数据量相对较小的各种应用中实现更好的性能,其功能包括修改模型训练过程的每一步、进行额外特定领域预训练以及在自身构建的GPT中上传文档等等。基于此,OpenAI也推出GPT商店,用户既可以构建私有GPT来使用,还可以通过提供链接来分享到应用商城,构建最实用和最常用的GPT的开发者也将获得一定收入。 成本大幅下降,且引入“版权盾”机制。相比于GPT4,GPT-4Turbo在实现每分钟tokens数翻倍的同时,还降低了API租赁价格,prompttokens便宜了3倍 ,completiontokens便宜2倍。另外,为了保证在平台上安全构建应用,引入了版权盾机制。由此可见,从技术性能到商用机制,AI应用开发生态得到了明显的完善。 发布会全文 首先回顾一下大模型的历程。2022年11月发布了ChatGPT。今年3月,公司随后推出GPT4,这是目前功能最强大的大模型。在过去的几个月里,公司又相继推出了语音和视觉功能,这样ChatGPT现在可以看到、听到和说话。此外,公司近期又推出了世界上最先进的视觉模型DALL.E3。今天,公司有大约200万开发人员在公司的API上构建了各种各样的应用,超过92%的世界500强公司都在使用ChatGPT,ChatGPT每周有大约1亿活跃用户。令人难以置信的是,ChatGPT完全是通过口口相传没有任何的推广,人们只是觉得GPT有用就推荐给他们的朋友。OpenAI是目前世界上最先进、应用最广泛的AI平台。今天公司推出了一款新版本大模型——GPT4Turbo,它将带来颠覆性的改变。 GPT4Turbo有六个方面的革新。 第一,更多的内容长度。很多人的任务需要更长的内容长度。GPT-4支持多达8K和特定情况下32K的内容长度。而GPT4Turbo支持多达128K的内容长度,大概是一本300页的书。除了内容长度外,模型在长文本中的提取准确率也在上升。 第二,更多的控制方式。公司通过反馈得知开发人员需要更多控制模型的响应和输出,所以公司已经通过多种方式解决了这个问题。公司有一个名为JSON模式的新功能,它确保模型将以有效的JSON模式响应,这将使调用API变得更加容易。同时,该模型在函数调用方面也更好,它可以一次调用许多函数。公司还引入了一个名为可重复输出的新功能。只要使用者传递种子参数,它将使模型返回一致的输出。当然,这给了用户对模型行为更高程度的控制。这些功能将在今天的beta版本推出。之后公司还将推出一项功能,让用户可以在API中查看日志探测。 第三,更新的知识储备。公司正在平台上启动检索,用户可以将来自外部文档 或数据库的知识带入用户正在构建的任何内容中。公司也在不断更新知识库。GPT-4对世界的了解在2021年终止。而GPT4Turbo拥有截至2023年4月之前全世界已有的知识,公司也将随着时间的推移继续更新。 第四,全新的视觉模态。GPT4Turbo使用了全新的视觉、文本、语音模型。公司有一些客户开始使用DALL.E3的编程方式生成图像和设计。GPT4Turbo现在可以通过API接收图像和语音的输入,进而完成生成字幕,图片分类和分析等功能。例如,BeMyEyes使用这项技术来帮助盲人或视力低下的人完成日常任务,帮助他们识别面前的产品。新的文本转语音模型将能够从API中的文本生成令人难以置信的自然声音音频,并有六个预设声音可供选择。语音可以使应用程序更自然地交互以及更易于访问。公司今天还发布了开源语音识别模型WhisperV3,它在许多语言中都有不俗的性能提升。 第五,更多的定制化选择。自从公司几个月前推出GPT3.5以来,微调一直非常有效。从今天开始,公司将把微调扩展到16K版本,并且邀请活跃的微调用户申请微调实验访问计划。微调API非常适合调整公司的模型,以在数据量相对较小的各种应用中实现更好的性能。用户希望模型学习全新的知识领域或使用大量专有数据,所以今天公司推出了一个名为自定义模型的新程序。通过自定义模型,公司的研究人员将与公司密切合作,帮助他们制作出色的自定义模型 ,这包括修改模型训练过程的每一步,进行额外的特定领域预训练,为特定领域量身定制的自定义后训练过程等等。公司并不推荐初创企业使用这一功能,因为前期的成本相对来说比较高昂。 第六,更高的速率限制。用户可以直接在API账户设置中请求更改进一步的速率限制和配额。此外,公司正在引入版权盾。版权盾意味着如果用户面临有关版权侵权的法律索赔,公司将介入并保护公司的客户并支付所产生的费用。这适用于ChatGPTEnterprise和API。公司始终坚持一点,永远不会用API或GPT企业的数据进行训练。 GPT4Turbo是一个更好的模型,而且GPT4便宜得多,输入tokens价格为原来的三分之一,输出tokens价格为原来的二分之一。因此,对于大多数客户来说 ,新的定价是每一千输入tokens1美分,每一千个输出tokens3美分。这将导致GPT4Turbo比GPT4便宜超过60%。除了价格,公司深知速度很重要,所以GPT4Turbo变得更快了。 微软一直与GPT深度合作。公司一直在做的第一件事是与GPT合作构建系统,从电源到DC到机架再到加速器再到网络,Azure的格局发生了巨大变化,并且正在快速变化,以支持正在构建的这些模型。因此,公司的首要工作是构建最好的系统,以便可以构建最好的模型,然后将所有这些都提供给开发人员。另一件事是公司正在构建产品。Copilot完全改变了基础模型的概念。因此,公司想让Githubcopilot可用,GPT可以依靠公司在API支持下构建Azure中最好的基础架构,并将其带给所有人。然后甚至还有AzureMarketPlace这样的东西 ,供在这里构建产品以快速进入市场的开发人员使用。 ChatGPT进化为GPTS。人们对于AI的终极设想就是公司只负责提出需求,它就会为用户完成所有任务,这些功能在AI领域经常被称为代理工作。公司在ChatGPT上作出了第一步的尝试,GPTS是为特定目的量身定制的ChatGPT版本,几乎适用于任何具有说明、扩展知识和操作的内容,然后用户可以发布它供其 他人使用。因为它们结合了指令、扩展知识和行动能力,所以它们对用户更有帮助。它们可以在许多情况下更好地工作,并且可以给用户更好的控制。它们会让用户更容易完成各种任务。实际上,用户只需与GPTS交谈即可使用自然语言对其进行编程。这使得编程他们非常容易,并为每个人提供了代理工作。GPTS可以用于讲解视频的制作,海报的绘画,行程安排的计划等等。公司构建GPTS时考虑到安全性。在执行任何操作或共享数据之前,它会请求用户的许可,然后GPTS再接收用户的指令,决定调用哪个能力来执行该操作,然后为用户执行该操作。 本月月底,公司将推出GPT商店。用户可以在那里列出一个GPTS清单,公司将能够展示最好和最受欢迎的GPTS。当然,公司会确保商店中的GPTS在可访问之前遵循公司的政策。同时,收益分享对公司很重要。公司将向打造最有用和最常用的GPT的人支付公司收入的一部分。公司很高兴通过GPT商店培育一个充满活力的生态系统。 AssistantAPI帮助开发者更好地进行应用程序的开发。AssistantAPI可以通过自然语言完成复杂功能,极大地缩短了开发者的使用门槛和时间成本。同时,代码解释器现在也可以在API中使用。这使AI能够即时编写和执行代码,甚至生成文件。与此同时,公司还可以结合一些新工具和模式,AssistantAPI甚至可以实现语音助手的形式。比如,在检索和函数调用演示中,通过AssistantAPI给五个线下参加活动的幸运观众的账号发了500美元的使用额度。 综上所述,公司推出了新的GPT4Turbo模型,可提供改进的功能、调用知识、降低的定价、新模式,以及加深与微软的合作伙伴关系。同时,公司引入了GPTS,结合了指令、扩展知识和操作,迈出AI代理的第一步。公司还推出了AssistantAPI,以便更轻松地使用用户自己的应用程序构建辅助体验。随着时间的推移,公司将进一步提高模型能力。