事件:11月30日,OpenAI发布免费机器人对话模型ChatGPT(GPT-3.5系列),模型中首次采用RLHF(从人类反馈中强化学习)方式。模型目前处于测试阶段,面世一周便已有超过一百万用户使用。 从受众和技术上看,ChatGPT在AI文字交互模型领域十分突出。与此前的模型相比,ChatGPT亮点主要包括:(1)全面免费开放,OpenAI所有用户只需输入文字,就可免费调用完成各种事情(如数学计算、debug、写信、生活问题解答等),实感体验为广泛讨论创造土壤;(2)新增代码理解和生成能力,彰显技术实力的同时也拓宽了应用场景;(3)加入道德原则。RLHF训练方式使ChatGPT能够识别恶意信息,识别后拒绝给出有效回答。(4)支持连续对话。ChatGPT具有记忆能力,提高了模型的交互体验。参考海外用户实际体验,ChatGPT对大部分问题的回答都较为合理,对于写信、写短文等需要创造内容的要求也可以给出较为丰富流畅的文字方案;总体上,ChatGPT对话效果令人满意,新鲜感与实用价值使其快速走红。 工具价值:低门槛、高效的AIGC文字内容生产工具。虽有不少声音将ChatGPT与谷歌等搜索引擎对比,但由于该模型仍无法很好解决提供虚假信息的问题,甚至过度猜测用户意图导致回答偏差较大,我们认为其本质仍偏向AIGC内容生产工具。搜索引擎核心是海量信息集合,而非信息创造;但在“存在标准答案”的领域(如编码、数学计算等),ChatGPT或将对搜索引擎产生一定冲击。其次,相比更多面向B端客户的GPT-3,C端学习和使用成本低、产出效果好的ChatGPT有望助力AIGC破圈,并在接收海量用户反馈的过程中继续迭代,推动AIGC文字内容生产走向全民化。 为何ChatGPT能实现如此革命性的变化?通过梳理前几代模型,我们认为新技术RLHF训练方式的引用或是关键:1)从GPT到GPT3:优化主要来自算力增加(烧钱)。GPT、GPT-2和GPT-3在算法模型并没有太大改变,但参数量从1.17亿增加到1750亿,预训练数据量从5GB增加到45TB,其中GPT-3训练一次的费用是460万美元,总训练成本达1200万美元(数据来自21世纪经济报道和品玩)。虽然训练数据量和算力大幅增加使GPT-3有显著优化,但高额投入也使其只能走B端变现。2)变化出现在22年推出的GPT3.5,技术迭代成优化来源:InstructGPT(1月发布)模型中增加了人类对模型输出结果的演示,并在对结果进行排序的基础上训练,加上指令调整的帮助,虽然其只有13亿个参数,但回答准确率、道德表现却好于GPT-3。ChatGPT则加入了RLHF训练方式(相关论文22年3月发表),根据ChatGPT,其每次对话平均费用在0.01-0.2美元,模型效果比Instruct GPT又提升一个台阶。我们认为新技术发展和应用将是AIGC工具出现革命性迭代更为重要的驱动。 投资建议:2022年以来AIGC应用多点开花,我们认为ChatGPT是又一个起点,随着深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,AIGC有望加速发展,互联网奇异点正逐渐临近。技术相关标的,我们推荐百度集团(已发布AI助理,覆盖AI自动生成文字等AIGC应用)、微软(投资OPENAI,人工智能领域深度布局)、英伟达(AIGC算力要求提升;位于视觉生成研究领域前沿)和阿里巴巴(阿里云元宇宙加速器; AI视觉物料生成系统阿里鹿班);应用相关标的,我们推荐腾讯控股、建议关注在AI领域有所布局的头部网文平台阅文集团和中文在线。 风险提示:行业发展不及预期、部分公司相关业务布局偏早期。