ChatGPT 林惠⽂@真格基⾦ daimajia.com 体验ChatGPT 与GPT-3的对⽐ 与GPT-3的对⽐ 与GPT-3的对⽐ 强烈建议体验 https://mirror.xyz/0x6E12A28086548B11dfcc20c75440E0B3c10721f5/9O9CSqyKD j4BKUIil7NC1Sa1LJM-3hsPqaeW_QjfFBc ChatGPT提升的核⼼点 •敢于质疑不正确的前提 •主动承认错误和⽆法回答的问题 •⼤幅提升了对⽤户意图的理解 •⼤幅提升了结果的准确性 提升⼈类意图的⼀致性 连续多轮对话能⼒ 提升的原因 加⼊了基于⼈类的反馈系统 什么是⾹蕉? ⾹蕉,从属性来说,与草莓、葡萄、猕猴桃是亲… ⾹蕉为芭蕉科植物 ⽢蕉的果实。原产亚洲东南部… ⾹蕉是芭蕉科、芭蕉属植物... ⾹蕉是⼀种⽔果,从⾹蕉树…. 写个⽔獭的故事 持 很久很久以前...续 优 化参数迭 代 ReinforcementLearningfromHumanFeedback 什么是⾹蕉? ⾹蕉是⼀种⽔果,从⾹蕉树…. 丛问题库⾥抽取问题 采样问题,并列出所有模型和标记者的回答 标记者(Labeler)书写期待的回复 被标记的数据⽤来调优 GPT-3.5 标记者(Labeler)排序所有标记着答案 ⽤排序答案训练奖励模型 通过模型⽣成初步回答 输⼊奖励模型得到分数和优化参数 往前捋捋 GPT-1 GPT-2 GPT-3 InstructGPT chatGPT 2018201920202022 1.17亿参数 15亿参数 1500w美⾦ 1750亿参数 再往前捋捋 InstructGPT chatGPT GPT-1 Transformer Decoder GPT-2 GPT-3 BERT T5 BART M2m-100 BigBird ALBERT XLM RoBERTa Encoder ELECTRA 2017 《AttentionisAllYouNeed》 继续再往前捋捋 GPT-1 Transformer BERT T5 RNN 循环神经⽹络 CNN 卷积神经⽹络 GP B RoB 1990开始-2006突破-2015繁荣2017开始 继续再往前捋捋 CNN 卷积神经⽹络 Transformer GPT 机器学习 基于规则 RNN 循环神经⽹络 T5 BER 1950开始 1980开始 1990开始-2006突破 2017开始 发展趋势 基于规则 机器学习 神经⽹络 Transformer ⼿写规则,简单粗暴只能处理⾮常少量数据 找到⼀些函数或参数分类固定量数据 分类⻩⾖和绿⾖ 像⼈脑⼀样学习开始尝试⼤量数据 提前标记⼀些数据 根据⼤量数据分类学习⼀个复杂的参数集合 优化⼈脑学习过程关注重点⽽⾮全部 发展趋势 神经⽹络 Transformer GPT3 ChatGPT 像⼈脑⼀样学习 提前标记⼀些数据 根据⼤量数据分类学习⼀个复杂的参数集合 优化⼈脑学习过程关注重点⽽⾮全部 投喂 海量的学习数据 ⽆需分类数据 1200万美⾦ ⼈对结果的反馈成为学习过程的⼀部分 数据量 算法 + 既要聪明,⼜要努⼒ 数据量 算法 + ChatGPT: 每⾛⼀步都观察⼈类反馈朝着⼈类期望的⽅向进发 脑洞思考 GPT3 基于⼈类反馈的训练⽅法 ? 能否拓展到更多领域?⽐如情感? 的学习数据的学习过程 ⼈对结果的反馈成为学习过程的⼀部分 更遥远的未来有没有算法能突破⼈脑结构限制? ChatGPT 00万美⾦ 投资⻆度 应⽤层⾯: 出现新的AI+创业机会 1.更好的客服机器⼈、机器翻译等 2.更垂直的专业化AI(⽤户反馈系统定向训练) 3.AI基础设施(模型运维,管理,训练等) 需要考虑: 1.⼤模型开始流⾏(创业初始成本上升,团队融资能⼒) 2.训练成本持续上升(团队商业能⼒) OpenAI发展史 OpenAI发展历史 •2015年12⽉:OpenAI由⼀群包括ElonMusk和SamAltman等个⼈和组织创建,旨在推进和促进⼈⼯智能领域的研究。 •2016年:OpenAI开发了第⼀个⼈⼯智能系统,击败了职业玩家在《Dota2》游戏中。 •2017年:OpenAI发布了GPT-1,这是⼀个能够⽣成⼈类⽂本的语⾔处理模型。 •2018年:OpenAI与Microsoft合作,推出了AzureAIPlatform,这是⼀个新的项⽬,旨在让开发 ⼈员更容易构建和部署AI应⽤程序。 •2019年:OpenAI发布了GPT-2,这是⼀个⽐GPT-1功能更强⼤的语⾔处理模型。 •2020年:OpenAI发布了DALL-E,这是⼀个能够根据⽂本描述⽣成原始图像的创意AI系统。 •2021年:OpenAI发布了GPT-3,这是⽬前为⽌最⼤最强⼤的语⾔处理模型。 OpenAI主要⽅向 •语⾔处理:OpenAI开发了⼏款⾼度先进的语⾔处理模型,其中包括GPT-3,这是⽬前为⽌最⼤最强⼤的语⾔处理模型。这些模型能够⽣成⼈类⽂本,并在⾃然语⾔理解⽅⾯取得了显著的进展。 •计算机视觉:OpenAI也在计算机视觉领域开展了⼤量研究,并开发了⼀些先进的AI系统,能够像⼈类⼀样识别和理解图像。 •深度强化学习:OpenAI还在深度强化学习领域开展了⼤量研究,并开发了⼀些⽤于游戏和其他应⽤的AI系统。 OpenAI:“以上都是我总结的” •https://openai.com/blog/chatgpt/ •https://openai.com/blog/instruction-following •https://beta.openai.com/docs/model-index-for-researchers •https://mp.weixin.qq.com/s/haaL-2XjRG0oS24pQyqw1A •https://easyai.tech/ai-definition/nlp/ •https://www.exxactcorp.com/blog/Deep-Learning/deep-learning-in-natural-language-processing-history-and-achievements •https://dennybritz.com/posts/wildml/understanding-convolutional-neural-networks-for-nlp/ •https://github.com/sw-yx/ai-notes/blob/main/TEXT.md#jailbreaks •https://xiaosheng.run/2022/04/04/transformers-biography.html •https://zhuanlan.zhihu.com/p/43493999 •https://zhuanlan.zhihu.com/p/350017443 •https://easyai.tech/ai-definition/attention/ •https://medium.com/walmartglobaltech/the-journey-of-open-ai-gpt-models-32d95b7b7fb2