您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:阅览室、豌豆荚创始人王俊煜出门问问创始人李志飞 - 发现报告
当前位置:首页/会议纪要/报告详情/

阅览室、豌豆荚创始人王俊煜出门问问创始人李志飞

2023-04-13未知机构.***
阅览室、豌豆荚创始人王俊煜出门问问创始人李志飞

阅览室、豌豆荚创始人王俊煜出门问问创始人李志飞:ChatGPT2023-0331 3月23日,OpenAI宣布计划推出Plugins插件以「帮助ChatGPT访问最新信息、运行计算或使用第三方服务」。插件可以显著增强自然语言处理能力,使其与用户的交流更加有效。拥有了插件之 后,本来作为演示产品而存在的ChatGPT突然成为了一个面向普通消费者的服务平台,很多商业落地场景有了新的想象,甚至于不少传统互联网巨头的业务模式都受到了新的挑战,这会是互联网巨头的 「诸神黄昏」吗? 01 ChatGPT的Plugins,如何颠覆传统搜索 Q:如何看待ChatGPT新发布的Plugins? 李志飞:我觉得它最神奇的地方在于用户不需要做任何事情,就可以奇迹般地提供答案。谷歌的垂直搜索引擎OneBox操作起来首先要把领域加进去,然后标很多语义数据,再定义一个语义模板,这样放到个人系统里面去训练,整个一个闭环才能实现自然语言和机器的交流。而Plugins省去了所有这些步骤,只要能把网站的信息提供总计好给它,它就可以直接出来OneBox一系列操作才能呈现出来的结果。也就是说它是一个通用的语义解析器,不需要提前定义语义模板,也不需要标注数据,就可以做到这种插入(plugin)。 Q:这样看来,ChatGPT不只是一个对话工具,我们也可以把它拆开做对应组合来延展它的应用。而且这种插件本身构造难度也很低,可以让很多人受益。 王俊煜:首先先澄清一下,我最近看到一个说法,是说插件的制作过程是可以跟ChatGPT的交互来完全自动化完成的,就是自己给自己写插件,但目前来说这个还没有实现。我觉得插件更神奇的是,相对于大模型来说,它能够知道什么时候来调用。我之所以认为这个功能很神奇不是说从技术角度,而是说从产品角度。 我在这从头说说这个插件到底是什么机制。首先有一个在线服务,然后有一个接口。OpenAI的创始人说是要给自然语言模型写一个API文档*。我想提醒大家注意的是,不是说我们可以用自然语言写文档,而是还要用文档格式写文档,也就是还是要代码语言。然后把manifest*给ChatGPT理论上就能够通过API调用,我觉得这个是很神奇的。之前我们用伪程序员Postman*这种工具虽然也能知道如何通过API发出一个请求,但其实还是有些麻烦。而且还要理解不同API的endpoint的不同参数是什么意思。ChatGPT宣称可以自行理解这些文档,只要文档写得够清楚。 *API文档:API文档或API描述文档是帮助开发人员使用您的API的参考资料、教程和示例的集合。 API的文档是解释API的可能性以及如何开始的主要资源。 *manifest(清单):是唯一标识程序集的XML文档。它包含用于绑定和激活的信息,例如COM 类、接口和类型库。清单可以是外部XML文件或嵌入在应用程序或程序集中的资源。 *postman:一个用于构建和使用API的平台 从流量分发角度来讲插件也是很神奇的一件事情。之前我们做SEO,哪些结果排在前面是由搜索引擎 决定的,然后用户再来做决策。但是ChatGPT的插件机制就由它来替用户做选择。现在因为还有一些数量限制,导致体验可能要打一些折扣,我相信未来这些限制去掉以后,体验会越来越神奇。因为这 相当于ChatGPT猜测用户意图,而且这个意图是ChatGPT通过用户的自然语言去判断用A服务还是B服务满足。本质上是只要给ChatGPT一个API,告诉ChatGPTAPI是做什么的,怎么调用、什么时候调用、返回的结果怎么理解,这些都是自动化完成的。 ChatGPT插件演示|来源:OpenAI官网 我对于插件,还有之前ChatGPT进入市场(gotomarket)的能力也是非常惊叹的。在这么短的时间里要做出一个如此成果的模型(demo),再加上这么快速的迭代,本身是只有非常优秀的产品经理才能做出来的。而且插件有limitedbeta、closebeta、自选3个插件等等这些限制,也是发布节奏把控非常好的一种表现。因为肯定还是会有一些问题需要之后更成熟的方案,在这个方案发布后这些限制才能解除。从产品经理的角度看,这些产品发布的节奏把握可以说恰到好处,实际说这些产品发布初期都是很粗糙的,但又刚刚好是demo的东西,能达到初期目标。 Q:ChatGPT的插件未来可能是一个集内容生产,搜索,推荐于一体的「怪胎」,如何看待插件能力的演进? 李志飞:毫无疑问,ChatGPT的插件相比GoogleAssistant,Siri来说,在服务接口,标注数据,训练系统,自然语言等等方面都是具有领先式的先进性。但在自然语言这块我有一个担心,就是说它本身是有歧义的,插件在这块的表现我觉得还有待观察。在我看来ChatGPT插件真正新颖之处在于它有一个非常通用的自然语言处理的机制。 传统搜索引擎只能检索被生产出来的内容,然后推荐也是因为用户之前一些关注和搜索历史来形成推荐。也就是说,从内容制作到内容分发,都是不同的渠道和方式。而ChatGPT本身就是一个生成内容 的平台,然后用户问问题时就可以直接索引ChatGPT生产的内容。而且用得越多,它就会对推荐序列形成一个超级理解,这样ChatGPT变成了一个非常懂用户需求,把内容生产和消费内容合一的平 台。 02 Plugins从理念到落地, 互联网与搜索引擎变革的新可能 Q:GPT插件使得每个人,每个组织的数字化能力都被加强了,它可以帮助人们用自然语言或者相对更简单的方式实现数字化。那么这会不会对未来的流量分发、资源聚集产生一些影响,甚至对现有互联网的格局做出根本性的改变? 王俊煜:我觉得在当前人类社会的商业模式下,有一个因素在这里讨论时是不能被忽视的,那就是品牌。一些时候如果只是需要一些很简单的需求,也就是所谓的whitelabel,放在搜索引擎的维度,就是说搜索引擎或者某个中间层直接帮你决定了答案也没有任何感觉。但其他时候,我们需要品牌的口碑帮我们做出更优的选择,并且可能对某个品牌的信任会让我们的习惯固定下来,用户和品牌之间形成了一个约定的关系。 另外,我觉得OpenAI和它的初心目前来看已经是越来越远了。它不再是最早的一个研究中心,也不 是后来说的ToB架构,现在ChatGPT插件明显是要做ToC公司的。这样大家可能对ChatGPT的行为和动机安全就产生了怀疑。李志飞:对,目前ChatGPT插件是要把主控程序和入口都放在OpenAI这里,而不是说自己作为一 个网站调用ChatGPT的接口,这个肯定是会让很多人警惕的。 Q:用户和平台之间的履约体系我觉得是很难被替代的,但一个中心化入口改变传统互联网格局的可能也是存在的。 Q:我们把大模型放在中国商业中,如果ChatGPT有可能成为一个新形态的个人助理,具备各种的能力帮我们解决问题,那微信是不是一个很好的平台去承载这件事情?ChatGPT的东西,是不是一种小程序的终极状态? 李志飞:微信毫无疑问是最适合来做虚拟个人助理这个东西的。因为它掌握了很多个人信息。但是真正说把这些原始的信息以及背后隐含的抽象的信息都用ChatGPT助理总结出来,变成一个对你近乎知根知底的东西,我觉得很多人还是难以接受这个事情。 王俊煜:我觉得不论从产品还是商业的角度,或者其他我们没有想象到的角度,微信都能做成这个事情,并且可能还有很多潜力和可能。 Q:微信的商业模型,不论是公众号,视频号还是小程序我觉得都和传统互联网的一些东西不太一样。微信更偏向私域流量,也不限流,流量获取全靠个人努力。所以微信的生态思维还是比较开放的。Q:我们已经看到插件的多种可能,但是有一个问题,就是用户体验的临界值会不会也被击穿?ChatGPT插件多大可能能全面提升用户的使用体验? 王俊煜:大家都知道ChatGPT总结的功能非常强大,未来也可能出现类似的插件帮助用户总结朋友圈,视频或者其他东西。虽然说从效率的角度看,工程师和一部分人会大量利用插件将所有的信息尽量整合成类似个人报纸(personalizednewspaper)。但是用户花时间刷视频,刷朋友圈这些行为本身更多是一个过程体验,很多时候用户并不想把信息迅速浏览完,用户不需要每件事情都需要一个AI助理。如果真的需要每件事情都用插件来总结,其实就很像三分钟看完一部电影的体验。三分钟看完和花两个小时看完整部电影我觉得完全是两码事。 而且临界值的问题,我觉得有一个使用工具的阈值。比如说用新方法在70%的情况下都能比旧方法更 简便,但其他30%还是原样。这30%的情况意味着用户在试完新方法后还需要拿旧方法再做一遍,对于一些人来说还是不能接受这个试错成本的。 Q:俊煜提出了一个非常重要的指标,就是说当失败率超过多少之后用户就会放弃使用这项工具。我了解到之前志飞做语音识别的识别率已经能达到95%以上,也没有完全对用户语音产品使用产生预期的变革。那到底靠谱程度要到多少才有可能改变之前的用户使用习惯? 李志飞:我之前做AI语言产品,会发现即使很多功能已经足够智能,但真正到用户使用那一步,还是会出现很多无法预知的状况,人机交互的方式还是处在初始阶段。比如说语音识别的识别率真的能到95%,但实际使用中,最后端到端的语音交互体验最后可能就是60%甚至更低。 Q:所以我觉得对于用户行为没有形成穿透性的改变之前,就是没有真正发生变革。以之前语音产品为借鉴,ChatGPT使用语音功能的话,它的效果衰退也会有这么严重吗? 李志飞:我觉得如果第一天的产品形态像一个语音助手一样,它的体验度可能就是现在文本对话机器 人的50%。语音助手的整个过程按照我自己的经验来看需要8个步骤:降噪,唤醒,语音识别,自然语言理解,对话,搜索,文本生成,文本转语音,这八个步骤中每一步在实际过程都有一定的体验损 耗,整体的成功率会出现严重下滑。这些问题对ChatGPT的语音功能同样存在。 Q:搜索引擎基于大模型的能力到底会怎么变化?它可以不再是一个信息的连接,而是已经能够自身交付解决方式了。如何看待搜索引擎未来的发展可能性? 王俊煜:传统引擎可以用来跳转到一些其它网址,也就是所谓的导向性(navigational)查询。还有一 些不跳转到任何网站就回答一些天气、股票、计算器、翻译之类信息类(informational)的问题,这些问题用GPT来做显然都没有必要。当然一些比较复杂的信息,ChatGPT可能会在推理这方面做得更好一些。微软Bing的multi-stepconversationalsearch(多步对话式搜索)也能够满足一些很复杂的信息检索需求。还有另外一类探索的需求,比如对某一个问题搜索引擎可能会提供很多个解决选 项,这非常让用户崩溃,我到底改选哪一个?我觉得ChatGPT也并没有很擅长做这种事情。 Q:所以能够说大模型的能力用在搜索引擎上,尤其是用在最普遍的搜素需求是有些浪费的吗? 王俊煜:我之前在谷歌的时候,我们的研究团队希望帮助用户构建解决难以构建查询关键词的问题。后来貌似很多方案都是把这些关键词粘到一块,但我总觉得这不是一个最终最佳的方案。 Q:如何看待NewBing? 李志飞:目前搜索引擎有三个步骤:输入、过程、输出。最开始输入的时候用户用的是自然语言,后来逐渐大多数人习惯于用关键词。如果一些搜索需求都是导向性的(navigational),那确实没有多大意义用大模型。 我现在用NewBing主要是问一些思考类的,没有确定性答案的问题。有一次我对GPT的强化学习、环境这些概念没有十分理解,我用谷歌这些搜索引擎去搜索并没有找到答案,而NewBing非常准确地给了我每一个概念的解释。也就是说它像一个人一样可以总结一个答案出来,有时候也会挑战我,我们之间会展开多个回合的拉扯,这样就和搜索引擎是完全不一样的体验。 Q:其实也和未来人们的搜索需求息息相关,到底是信息类诉求(informational),还是导向性 (navigational),或者事务性的(transactional),三个不同的搜索诉求可能会在未来形