您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:对话智谱 AI CEO 张鹏:AI Agent 是重要新风向,大模型竞 争已步入混战后期 - 发现报告
当前位置:首页/会议纪要/报告详情/

对话智谱 AI CEO 张鹏:AI Agent 是重要新风向,大模型竞 争已步入混战后期

2023-11-09-未知机构L***
对话智谱 AI CEO 张鹏:AI Agent 是重要新风向,大模型竞
争已步入混战后期

对话智谱 AI CEO 张鹏:AI Agent 是重要新风向,大模型竞争已步入混战后期作为首批网信办批准向公众提供大模型产品服务的公司之一,在近期完成 B-4 轮 融资后,智谱 AI 已 经累计获得超 25 亿元融资,成为 AI 赛道备受瞩目的独角兽。如今,智谱 AI 的团队有 400 余人,其 中七成是研发人员,同时,核心团队还新增了「智谱首席生态官」刘江——这位前智源研究院副院 长,同时也是光年之外曾经的核心成员。10 月 27 日,智谱 AI 在 2023 中国计算机大会(CNCC)上发布了新一代的瞄准 GPT-4V 的中英双语 对话模型 ChatGLM3 、国内首个具备代码交互能力的大模型产品「智谱清言」,并在其 MaaS 平台「智谱 AI 开放平台」推出了新的商用部署方案:ChatGLM-turbo 版本,其 API 价格相较于直接部署 ChatGLM 降低了 50%。对话智谱 AI CEO 张鹏:AI Agent 是重要新风向,大模型竞争已步入混战后期作为首批网信办批准向公众提供大模型产品服务的公司之一,在近期完成 B-4 轮 融资后,智谱 AI 已 经累计获得超 25 亿元融资,成为 AI 赛道备受瞩目的独角兽。如今,智谱 AI 的团队有 400 余人,其 中七成是研发人员,同时,核心团队还新增了「智谱首席生态官」刘江——这位前智源研究院副院 长,同时也是光年之外曾经的核心成员。10 月 27 日,智谱 AI 在 2023 中国计算机大会(CNCC)上发布了新一代的瞄准 GPT-4V 的中英双语 对话模型 ChatGLM3 、国内首个具备代码交互能力的大模型产品「智谱清言」,并在其 MaaS 平台「智谱 AI 开放平台」推出了新的商用部署方案:ChatGLM-turbo 版本,其 API 价格相较于直接部署 ChatGLM 降低了 50%。考虑到 OpenAI 在技术上的领先性,智谱 AI 在产品研发上还是与其有相似之处。此次 ChatGLM 3 系 列模型发布后,智谱 AI 更是成为了目前国内唯一一个有对标 OpenAI 全模型产品线的公司。在新模型发布后,谈到与 ChatGLM2 相比,智谱 AI 此次瞄准 GPT-4V 推出的 ChatGLM 3性能更加 强大,接入了具有多模态理解能力的模型 CogVLM、代码增强模块 Code Interpreter、网络搜索增强 模型 WebGLM,并增强了语义理解和逻辑理解能力,实现了若干功能的迭代升级。01AI Agent 新风向Q: 这次发布的新模型在性能表现上主要有哪些提升?张鹏:10 月 28 日发布的内容其实之前已经分批次放出来了,只是没有特别正式地向外界表示。提升 的话,最关键的是整体上的性能提升。因为我们每一代模型相比上一代都会有一个阶梯式的性能提 升,提升程度的话,最低也会有 Benchmark 上百分之十几的提升。按规律来说,这种上升曲线是会 趋平的,因为越往后提升会越小。但我们三代相对于二代的提升,比二代相对于一代的提升其实更大,这个是挺难做到的一件事情。这 一点上我们也确实花了很多时间和精力,效果也非常的不错。然后性能的提升其实也涉及到工程的效 率问题,这个就跟商业化有关系了。真正商业化的时候无非就考虑几件事,第一个是成本,第二个是收益,价格和成本之间就是利润空 间,所以控制成本也非常的关键,这个是可以帮助你去扩大利润空间的一个很重要的因素。所以说,推理效率提升了,我们成本也会降低,用户体验感也会更好。这次我们还把智能体的能力提升也融合到了新一代技术里面。智能体它是基于底座的能力和一些特定 的能力,去让模型能够帮助人去解决更复杂的需求和更复杂的问题的一项技术,它的能力是比较面向 应用的。就像一个人一样,如果他只会回答问题,就算他的知识再多,他的回答问题再完整、再精确,他也只 是一个问答机器。如果它不能做,不能利用别的东西,去完成一件复杂任务,那么它的能力始终有限,所以在这一点上来说,我们也自研了一些技术,包括怎么让一个模型的智能体的能力大幅度提 升。Q: 围绕 AI Agent(智能体)的这种新风向,后续还会产生一些什么新的行业机会?张鹏:AI Agent(智能体)的应用非常有空间和前景。原来模型的能力大多数都是对标 ChatGPT 那 种对话式的,它不能做一些复杂的事情,只能回答问题,如何扩展它的能力?之前想过很多招,比如 说 Plug-in platform 其实就是在扩展模型的能力,让它能够和现有的这些外界的系统去对齐,能够去 很自然、自动地去对接。那么 AI Agent 的这个能力其实是把这些东西都融合到一起,从模型层面来实 现复杂任务的拆解,像人一样进行规划。比如我有 plan A、plan B、plan C,plan A 我要分为 step one,step two,step three,一步一步 的去执行。step one,我可能要去 call一个外面系统的数据库,step two,可能我要去做数学的一个 计算,step three,可能我们需要去把这个计算的结果用一个自然语言去 wrap 一下,形成一个输出,或者是形成一个表格,它是会有这样的一些能力,来解决这些问题。Q: 那怎么看待 AI Agent 的未来?张鹏: AI Agent 很重要。未来大模型能不能在实际应用当中产生更大的价值,或者说把它变成一个理 想中的所谓的「大脑」的角色,而不是停留在 Q/A bot、Chat bot 的角色,很大程度上要看 AI Agent 的发展如何。 Q: 距离它真的落地到实现你刚刚说的那种功能,大概需要多久的时间周期?张鹏:会是一个加速的过程。因为 AI Agent 这个能力,从学术研究提出到现在大家可以体验的过程是 非常快速的,我相信后面真正到实际应用当中的过程会更快,因为现在你看它已经能做到一些事情 了,虽然可能还有些瑕疵,有一些没有不完美的地方,但我觉得随着这个研究的深入,最终会加速实 现更广泛和深入的应用。02共性问题在于认知的参差Q: 智谱这次发布的新模型,是更注重行业的能力,还是说通用的一些能力?张鹏:还是会 focus 在通用能力上。我们刚才说的所有这些能力都是通用型的。比如跨模态能力,我 们没有指定说我去读医疗图像还是读取什么图像,我们从来没有这样定义过这件事,它是个通用型的 能力。Q: 后续商业化的规划是怎么样的?张鹏:基座的这个能力真正到商业应用里面去,或者说行业应用里面去,它中间还是会有一定的 gap,虽然这个 gap 在不断的变小,但还是存在的。那么这个 gap 怎么去弥合,要不就是模型能力不 断的往上涨,去接上它的这个需求,要么是中间加上一些产品、系统、解决方案等这样层次的一些工 作去弥补中间的 gap。Q: 在大模型领域做 B 端市场,给企业用户做定制,会不会可能就是陷入到和上一波 AI 四小龙一样的 处境里?张鹏:我们肯定不想这样,过去已经证明了,就是说对于 AI 技术公司来讲,这样做是行不通的,当然 也还有一些其他的因素在里头就不展开了。我们现在在做的事情是做好我们的底座、基座和赋能基础能力。然后行业的这些应用,我们交给我们 的生态,交给我们的合作伙伴,甚至我们可以交给客户,如果客户自己的技术能力如果够强,我可以 交给你,你自己去建。Q: 如果从行业的角度看的话,国内这波大模型创业公司,在商业化上有没有一些共性的问题?智谱 AI 这边会去怎么样去规避这些可能的挑战?张鹏:是有一个比较抽象的共性问题,是大家对 AI 助手技术的认知参差不齐。首先,大家对它的能力 上限和下限的认知,很难完全达成一致,需要一个磨合过程。如果对能力有过高预期,在交付使用过 程中就会碰到许多困难;如果预期过低,则会觉得 AI 助手没什么用处。这些可能都会让人很难真的去 接受这项新技术。所以,认知预期不一致是比较普遍的问题,这个就需要通过磨合达成共识。基于这样一些很新的技术,我们想要打造的生态,需要大家在整个大的生态版图里面互相去磨合的。那么,哪些是面向客户做解决方案的?他们是要怎么样去引入这个技术,还是他们自己原创去做这个 技术,自己去摸索这个技术?还是说他们要基于我们这个能力去做这个应用解决方案?其实大家的想 法是千奇百怪的,差异很大的,这个也是一个很实际的问题。所以我们在外头跟大家聊的时候,或者说做这种演讲的时候,都会强调这件事情,我们希望的是一个 生态的打法,前面提的比如说行业性的行业模型、垂直模型或者是行业性的应用的空间我们是留给我 们的生态合作伙伴,我们一起来把这个空间扩大。通过这种方式把客户价值的天花板持续往上抬,这是我们想要做的事。而不是说这个饼就这么大,大 家在里面挤来挤去,你抢我一口,我抢你一口,这个事情永远做不大,而且大家都会很累,所以说不 要内卷,要反向外扩,这样大家就会舒适一些,这是个很自然的想法,当然要做到这件事情还有很多 困难,比如首先达成共识就很困难。Q: 各家还是想要凸显自己。张鹏: 当然大家最终都会找到自己在这个版图当中的生态位。在这之前,他会担心被别人挤掉或者被 别人侵占掉,这是很自然的一个现象,所以他会有些选择,总觉得好像得把所有东西都把握在自己手 里,但是真正能不能把握得住,也许他就是得去拿脑袋往前拱一拱试试看前面是堵墙还是个什么东 西,就是得试试看,这也是很正常的心态。只是我们希望,尽量跟大家以一种开放的心态,去沟通和交流,去建立一些共识,尽量磨合的过程不 要损耗太大。Q: 那你们是怎么去让这个磨合变得更顺畅一些的?张鹏:主要是沟通。第一个是通过面对面的交流或者通过演讲、媒体来输出一些观点、想法和态度,让大家对我们的理念和做法有更多认识。第二个是通过一些已有的圈层,或者是社区,比如说开源,我们把我们的技术开源出去,把我们的一些经验,一些技术上的积累,一些资料分享给大家。这样大家也会更深入的去理解这件事情它背后的价值、难度、成本等一系列的事情,然后根据这些他 们自己会做一个判断,自己能做到什么些事情,又很难做到些什么事情。还有一个是跟合作伙伴建立 生态合作机制,可以针对性地结合他们所处的行业和能力需求去做一些技术培训、联合创新这样的工 作,来让合作更加顺畅。Q: 那在竞争上,大模型创业公司如何在商业化方面与巨头竞争?怎么看待数据、场景、交互等因素的 关键程度?张鹏: 大公司肯定有大公司的优势,比如它的资源、市场的积累,这些方面其实大公司的优势比较明 显。那么创业公司的优点就是它比较灵活,可以快速变化,好掉头,还有一点就是比较专注,可以把 所有的资源和精力全投注过去。03开源闭源并不矛盾智谱 AI 模型开源时间线 Q: 刚刚也提到了开源,之前我们采访月之暗面 CEO 杨之麟的时候,他就说可能在未来,超级应用一 定会诞生在闭源,因为就是它能够更加深入的去开发。关于这个你怎么看?张鹏:开源和闭源的关系,至少我个人来看,从来不觉得是一个完全对立的事情。开源是一个可以保持行业或者技术领域活跃性的一件事,可以保持生态圈的多样性、活跃性。因为开 源社区的参与者都比较活跃和投入,都是相对愿意去做贡献的一群人,他们的讨论,他们的交流,还 有对开源项目的代码贡献,经验贡献,其实也有帮忙推动技术探索,提出更多的选择和可能性,也就 是我们也会从开源中可以获得很多反馈和营养。闭源的话更考虑商业价值的稳定性、服务的持续性和安全性,因为企业有一定的主体责任,也有商业 回报的诉求,这个是对等存在的。总之就是,开源会保证生态,然后闭源会保证商业服务的价值,两者之间其实并不矛盾。Q: 超级应用还是会产生在闭源项目里。张鹏:当然很难想象一个超级应用是直接建立在一个开源项目上,它可能还是要走商业版本去做,因 为它涉及到的事情很多,而不是说开源一个项目,或者说扔出来一个产品就可以,如果没有后续的运 营维护等等这一系列的服务,怎么可能做得成超级应用?当然超级应用并不是未来的唯一解。超级应用当然是大家都想做的事情,这个毫无疑问。谁不想做这 样一个东西?但具体这个超级应用是啥,现在也没人能说的清楚。Q: 除了超级应用,还有一些