硅谷巨头押注B端AI应用多模态生成技术加速落地 2023世界人工智能大会(WAIC2023)即将在上海开幕,百度文心、阿里通义 、华为盘古、讯飞星火等30余个大模型悉数登场,背后的核心开发团队将带来大模型路径的相关探讨。 在国内人工智能产业蓬勃发展之际,作为本轮AI浪潮的发源地,OpenAI所在的硅谷目前各家科技龙头最新的技术、模式、应用究竟发展如何?资金涌入,未来一段时间内是否有高确定性的赛道? 天风全球前瞻产业研究院联席院长、天风传媒&海外首席孔蓉今年6月赴美国硅谷与一批AI代表公司及从业者交流。“相比国内企业关注AI在C端的应用,硅谷企业已密集主攻B端产业,发展深度和速度都更快。”孔蓉接受证券时报e公司专访时表示,预计今年国内企业大模型将达到GPT3.5的技术水平。 主攻B端AI应用 以ChatGPT为代表的AI大模型今年以来无疑成为全球焦点,随着用户对对话使用的增加,大家对AI应用的兴趣越来越大。Bing将ChatGPT融入Office以提高工作效率。MidJourney开启AI全球图片创作热潮后,Bing也发布了自己的AI画图应用。 面对新一轮AI浪潮,投资者应该如何看待AI发展带来的市场机会和发展前景?孔蓉今年6月赴美国硅谷与一批AI代表公司及从业者交流。 孔蓉在OpenAI所在的硅谷调研时发现,ChatGPT能成为全球用户数增长最快的产品,这主要系对话型应用使用几乎没有学习成本和门槛、ChatGPT与全行业的联系和结合都相对流畅。“ChatGPT与抖音、Meta等主流产品一样都代表着下一个时代的来临,而其增速或许象征着以ChatGPT为代表的AIGC将以超出想象的速度打破固有的商业模式和渗透进全行业。” “相比国内企业更关注AI在C端的应用,硅谷企业已密集主攻B端产业。”孔蓉表示,硅谷调研中最大的感受是,美国市场上AI在B端的生产力工具小应用很多,只需几个人就依托大模型研发一个新应用,几乎每几天就有新产品新应用在企业实际场景中试用。 除了聚焦B端外,走访的美国科技公司对AI都有高度认识,普遍认为本次AI革命是人类产业革命的一个拐点。“类似当年云计算产业的爆发引发美国科技公司的发展浪潮,这次AI革命也将带来全球科技公司的提速发展。”从应用模式上,孔蓉发现目前美国科技企业的大量应用已加入AI功能,下一步AI大模型将会把软件重写一遍,改造工作流程,实现效率全面提升。 国内大模型追赶速度很快 值得注意的是,国内大模型产业正处于爆发期,发展速度很快,但也出现了同质化倾向。相比美国,目前国内大模型追赶全球领先水平的进度如何? 孔蓉表示,按照国内目前的发展速度,预计今年国内大模型可以达到GPT3.5的技术水平。而基于海外开源大模型的技术,会有一批国内企业可以达到这一水平。“但后面更着急的是应用落地,毕竟大模型做出来,还是要落地实地用起 来。”孔蓉表示。 作为国内AI领域活跃企业之一,三六零集团创始人周鸿祎参加2023全球数字经济大会“人工智能高峰论坛”时就表示,大模型将成为每个数字化系统的标配 ,手机、汽车均可部署,将无处不在。 究竟国内科技企业谁将在新一轮AI革命中领跑,目前仍难以判断。如果企业原有的产品能够有流量,能和现有的场景和AI技术结合,可能会产生更大的用户的粘性。孔蓉表示,“无论是字节跳动也好,腾讯也好,他们可能是有流量优势、场景优势,在未来的挑战之下,还需要看它们能够找到什么样的突破口,能不能够有突破的方式实现超越。” 硬件方面,AI对算力的需求没有天花板。“随着海内外科技企业对AI多模态生成能力的追求,对算力的需求只会有增无减,而且将会日益紧缺。”孔蓉指出 ,算力需求可能是持续增长的。 算力的紧俏也导致另一现象。据网站流量监测服务商Similarweb的数据显示,今年以来,ChatGPT访问量1月份的环比增长率为131.6%,此后逐月下降。5月时,这个数字已经跌至2.8%,预计6月将会出现环比负增长的情况。 孔蓉表示,访问量下滑可能是多方面原因,包括算力、其他新的AI应用层出不穷及API分流,但AI发展趋势依然很强劲。“算力紧张下,ChatGPT一直在限制用户数及限制注册。同时如果只是一个生产力工具,ChatGPT的使用时长和用户黏性肯定是不足的,所以一直以来ChatGPT都在增加产品移动性和应用丰富度,包括推出应用商店,增加插件等。” 聚焦多模态内容生成 目前国内在大模型研发上进入白热化阶段。2023全球数字经济大会人工智能高峰论坛上透露,国内迄今已有80余个大模型公开发布。 对此,孔蓉在硅谷调研发现,相比国内企业争相上大模型,美国科技企业已经研发进入AI应用为主。在美国企业中,AI应用已相当普遍,写邮件,发布招聘广告、写文章、数据分析都在使用AI。 从生成式AI内容观察,孔蓉认为,自6月底Unity官宣两款新AI平台,加速游戏 、AR/VR、元宇宙、数字孪生等实时3D应用程序和体验的创建后,生成式AI从文字图片向多模态发现,已经成为美国科技企业发展的新趋势。 “多模态是指AI除生成文字图片外,还可以生成视频音频以及各种不同场景。目前多模态能力还不算很成熟,但今年到明年,AI生成视频和3D动画,将会成为美国科技公司的主攻方向,这对影视,游戏行业的生态将发生重大变革。” 结合在硅谷的调研,孔蓉认为以ChatGPT为代表的AI应用应该关注的场景包括机器人、自动驾驶、XR与AI的结合,从而推动这些行业的加速迭代。 今年5月,特斯拉Optimus再次进化,叠加近期国内机器人政策升温,在AI加持下机器人行业正在进入跨越式发展。另外在XR领域下AI也有重要场景。“XR的两大核心是内容和交互。引入AI后,通过理解你的操作,交互可以更自然 ;内容上AI的能力更是已经获得印证。”孔蓉表示。 “未来十年将是科技创新非常重要的十年,是新一轮的科技周期的启动,所以我一直比较看好TMT和接下来的机会。”孔蓉认为,AI推动下,未来十年包括XR、机器人、自动驾驶、影视内容等行业都会进入爆发式变革时代。