您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[德邦证券]:计算机行业周报:Kimi访问量持续走高,爆款应用照亮C端落地场景 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业周报:Kimi访问量持续走高,爆款应用照亮C端落地场景

信息技术2024-03-16钱劲宇德邦证券李***
AI智能总结
查看更多
计算机行业周报:Kimi访问量持续走高,爆款应用照亮C端落地场景

本周AI新闻速递。 海外AI:1)Pika推出AI配音工具Sound Effects;2)马斯克宣布本周开源AI聊天机器人Grok;3)Cohere推出350亿参数可扩展生成模型;4)谷歌新研究“窃取”OpenAI模型关键信息;5)全球首个AI软件工程师发布;6)AI需求点燃云势头,甲骨文股价飙至历史新高;7)多家日企用生成式AI开发新车;8)OpenAI模型驱动人形机器人自主对话;9)Sora将于年内推出,拟增加语音功能; 10)Claude 3 Haiku正式上线。 国内AI:1)联想控股与智谱AI在AI PC等领域达成合作;2)中科院香港创新院发布医疗健康AI大模型;3)图蝇AI生图软件半年收获60多笔海外订单;4)天图万境发布视频生音频通用工具Sora Opera;5)智谱AI获北京市AI产业投资基金参投融资;6)零一万物API上线,支持输入30万汉字。 本周AI应用点评。 C端超级应用Kimi:近期访问量加速增长,照亮C端落地场景。团队履历亮眼,公司估值25亿美金。打通底层模型到上层应用,剑指C端超级应用。 本周AI应用流量情况更新。 根据SimilarWeb数据,海外AI图片生成领域,leonardo为当前每月访问量第一,Midjourney紧随其后成为排名第二的图片生成工具。海外AI视频生成领域,Runway仍然遥遥领先为当前流量第一,heygen跃居第二。国内AI大模型应用领域,文心一言仍为当前流量第一,去年10月发布的Kimi智能助手2月份流量增长104.99%,目前位居第三位。 风险提示:AI技术落地不及预期、市场需求不及预期、全球供应链风险加剧 1.本周AI新闻速递 1.1.海外AI (1)Pika推出AI配音工具Sound Effects。知名生成式AI创企Pika在社交平台X上宣布推出AI配音工具Sound Effects,支持在Pika上为视频生成配套的音效。目前,Pika提供两种生成视频音效的方式,用户可以描述期望的声音让AI生成相应的音效,或是让Pika直接根据视频内容匹配相应的音效。据Pika官方消息,目前该功能仅对超级合作者和Pro用户开放测试,很快向所有用户推出。 (2)马斯克宣布本周开源AI聊天机器人Grok。本周马斯克在社交平台X上发帖,宣布xAI本周将开源AI聊天机器人Grok。 (3)Cohere推出350亿参数可扩展生成模型。Cohere在官网宣布推出可扩展的生成模型Command-R, 一个针对大规模生产工作负载的新模型 。 Command-R拥有以下几大特征:RAG(检索增强生成)和工具使用的高度准确性,低延迟、高吞吐量,更长的128k上下文和更低的价格,跨10种主要语言的强大功能,以及在HuggingFace上提供用于研究和评估的模型权重。据Cohere公布的测试,Command-R在可扩展的生成模型类别中优于Mixtral、Llama 2-7B、GPT-3.5-turbo等其他模型。 (4)谷歌新研究“窃取”OpenAI模型关键信息。根据arXiv,谷歌于3月11日推出了首个模型窃取攻击程序,该程序从OpenAI的ChatGPT或谷歌的PaLM-2等黑盒生产语言模型中提取精确的、重要的信息。具体来说,在给定典型的API访问的情况下,研究人员的攻击恢复了Transformer模型的嵌入投影层。 其攻击运行花费不到20美元,提取了OpenAI的Ada和Babbage语言模型的整个投影矩阵。由此,团队首次确认这些黑盒模型的隐藏维度分别为1024和2048。 团队还恢复了GPT-3.5-turbo模型的精确隐藏维度大小,并估计恢复整个投影矩阵的查询成本低于2000美元。(论文地址:https://arxiv.org/pdf/2403.06634) (5)全球首个AI软件工程师发布。由华人团队创办的Cognition AI本周宣布推出世界上首个全自主AI软件工程师Devin。随着其在长期推理和规划方面的进步,Devin可计划和执行需要数千个决策的复杂工程任务,能够在每一步中回忆起相关的上下文,随时间推移学习并修正错误。Cognition AI团队共10人,其中8位是华人,已获得由Founders Fund领投的2100万美元A轮融资。 (6)AI需求点燃云势头,甲骨文股价飙至历史新高。据路透社报道,数据库巨头甲骨文周二股价飙升超过13%,创下历史新高。路透社同时表示有迹象表明,因与AI芯片巨头英伟达合作,甲骨文在抢占云计算市场份额的计划中取得了进展。甲骨文还预告了将与英伟达在下周举行的GTC大会上有新发布。甲骨文将自己定位为低成本云提供商,并在英伟达芯片上花费了数十亿美元,以期与行业巨头竞争。这些努力加上与云计算客户合作使用英伟达超级计算机,帮助甲骨文第三季度的云计算收入增长了25%、剩余销售积压增长了29%。 (7)多家日企用生成式AI开发新车。据日经新闻3月12日报道,丰田、本田、斯巴鲁、马自达等日本汽车厂商纷纷在开发新款车型时使用生成式AI。AI可通过导出零部件的组合等来提高工作效率,有望使策划和设计所需时间减半。 (8)OpenAI模型驱动人形机器人自主对话。人形机器人独角兽Figure发布了机器人Figure 01的最新进展视频。在OpenAI大模型的驱动下,它能自主与人对话、理解意图并执行决策。据Figure的AI技术负责人称,视频中的行为都是机器人自己学习并完成的,没有任何人为操控,而且视频是标准的“1倍速”。 Figure创始人称,OpenAI提供了视觉推理和语言理解能力,而Figure的神经网络则负责实现快速、灵敏的机器人动作。 (9)Sora将于年内推出,拟增加语音功能。据《华尔街日报》报道,OpenAI CTO米拉·穆拉蒂(Mira Murati)在采访中表示,文生视频工具Sora将在今年内发布,未来计划增加语音功能。她称,时长20秒、分辨率720P的视频仅需几分钟就能生成。 (10)Claude 3 Haiku正式上线。本周AI大模型创企Anthropic发布了Claude 3 Haiku,这是同系列中速度最快且最实惠的型号,该模型现已与Sonnet和Opus一起在Claude API和claude.ai上为Claude Pro订阅者提供。 图1:Claude 3 Haiku相关参数 1.2.国内AI (1)联想控股与智谱AI在AI PC等领域达成合作。根据联想控股微空间公众号,3月8日,联想控股股份有限公司与北京智谱华章科技有限公司签署战略合作协议,双方将在生成式AI软硬件及智能化解决方案等领域开展合作。根据战略合作协议,联想控股与智谱AI将基于在各自领域积累的商业经验、竞争优势,在包括AI-PC业务、AI服务器等硬件、自有通用大模型及智能化解决方案等领域,持续开展产品/服务的研发和优化升级,并在智能制造、金融科技、数字化营销和生物科技等相关领域开展垂直类大模型的研发合作。 (2)中科院香港创新院发布医疗健康AI大模型。中新社香港3月11日电,中国科学院香港创新研究院人工智能与机器人创新中心(简称“中国科学院香港创新院AI中心”)11日在港发布医疗领域AI多模态大模型CARES Copilot1.0。 CARES Copilot系统由中国科学院香港创新院AI中心研发,可有效支持包括手术阶段识别和器械检测与计数等功能,已在多家医院的不同科室进行了实地内部测试和持续优化。香港中文大学外科学系神经外科组主任陈达明与北京协和医院神经外科主任医师冯铭现场演示了CARES Copilot1.0系统。冯铭表示,手术大模型和手术导航结合起来,可以为患者提供实时的解剖定位信息,提高手术安全性。 (3)图蝇AI生图软件半年收获60多笔海外订单。据优刻得公众号发文,图蝇AI已创作出超300余幅成熟的设计作品,并在短短半年内收获了60多笔海外订单,实现了从人工驱动到AI驱动。借助图蝇AI创作平台的文生图、图生图等功能,设计师能够快速将创意落地,设计周期从2周进化到2-3天,设计效率提升5倍以上,同时客户的花型图案选中率也从10%上升到30%。2023年,图蝇AI与优刻得建立了紧密的合作关系,将过去在本地环境内运行的AI绘画平台整体迁移至云端。 (4)天图万境发布视频生音频通用工具Sora Opera。据视智未来报道,由国内天图万境团队开发、与华为云合作部署的“视频生音频”通用工具Sora Opera将在3月内上线并向公众开放,用于给文生视频的静音画面添加音效或背景音乐。 产品首先在华为云平台上发布,随后还将推出可在本机运行的开源版本。云端视频配音功能免费,但限于算力成本,云端版本会先提供给其合作伙伴使用。(Sora Opera项目体验网址:http://soraopera.skymaper.com) (5)智谱AI获北京市AI产业投资基金参投融资。据腾讯科技报道,大模型创企智谱AI已于今年初完成新一轮融资,北京市AI产业投资基金参与投资,这也是该基金成立以来投资的第一家大模型公司。智谱AI未透露投资金额。 (6)零一万物API上线,支持输入30万汉字。大模型创企零一万物发布了Yi大模型API(应用程序接口)开放平台。据公司官微,此次API开放平台提供以下模型:Yi-34B-Chat-0205,支持通用聊天、问答、对话、写作、翻译等功能; Yi-34B-Chat-200K,支持200K上下文,多文档阅读理解、超长知识库构建; Yi-VL-Plus多模态模型,支持文本、视觉多模态输入,中文图表体验超过GPT-4V。 (API开放平台链接:https://platform.lingyiwanwu.com) 图2:零一万物大模型开放平台参数 2.本周AI应用点评 2.1.C端超级应用Kimi 近期访问量加速增长,照亮C端落地场景。根据SimilarWeb数据统计显示,近期Kimi智能助手访问量快速增长,2月份进一步拉近与国内头部大模型访问量差距。 团队履历亮眼,公司估值25亿美金。据36氪消息,月之暗面(Moonshot AI)成立于2023年3月,是国内大模型领域的关键玩家。其核心团队曾参与到Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发中,目前月之暗面团队人数已超80人。公司近期已完成新一轮超10亿美金融资,本轮融资后公司估值已达约25亿美金,为国内大模型领域的头部企业之一。 打通底层模型到上层应用,剑指C端超级应用。据36氪消息,月之暗面自2023年成立以来,在不到一年的时间里,完成了从通用大模型到上层应用的布局。 在大模型层,月之暗面已训练了千亿级别的自研通用大模型。而在应用层,2023年10月,月之暗面正式推出首个面向C端的产品“Kimi智能助手”,这是月之暗面做To C超级应用的第一次尝试。Kimi Chat支持输入20万汉字,公司在长文本技术的探索突破到了一个新高度——对比当前市面上几家主流模型,Kimi Chat的上下文长度是Claude 100k的2.5倍(实测约8万字),GPT-4-32k的8倍(实测约2.5万字)。而据36氪消息,月之暗面当前也已经在秘密研发通用多模态模型,预计今年内将推出。 图3:Kimi访问量加速增长 3.本周AI应用流量情况更新 根据SimilarWeb数据,海外AI图片生成领域,leonardo为当前每月访问量第一,Midjourney紧随其后成为排名第二的图片生成工具。 图4:海外AI图片生成类应用流量情况(数据范围为:2024.1-2024.2) 根据SimilarWeb数据,海外AI视频生成领域,Runway仍然遥遥领先为当前流量第一,heygen跃居第二。 图5:海外AI视频生成类应用流量情况(数据范围为:2024.1-2024.2) 根据SimilarWeb数据,国内AI大模型应用领域,文心一言仍为当前流量第一,去年10月发布的Kimi智能助手2月份流量增长104.99%,目