您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:人工智能周报(24年第36周):多款AI独立APP上线,腾讯发布新一代大模型“混元Turbo” - 发现报告
当前位置:首页/行业研究/报告详情/

人工智能周报(24年第36周):多款AI独立APP上线,腾讯发布新一代大模型“混元Turbo”

信息技术2024-09-13国信证券土***
人工智能周报(24年第36周):多款AI独立APP上线,腾讯发布新一代大模型“混元Turbo”

人工智能动态:1)产品应用:通义网页版上线“PPT创作”功能;阿里云通义千问Qwen2-VL第二代视觉语言模型开源;支付宝将发布AI独立App支小宝;字节打造“AI全家桶”:教育App河马爱学更名“豆包爱学”; 蚂蚁集团AI金融管家“蚂小财”全新亮相,月活用户数达7000万;谷歌打磨GeminiAI技能:扩充支持文件类型、提高文档洞察力;谷歌将重新开放Gemini生成人物图像功能;亚马逊将于10月发布AlexaAI订阅版; 英伟达推出NIMAgentBlueprints服务,加速企业创建AI应用。 2)底层技术:腾讯发布新一代大模型“混元Turbo”:推理效率提升100%,成本降低50%;阿里通义千问推出Qwen2-VL:开源2B/7B参数AI大模型;谷歌发布3款Gemini实验AI模型;谷歌DeepMind展示GenRM技术:微调LLMs作为奖励模型,提升生成式AI推理能力;Meta公布Llama AI模型家族下载量数据;OpenAI今年启动GPTNext计划:AI性能百倍级跃升,Orion有望接棒GPT-4。 3)行业政策:首个具法律约束力的AI国际条约签署在即。美国、欧盟和英国预计将在9月5日签署首个具有法律约束力的人工智能国际条约。 投资建议:如我们一季报总结所展望,上半年港股互联网各龙头公司已表现出微观基本面筑底回升的特征,在宏观承压的背景下,互联网企业通过聚焦优势业务发展和调整组织架构提效,整体中报利润释放优于其他板块。典型案例包括腾讯中报收入增速虽在个位数增长,但过去两年公司通过聚焦高毛利业务发展(视频号广告等),利润端保持在双位数增长。此外,美团也是本次中报季表现非常亮眼的公司,年初以来公司通过整合到店到家两大事业群,有效实现资源和流量的互补,带动外卖和到店业务的盈利能力提升,同时后续有望通过神会员等策略,持续拉动核心本地业务增长。我们认为互联网板块处于长期企业经营效率回升的起点,互联网龙头企业的经营可持续性将推动板块开启长期基本面修复行情。此外,各家互联网公司今年以来陆续推出大额回购计划,整个上半年腾讯、美团、阿里的回购金额换算分别为476亿/139亿/767亿元人民币。目前港股互联网公司多数交易在24年经调整净利润15-20x水平,相比较美股纳斯达克科技巨头多数交易在24年PE25-30x,整体估值较低,投资价值凸显。我们当前推荐优先配置竞争格局清晰的港股互联网龙头腾讯、美团,和边际竞争格局改善的阿里。 风险提示:政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行风险,游戏公司新产品不能如期上线风险等。 AI相关网站流量数据 图1:AI相关网站周访问量(百万) 图2:第一梯队AI相关网站周访问量变动(百万) 图3:第二梯队AI相关网站周访问量变动(百万) 图4:第三梯队AI相关网站周访问量变动(百万) 图5:新增聊天、教育类AI相关网站周访问量变动(百万) 多款AI独立APP上线,腾讯发布新一代大模型“混元Turbo” (一)产品应用 通义网页版上线“PPT创作”功能。通义网页版新推出的“PPT创作”功能,基于通义大模型研发,用户可免费体验。只需一句话或文档输入,工具便能自动生成大纲及详细内容,还支持文生图及图片素材库搜索匹配,满足工作汇报、学术演讲等多种场景需求。同时,“通义听悟”升级为“实时记录”,“通义智文”变为“阅读助手”,三者共同构成“通义效率”,旨在提升用户办公效率。 阿里云通义千问Qwen2-VL第二代视觉语言模型开源。阿里云宣布开源第二代视觉语言模型Qwen2-VL,包含2B、7B及量化版本,并上线72B模型的API。Qwen2-VL性能提升,能处理任意分辨率图片,理解长视频和多语言文本,具备视觉智能体能力。架构升级包括原生动态分辨率支持和多模态旋转位置嵌入方法,增强多模态处理。开源代码已集成至多个平台,方便开发者使用。 支付宝将发布AI独立App支小宝。蚂蚁集团在2024Inclusion・外滩大会上宣布,支付宝将推出AI独立App“支小宝”,这是国内首个服务型AI原生应用,可快速订票、点餐等。蚂蚁集团基于蚂蚁百灵大模型打造,旨在提供智能化生活服务。此次大会在上海黄浦世博园区举行,主题为“科技・创造可持续未来”,聚焦AI产业新实践、科技人文新思考和金融科技新探索。 字节打造“AI全家桶”:教育App河马爱学更名“豆包爱学”。字节跳动旗下的AI教育App“河马爱学”已更名为“豆包爱学”,成为豆包品牌下的首款教育产品。此次更名是大力教育ZERO团队并入豆包团队后的结果,旨在进一步整合资源,推动AI教育的发展。豆包爱学基于字节跳动发布的“豆包大模型”研发,标志着字节跳动在AI教育领域的布局再进一步。 蚂蚁集团AI金融管家“蚂小财”全新亮相,月活用户数达7000万。蚂蚁集团AI金融管家“蚂小财”新版已全面上线,其基于自研大模型,能实时解读热点并提供个性化服务。新版还支持图文版财报解读,让复杂信息通俗易懂。此外,“蚂小财”Pro版已在蚂蚁财富App开启灰测,提供全程语控服务。截至2024年8月底,其月度活跃用户数已达7000万,其中45%来自三线及以下城市。 图6:蚂小财页面展示 OpenAIChatGPT被曝将新增8种新语音:更自然表达狗叫等动物声音。据科技媒体testingcatalog报道,OpenAI的ChatGPT应用将通过逆向工程新增8种独特代号的新语音,旨在提升朗读的自然性和表现力。这些新语音能更逼真地模拟动物叫声等非语言声音,并在朗读加粗或斜体文字时传达特定情绪。尽管这些新语音属于TTS(文本到语音)范畴,可能与当前alpha阶段的高级语音模式无直接关联,但它们无疑将为ChatGPT用户带来更加丰富的语音体验。 谷歌打磨Gemini AI技能:扩充支持文件类型、提高文档洞察力。谷歌近日宣布其GeminiAI技能得到提升,现可支持多种文件类型,包括电子表格、演示文稿、图像、音频和视频。用户可通过上传这些文件至Gemini,获得内容分析、要点提取、视觉元素识别等服务。此外,Gemini还能根据用户提示词进行针对性分析,总结复杂主题,识别趋势,并提供写作及文档组织优化建议,旨在提高用户的研究、理解和写作能力。 谷歌将重新开放Gemini生成人物图像功能。谷歌宣布将恢复AI模型Gemini生成人物图像的功能,该功能曾因生成不符合历史事实的人物图像及种族描述不当引发争议。谷歌产品管理高级总监戴夫・西特伦表示已取得重大进展,并承诺继续改进。此次更新将首先面向订阅Gemini Advanced套餐的英语用户和企业推出,同时设置了图像生成内容的限制,以避免再次出现争议。 亚马逊将于10月发布AlexaAI订阅版。亚马逊计划在2024年10月推出全新的AI模型“RemarkableAlexa”,代号“ProjectBanyan”。这一模型旨在分析用户对现有人工智能模型的使用情况,并筛选出最符合用户需求的部分。其主要功能包括帮助用户策划、总结和探索感兴趣的内容,并通过SmartBriefing功能生成个性化新闻流。该服务将采用订阅制,每月收费10美元。 英伟达推出NIMAgentBlueprints服务,加速企业创建AI应用。英伟达近日推出了NIM Agent Blueprints服务,旨在帮助企业快速构建和部署AI应用。该服务提供预训练的AI工作流程,涵盖客户服务化身、检索增强生成及药物发现虚拟筛选等场景。开发人员可利用AI Agent创建应用,并通过NVIDIA NeMo、NIM及合作伙伴微服务等构建和部署。企业还能根据反馈优化应用,形成数据驱动的AI发展模式。 (二)底层技术 腾讯发布新一代大模型“混元Turbo”:推理效率提升100%,成本降低50%。 腾讯在2024全球数字生态大会上推出新一代大模型“混元Turbo”,采用MoE架构,推理效率翻倍,成本减半,价格也显著降低。在SuperCLUE测评中,混元Turbo-Preview在理科、文科均获第一,74.33分的成绩在国内大模型中领先。目前,腾讯内部近700个业务已接入该模型,涵盖多个产品和服务,展现了其在大模型领域的强大实力和广泛应用前景。 图7:混元Turbo模型介绍 阿里通义千问推出Qwen2-VL:开源2B/7B参数AI大模型。阿里通义千问团队推出了新模型Qwen2-VL,其具备动态分辨率支持功能,可处理任意分辨率图像而无需分割,更贴近人类视觉感知。此外,该模型还引入了Multimodal Rotary PositionEmbedding技术,能同时捕获文本、视觉和视频的位置信息,成为多模态处理器。Qwen2-VL系列包括7B和2B两种规模,前者注重性价比,后者则针对移动部署优化,在多方面均表现出色。 图8:Qwen2-VL模型演示 谷歌发布3款Gemini实验AI模型。谷歌于8月28日推出了三款新的Gemini实验性AI模型:Gemini1.5Flash-8B、Gemini1.5ProExp-0827和Gemini1.5 FlashExp-0827。其中,1.5 Pro Exp-0827在LMSYS排名第二,仅次于OpenAI的GPT-4o-latest模型;而1.5FlashExp-0827的排名从第23位跃升至第6位。 这些模型现已通过GoogleAIStudio和GeminiAPI免费提供,用户可访问使用。 谷歌DeepMind展示GenRM技术:微调LLMs作为奖励模型,提升生成式AI推理能力。谷歌DeepMind团队在最新论文中介绍了GenRM技术,这是一种生成式验证器,旨在通过微调大型语言模型(LLMs)作为奖励模型,以提升生成式AI的推理能力。与传统的判别式验证器不同,GenRM能无缝集成指令调整、支持思维链推理,并有效利用额外推理时间。实验显示,GenRM在多个任务中的表现优于其他验证器,显著提升了AI的解决问题能力。 Meta公布LlamaAI模型家族下载量数据。Meta公司近日公布其开源AI模型家族Llama的下载量数据,显示全球下载量已突破3.5亿次,其中最新推出的“Llama 3.1-405B”版本最受用户欢迎。该版本扩展了上下文长度,支持更多语言,并提供了更大参数版本。此外,Meta还与多家知名科技公司合作,提供Llama模型,并计划继续扩大合作伙伴阵容。 OpenAI今年启动GPTNext计划:AI性能百倍级跃升,Orion有望接棒GPT-4。 OpenAIJapan在KDDI峰会上宣布将于2024年启动GPTNext计划,旨在实现AI性能的百倍级提升。该计划将推出两个新的人工智能系统:“Strawberry”专注于数学和编程领域,而“Orion”则有望成为GPT-4的继任者,引领AI技术实现新的飞跃。这一计划展示了OpenAI在AI领域的持续创新和发展决心。 (三)行业政策 首个具法律约束力的AI国际条约签署在即。美国、欧盟和英国预计将在9月5日签署首个具有法律约束力的人工智能国际条约。该条约由50多个国家共同起草,要求签署国对AI系统产生的有害和歧视性结果负责,并尊重平等权和隐私权。 尽管条约具有可依法强制执行的性质,但主要通过监测来衡量遵守情况,缺乏罚款等制裁措施。 (四)重点事件预告 10月3日:2024三星开发者大会 9月23日-9月24日:2024中国数字人大会 投资建议 如我们一季报总结所展望,上半年港股互联网各龙头公司已表现出微观基本面筑底回升的特征,在宏观承压的背景下,互联网企业通过聚焦优势业务发展和调整组织架构提效,整体中报利润释放优于其他板块。典型案例包括腾讯中报收入增速虽在个位数增长,但过去两年公司通过聚焦高毛利业务发展(视频号广告等),利润端保持在双位数增长。此外,美团也是本次中报季表现非常亮眼的公司,年初以来公司通过整合到店到家两大事业群,有效实现资源和流量的互补,带动外卖和到店业务的盈利能力提升,同时后续有望通过神会员等策略,持续拉动核心本地业务增长