您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:人工智能周报(24年第10周):ChatGPT 新增朗读功能,Anthropic 发布Claude 3系列大语言模型 - 发现报告
当前位置:首页/行业研究/报告详情/

人工智能周报(24年第10周):ChatGPT 新增朗读功能,Anthropic 发布Claude 3系列大语言模型

信息技术2024-03-10张伦可国信证券张***
人工智能周报(24年第10周):ChatGPT 新增朗读功能,Anthropic 发布Claude 3系列大语言模型

人工智能动态:1)产品应用:ChatGPT新增朗读功能,支持37种语言、5种声音,还可以自动检测文本语言并进行朗读,让ChatGPT用五种不同的声音朗读其回复;微软增强Copilot功能,拖拽文件即可提问,用户只需将文件拖拽至Copilot的聊天窗口,AI助手便能读取内容。2)底层技术:Anthropic发布Claude3系列大语言模型,该系列大型语言模型(LLM)在各种认知任务上树立了新的性能标杆;阿里巴巴推出AtomoVideo高保真图生视频框架,旨在从静态图像生成高质量的视频内容,并与各种文生图(T2I)模型兼容;华为云盘古大模型通过金融大模型标准符合性验证,并获得“优秀级”(4+级)评分,官方称行业首批、最高等级。3)行业政策:印度提出新要求,科技公司发布生成式AI工具之前,需获得政府许可。此外,这份文件还要求科技公司“适当”标注其人工智能模型产生的输出的“可能和固有的不可靠性或不可靠性”。 投资建议:美国CPI趋势上持续下降,海外预计在年内开启降息。彭博一致性预测显示2024年美国CPI增长低于3%,CME利率期货市场预期5月前完成首次降息,2024年全年降息次数预期超过5次。市场风险偏好进一步提升,叠加AI等科技创新驱动,近期纳指与北美科技股表现强劲,指数持续创2023年以来新高。国内经济政策方面,近期地产政策持续松绑、货币利率政策进一步宽松,央行大幅降准50bp释放流动性,国内整体仍处于经济复苏阶段,政策支持持续推出,有望对需求持续形成支撑。综合海外利率流动性与国内经济政策边际优化,推荐增加恒生科技配置,推荐长期竞争格局清晰的腾讯、短期边际变化明显的美团和京东集团、AI驱动增长的美图公司。 风险提示:政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行导致广告大盘增速不及预期的风险,游戏公司新产品不能如期上线或者表现不及预期的风险等。 AI相关网站流量数据 图1:AI相关网站周访问量(百万) 图2:第一梯队AI相关网站周访问量变动(百万) 图3:第二梯队AI相关网站周访问量变动(百万) 图4:第三梯队AI相关网站周访问量变动(百万) 图5:新增聊天、教育类AI相关网站周访问量变动(百万) 人工智能动态:ChatGPT新增朗读功能,支持37种语言 、5种声音 ,Anthropic发布Claude3系列大语言模型 (一)产品应用 ChatGPT新增朗读功能,支持37种语言、5种声音。OpenAI为其广受欢迎的聊天机器人ChatGPT推出了名为“朗读”(Read Aloud)的新功能。该功能可以让ChatGPT用五种不同的声音朗读其回复,旨在为用户提供更加便捷的交互体验。目前,“朗读”功能已上线ChatGPT的网页端、iOS和安卓应用。“朗读”功能不仅支持37种语言,还可以自动检测文本语言并进行朗读。值得注意的是,该功能同时适用于GPT-4和GPT-3.5版本的ChatGPT。这一更新展示了OpenAI在“多模态交互”(multimodalcapabilities)方面所做的努力,即赋予人工智能模型通过多种媒介进行读取和响应的能力。有趣的是,就在不久前,OpenAI的竞争对手Anthropic也在其人工智能模型中添加了类似的功能。 微软增强Copilot功能,拖拽文件即可提问。继Adobe推出PDFAI帮助用户快速理解庞大报告,以及Copilot能分析OneDrive文件并回答相关问题之后,Copilot又迎来了新功能:直接拖拽文件提问。用户只需将文件拖拽至Copilot的聊天窗口,AI助手便能读取内容。随后,用户可以向Copilot提问,例如要求其总结文档要点、查找特定数据或提供主题相关信息。 (二)底层技术 Anthropic发布Claude3系列大语言模型,号称已超越GPT-4和Gemini1.0 Ultra。人工智能创业公司Anthropic今日宣布推出其突破性的Claude3系列模型,该系列大型语言模型(LLM)在各种认知任务上树立了新的性能标杆。 Claude3系列包含三个子模型,分别为Claude 3Haiku、Claude3 Sonnet和Claude3Opus,它们提供不同程度的智能、速度和成本选择,以满足各种人工智能应用需求。据官方称,Claude3系列的旗舰模型Opus在本科和研究生水平的知识、数学和复杂任务理解方面均超越了OpenAI GPT-4和谷歌Gemini 1.0 Ultra。此外,所有Claude3模型均擅长分析、预测、细致内容创作、代码生成和多语言对话。Claude3系列模型针对实时交互进行了优化,旨在提升实时聊天、自动完成和数据提取等功能。其中,速度最快且最具成本效益的Claude3Haiku,能够在3秒内处理包含图表的信息密集型研究论文。Claude3Sonnet在提升智能水平的同时,处理速度是之前模型的两倍,非常适合知识检索和销售自动化。 Opus的处理速度与Claude2和2.1相似,但智能水平大幅提升。 图6:Claude3系列模型 阿里巴巴推出AtomoVideo高保真图生视频框架,兼容多种文生图模型。阿里巴巴研究团队近日推出了AtomoVideo高保真图生视频(I2V,ImagetoVideo)框架,旨在从静态图像生成高质量的视频内容,并与各种文生图(T2I)模型兼容。 AtomoVideo使用预先训练好的T2I模型为基础,在每个空间卷积层和注意力层之后新添加一维时空卷积和注意力模块,T2I模型参数固定,只训练添加的时空层。由于输入的串联图像信息仅由VAE编码,代表的是低层次信息,有助于增强视频相对于输入图像的保真度。同时,团队还以Cross-Attention的形式注入高级图像语义,以实现更高的图像语义可控性。 图7:AtomoVideo框架 华为云盘古大模型通过金融大模型标准符合性验证,官方称行业首批、最高等级。 华为中国官微宣布,去年12月,在由中国信通院组织的可信AI大模型标准符合性验证中,华为云盘古大模型顺利完成金融大模型标准符合性验证,并获得“优秀级”(4+级)评分。官方表示,这也是本次金融大模型评测各厂商中的最高等级。据悉,华为云盘古大模型成为首批通过金融大模型标准符合性验证的产品,也是首批通过行业大模型标准符合性验证的产品。该验证评价指标重点考察金融大模型在语言、语音、视觉、多模态任务等方面的能力支持度,全方位评估金融大模型在数据合规性、模型可控性、服务可靠性方面的应用成熟度。 (三)行业政策 印度提出新要求,科技公司发布生成式AI工具之前,需获得政府许可。据路透社、外媒TechCrunch北京时间报道,印度信息技术部于当地时间上周五发布公告:各家科技公司在发布生成式AI相关工具、新的模型之前,需要获得印度政府的明确许可。此外,这份文件还要求科技公司“适当”标注其人工智能模型产生的输出的“可能和固有的不可靠性或不可靠性”,这标志着印度抛弃了此前对人工智能监管方面“不干预”的态度。不到一年前,印度信息技术部曾拒绝对人工智能的发展进行监管,而是将该领域确定为印度“战略利益的重要组成部分”。 (四)重点事件预告 4月16日-4月17日:2024百度CreateAI开发者大会 投资建议 美国CPI趋势上持续下降,海外预计在年内开启降息。彭博一致性预测显示2024年美国CPI增长低于3%,CME利率期货市场预期5月前完成首次降息,2024年全年降息次数预期超过5次。市场风险偏好进一步提升,叠加AI等科技创新驱动,近期纳指与北美科技股表现强劲,指数持续创2023年以来新高。国内经济政策方面,近期地产政策持续松绑、货币利率政策进一步宽松,央行大幅降准50bp释放流动性,国内整体仍处于经济复苏阶段,政策支持持续推出,有望对需求持续形成支撑。综合海外利率流动性与国内经济政策边际优化,推荐增加恒生科技配置,推荐长期竞争格局清晰的腾讯、短期边际变化明显的美团和京东集团、AI驱动增长的美图公司。 表1:相关公司盈利预测及估值 风险提示 政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行导致广告大盘增速不及预期的风险,游戏公司新产品不能如期上线或者表现不及预期的风险等。