您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:人工智能周报(24年第16周):百度推出AI原生操作系统DuerOSX,Meta发布Llama3开源大语言模型 - 发现报告
当前位置:首页/行业研究/报告详情/

人工智能周报(24年第16周):百度推出AI原生操作系统DuerOSX,Meta发布Llama3开源大语言模型

文化传媒2024-04-23张伦可、陈淑媛国信证券何***
AI智能总结
查看更多
人工智能周报(24年第16周):百度推出AI原生操作系统DuerOSX,Meta发布Llama3开源大语言模型

人工智能动态:1)产品应用:百度推出的全球首个AI原生操作系统DuerOS X;苹果将于iOS18推出的首批全新AI功能将完全运行于设备端;OpenAI推出了Batch批处理API,适用于异步任务处理,支持多种模型;微软发布VASA-1模型:图+音频可生成短视频;亚马逊AmazonMusic宣布开启AI生成歌单功能Maestro测试;AdobeAcrobat上线AI助手,可帮助用户总结PDF文档。 2)底层技术:Meta发布Llama3开源大语言模型,共有80亿和700亿参数两种版本;GalaxyAI将支持更多语言,并将在未来数月陆续上线;Adobe宣布为其专业视频编辑软件PremierePro加入一系列由生成式人工智能驱动的强大功能。 3)行业政策:英国正在起草AI监管草案,加强对GPT-4等AI模型的监管力度,法案旨在确保AI发展处于可控状态,不会对人类造成潜在危害;日本政府拟为5家日企建AI超算提供超700亿日元补贴,该补贴用于打造人工智能超级计算机,旨在减少对美国的技术依赖。 投资建议:综合海外利率流动性与国内经济政策边际优化,推荐增加恒生科技配置,推荐长期竞争格局清晰的腾讯、短期边际变化明显的美团和京东集团、AI驱动增长的美图公司。 风险提示:政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行风险,游戏公司新产品不能如期上线或表现不及预期风险等。 AI相关网站流量数据 图1:AI相关网站周访问量(百万) 图2:第一梯队AI相关网站周访问量变动(百万) 图3:第二梯队AI相关网站周访问量变动(百万) 图4:第三梯队AI相关网站周访问量变动(百万) 图5:新增聊天、教育类AI相关网站周访问量变动(百万) 百度推出AI原生操作系统DuerOS X,Meta发布Llama 3开源大语言模型 (一)产品应用 百度推出的全球首个AI原生操作系统DuerOS X。该系统基于百度文心大模型进行全面升级,支持小度全域免唤醒语音交互,号称“唤醒识别率99%+、听懂满足率95%+”,支持10大类目场景,以及5200+智能技能与服务。DuerOS是百度在2017年推出的首个对话式人工智能操作系统,目前用于小度智能音箱等产品,已经迭代到7.0版本,DuerOSX将迎来更多AI功能升级。 苹果将于iOS18推出的首批全新AI功能将完全运行于设备端。苹果将于6月10日发布iOS18,其中首批全新AI功能将完全运行于设备端,无需依赖云服务器。 这些功能可能包括提升Siri回答复杂问题的能力,允许信息应用自动完成句子输入等。 OpenAI推出了Batch批处理API,适用于异步任务处理,支持多种模型。Batch批处理API可以在24小时内给出结果,并提供API半价折扣。该API适用于异步任务处理,如处理大量文本、图片、摘要等,支持众多模型。OpenAI在API文档中介绍了详细使用方法,包括如何创建、取回、取消Batch批处理等。 微软发布VASA-1模型:图+音频可生成短视频。微软亚洲研究院(Microsoft ResearchAsia)近日发表论文,介绍了全新的VASA-1模型,该模型能够自动让图片中的人物自动说话,模拟自然的面部表情、各种情绪和唇部同步,支持离线batch处理模式和在线直播模式,生成分辨率为512*512的动态短视频,延迟仅为170ms,且只需要一台配备英伟达RTX4090显卡的电脑上就能处理。 亚马逊Amazon Music宣布开启AI生成歌单功能Maestro测试。亚马逊宣布旗下AmazonMusic音乐应用向少数美国用户开启AI生成歌单功能Maestro的测试。用户可通过多样化的提示输入让该功能在数秒内生成独特的定制歌单。目前AmazonMusic的Unlimited层级订阅用户可全量使用Maestro功能。亚马逊表示Maestro建立在新兴技术之上,不能保证正确性,同时为该功能设置了AI围栏,阻止不恰当的提示输入。 AdobeAcrobat上线AI助手,可帮助用户总结PDF文档。Adobe Acrobat上线AI助手,每月售价4.99美元,可帮助用户总结PDF文档,改变用户与文档的交互方式。该AI助手将提供提取关键信息、总结内容和方便在长文档中导航等功能,适用于纳税人、消费者和学生等不同用户群体。Adobe还提供“智能引文”功能,以便用户验证生成内容的来源。该AI助手当前仅支持英语,其他语言将陆续上线。 (二)底层技术 Meta发布Llama 3开源大语言模型。Meta公司发布了下一代大语言模型Llama 3,共有80亿和700亿参数两种版本。Llama3的性能优于ClaudeSonnet、Mistral Medium和GPT-3.5。Meta开源了Llama 3的80亿参数版本,让所有人都能接触最前沿的人工智能技术。Llama 3树立了新的标准,显示出惊人的推理能力和更强的服从指令能力。Meta还发布了新的信任和安全工具,包括Llama Guard 2、CodeShield和CyberSecEval2。Meta即将在Facebook、Instagram、WhatsApp等应用中整合Llama 3,为用户带来更卓越的AI体验。Llama 3不只是能处理文本,还能理解图片和视频。Meta公司还在训练更大的模型,拥有超过4000亿参数。 图6:模型比较结果 GalaxyAI将支持更多语言,并将在未来数月陆续上线。包括阿拉伯语、印尼语、俄语、澳大利亚英语、粤语和加拿大法语在内,结合现有的13种语言,三星将为全球更多Galaxy用户提供GalaxyAI的能力。此外,三星计划在今年稍晚进一步扩大支持语言,包括罗马尼亚语、土耳其语、荷兰语、瑞典语、繁体中文和欧洲葡萄牙语。GalaxyAI功能包括通话即时翻译、翻译助理、信息即时翻译助理、笔记智能助理、语音转文字智能助理和网页浏览助理,旨在帮助用户跨越语言障碍,享受创新交流沟通体验。 Adobe宣布为其专业视频编辑软件PremierePro加入一系列由生成式人工智能驱动的强大功能。这些功能包括生成扩展、智能选取和跟踪工具以及文本转视频。 这些新功能将帮助视频剪辑师更高效地完成工作,例如延长场景画面、移除不需要的元素或为场景增添装饰物。Adobe计划于2024年晚些时候推出这些生成式人工智能工具。值得注意的是,作为PremierePro的主要竞争对手,苹果公司的FinalCutPro目前在人工智能领域尚无建树,但苹果尚未公布FinalCutPro的任何人工智能特性,因此FinalCutPro能否加入类似的功能值得期待。 (三)行业政策 英国正在起草AI监管草案,加强对GPT-4等AI模型的监管力度。法案旨在确保AI发展处于可控状态,不会对人类造成潜在危害。草案最早可能在2024年底前发布,或在2025年初在法国举行的人工智能会议上公布。英国首相苏纳克曾表示不应“急于监管”人工智能,但英国文化、媒体与体育部的官员以及DSIT一直推动修改英国版权法,以保护内容创作者免受人工智能模型对其内容的搜刮。 日本政府拟为5家日企建AI超算提供超700亿日元补贴。该补贴用于打造人工智能超级计算机,旨在减少对美国的技术依赖。高性能计算机对于需要海量数据学习的AI及生成式AI的发展至关重要,而日本的计算基础设施十分匮乏。因此,日本政府为Sakura Internet、日本电信巨头KDDI、GMO互联网、Rutilea和Highreso分别提供501亿、102亿、19亿、25亿和77亿日元的政府补贴。 (四)重点事件预告 6月10日-6月14日:苹果WWDC24全球开发者大会 投资建议 综合海外利率流动性与国内经济政策边际优化,推荐增加恒生科技配置,推荐长期竞争格局清晰的腾讯、短期边际变化明显的美团和京东集团、AI驱动增长的美图公司。 风险提示 政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行导致广告大盘增速不及预期的风险,游戏公司新产品不能如期上线或者表现不及预期的风险等。