您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[天风证券]:通信行业研究周报:国内大模型进展不断,积极关注WWDC大会催化AI板块;IFT-4取得里程碑 - 发现报告
当前位置:首页/行业研究/报告详情/

通信行业研究周报:国内大模型进展不断,积极关注WWDC大会催化AI板块;IFT-4取得里程碑

信息技术2024-06-10唐海清、王奕红、康志毅、林竑皓、余芳沁、陈汇丰、袁昊天风证券朝***
通信行业研究周报:国内大模型进展不断,积极关注WWDC大会催化AI板块;IFT-4取得里程碑

国内大模型进展不断,积极关注WWDC大会催化AI板块;IFT-4取得里程碑 本周行业动态(06.03~06.09): 国内模型进展不断,重视下周WWDC大会苹果AI进展 国内大模型进展不断,包括智谱AI开源GLM-4-9B,性能超越Llama-3-8B;腾讯混元开源模型生图时间缩短75%;快手“可灵”视频生成大模型官网正式上线;以及阿里Qwen2-72B诞生,性能强大等,标志着我国大模型持续迭代,全力追赶海外进展与模型能力。此外,海外方面,APPLE与OpenAI或已达成合作,Apple与OpenAI的这一合作将在全球开发者大会(WWDC)上公布。 “超重-星舰”第四次综合飞行测试情况简析 尽管助推级在上升过程和返回过程中各有1台发动机异常,星舰飞船级防热瓦仍然有脱落现象,前襟翼在返回过程中部分被烧穿,但成功进行了级间分离、热分离适配器分离,两级分别成功返回海上实现受控溅落。同时,飞行过程中持续接收到传回的数据信号,使SpaceX获得了大量有用数据,该试验结果符合SpaceX预期,标志着超重-星舰的研制实现了又一个新的重要里程碑。 本周投资观点: 近期市场风格转换较快,同时稳健红利标的受到市场青睐。但我们看到英伟达股价再创新高,海外AI进展不断,同时国内模型不断追赶近期成果屡现,未来AI应用的普及与蓬勃发展将带动算力投入的持续性,AI算力基础设施持续受益。持续重视AI核心标的的投资机会:海外线AI核心方向如光模块&光器件、液冷等领域值得重视,持续核心推荐;此外国产算力线如国产服务器,交换机,AIDC等方向核心标的建议积极关注。近期看到卫星互联网产业国内动态进展呈现,看好后续产业受催化拉动。海风行业国内复苏,海外出海具备良好机遇,积极把握产业变化,核心推荐海缆龙头厂商。中长期我们坚定看好核心三大方向“AI+出海+卫星”的核心标的。 一、人工智能与数字经济: 1、光模块&光器件,重点推荐:中际旭创、天孚通信、新易盛、源杰科技(电子联合覆盖)、博创科技、仕佳光子、光库科技、中瓷电子(新材料联合覆盖);建议关注:太辰光、光迅科技、铭普光磁、鼎通科技、剑桥科技等; 2、网络设备基础设施:重点推荐:中兴通讯、紫光股份(计算机联合覆盖);建议关注:菲菱科思、盛科通信、锐捷网络、三旺通信、映翰通、东土科技等; 3、出海复苏&头部集中,重点推荐:拓邦股份、广和通、亿联网络、移为通信、威胜信息(机械联合覆盖),建议关注:和而泰、移远通信等。 4、低估值、高分红:中国移动、中国电信、中国联通。 5、AIDC&散热:重点推荐:润泽科技(机械联合覆盖)、润建股份、科华数据(电新联合覆盖)、奥飞数据(计算机联合覆盖)。建议关注:英维克、光环新网、高澜股份、科创新源、申菱环境、数据港等; 6、A IGC应用,重点关注:彩讯股份、梦网科技。 二、卫星互联网&低空经济: 国防信息化建设加速,低轨卫星加速发展,低空经济积极推进,重点推荐:华测导航(计算机联合覆盖)、海格通信;建议关注:铖昌科技、臻镭科技、盛路通信、信科移动、上海瀚讯、佳缘科技、盟升电子、中国卫通、电科网安、海能达等。 三、海风海缆&智能驾驶: 1、海风海缆:重点推荐—亨通光电、中天科技、东方电缆(电新覆盖); 2、智能驾驶:建议关注:模组&终端(广和通、美格智能、移远通信、移为通信等);传感器(汉威科技&四方光电-机械联合覆盖);连接器(意华股份、鼎通科技等);结构件&空气悬挂(瑞玛精密)等。 风险提示:AI进展低于预期,下游应用推广不及预期,贸易战等风险 重点标的推荐 1.近期重点行业动态以及观点(06.03-06.09) 1.1.AI行业动态: ①海外方面 TUM等研究人员提出了一种全新算法NPGA,能够生成高保真3D头像(北京前沿国际人工智能研究院微信公众号) 来自德国慕尼黑工业大学、伦敦大学学院等研究团队提出了全新算法——NPGA,可生成高质量3D头像。采用了高斯点云的方式,即通过无数个点组成3D人像形状,让渲染更加高效、逼真。实验评估结果显示,N PGA比起之前SOTA模型,在自我重现任务中,大约有2.6PSNR提升。 团队使用了3DMM的改进版——NPHM(Neural Parametric Head Models,神经参数化头部模型),从多视角的图像序列中追踪并提取身份识别的隐向量z_id和表情代码z_exp。 基于3DGS中的为每个基元定义的场景表示,作者额外添加了高斯特征。 Cohere最新开源Aya-23,支持23种语言(北京前沿国际人工智能研究院微信公众号) LLM在过去几年中蓬勃发展,但该领域的大部分工作都是以英语为中心。为了解决上述问题,最近,加拿大的独角兽AI公司Cohere开源了两种尺寸(8B和35B)的多语言模型Aya23,其中Aya-23-35B在所有评估任务和涵盖的语言中取得了最好成绩。 覆盖的23种语言分别为阿拉伯语、中文(简体和繁体)、捷克语、荷兰语、英语、法语、德语、希腊语、希伯来语、印地语、印尼语、意大利语、日语、韩语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、土耳其语、乌克兰语和越南语。 Cohere最初与来自119个国家的3,000多名独立研究人员一起创建了一个庞大的多语言指令数据集Aya Collection,包含5.13亿个提示和补全样本。 APPLE与OpenAI或已达成协议(北京前沿国际人工智能研究院微信公众号) Apple已与OpenAI达成协议,将由OpenAI为iOS 18提供AI聊天功能,此外,Apple也在积极与Google进行协商,希望将Gemini作为另一项选择。Apple与OpenAI的这一合作将在全球开发者大会(WWDC)上公布。苹果的全球开发者大会将于6月10日召开,届时Apple将发布iOS 18以及新的iPad、Apple Watch,Vision Pro和Mac软件的下一个主要版本。据悉,新的iPhone操作系统被内部人士视为该设备历史上最大规模的升级,而Vision Pro则是产品发布以来首次获得重大软件更新。 ②国内方面: 智谱AI开源GLM-4-9B,性能超越Llama-3-8B(甲子发现微信公众号) 智谱AI发布了GLM-4-9B,这是智谱AI最新一代预训练模型GLM-4系列中的开源版本。 GLM-4-9B包含四个版本: 一个基础模型GLM-4-9B-8k,三个对话模型GLM-4-9B-Chat-128k、GLM-4-9B-Chat- 1M 、GLM-4V-9B-8k。 在最核心的预训练环节,GLM-4-9B几乎采用了互联网上所有的公开数据,并引入LLM筛选出了10T的高质量多语言数据,在9.4B稠密参数下引入FP8进行训练,没有采用牺牲显存的MoE架构。 性能表现上,在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B-Chat综合能力相比上一代的ChatGLM3-6B提升40%,全面超越Llama-3-8B-Instruct,中文学科能力提升50%。在多模态方面,智谱AI首次开源了基于GLM基座视觉模型GLM-4V-9B。通过语言与图像数据混合预训练,在提升多模态性能的同时,避免语言能力的灾难性遗忘。在中英文综合能力、感知推理、文字识别、图表理解等多方面多态评测中,GLM-4V-9B超越了GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max和Claude 3 Opus。 腾讯混元:开源模型生图时间缩短75%!(腾讯云微信公众号) 开源不到一个月,腾讯混元文生图大模型(混元DiT模型)的Github Star数已达到2.1k,位于开源社区热门DiT模型前列!同时腾讯混元针对文生图开源模型,发布一组「加速库」:实测显示,加速后的生图时间缩短75%、生图速度提升4倍,大幅提升模型运行效率。这也是业内首个由官方推出的加速库。 具体来说,这款加速器叠了两套buff:一是,知识蒸馏。通过降低扩散模型迭代的步数实现加速(就像看学霸的笔记,跳过部分训练步骤,直接借鉴复杂模型的经验,掌握重点)。使用蒸馏权重后,生成同等质量的图像,迭代步数减半。二是,TensorRT推理加速。 通过工程优化,减少冗余计算、合并层次、精简精度,让模型更快处理数据。而且,它还支持与模型权重解耦。 为了提升开源模型易用性,腾讯混元做了努力。现在,用户可以基于ComfyUI的图形化界面,使用腾讯混元文生图模型。此外,仅用三行代码,用户就能在Hugging Face的官方模型库Diffusers中调用混元DiT模型,无需下载原始代码库。 “中国版Sora”来了!仅需一张全身照,就可以原地“唱跳”,分辨率高达1080p!(每日经济新闻微信公众号) 据新华社,近日,快手“可灵”视频生成大模型官网正式上线。相较此前各家放出的视频大模型以展示视频为主,本次亮相的可灵大模型已在快手旗下的快影App开放邀测体验。 据官网介绍,快手在短视频技术方面有多年的深入积累,其视频生成大模型也有天然、广泛的应用场景。可灵大模型为快手AI团队自研,具备诸多优势:能够生成大幅度的合理运动;能够模拟物理世界特性;具备强大的概念组合能力和想象力;生成的视频分辨率高达1080p,时长高达2分钟(帧率30fps),且支持自由的宽高比。 据悉,可灵使用了与Sora一样的Diffusion Transformer架构,3D时空联合注意力机制等,该架构巧妙地融合了时间与空间的信息,对视频数据进行综合分析和处理。可精准捕捉到视频帧内的局部空间特征以及跨帧的时间动态特征,从而更全面地理解和再现视频中的运动信息。 所以,无论是快速移动的物体、剧烈变化的场景,还是复杂的人物动作都能被精确捕捉,使得生成的视频内容动态性十足,同时具有很高的物理世界真实感。 全球开源新王Qwen2-72B诞生,碾压Llama3-70B击败国产闭源模型!(新智元微信公众号) Qwen2-72B终于发布了!这个模型一出世,直接杀进开源LLM排行榜第一,完全碾压美国最强的Llama3-70B。 在各大基准测试中,Qwen2-72B一举斩获了十几项世界冠军,尤其在代码和数学能力上提升最为明显。同时,相较于上一代Qwen1.5,Qwen2也实现了大幅的性能提升。另外,开源Qwen2-72B还击败了国内一众闭源大模型,包括文心4.0、豆包Pro、混元Pro等等。 72B指令微调版模型,还增大了上下文长度支持,最高可达128k token。在16个基准测试中,Qwen2-72B-Instruct的性能可与Llama-3-70B-Instruct相匹敌。得益于高质量的数据,Qwen2-72B-Instruct在数学、代码能力上实现飞升。 差不多4个月时间,阿里团队就完成从Qwen1.5到Qwen2跨越式的迭代升级。除了Qwen2-72B,Qwen2系列包含了5种不同参数规模的预训练和指令微调模型。其中还有,Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B,都可支持32K上下文。 安全性方面,大模型在四种多语言不安全查询类别(非法活动、欺诈、色情、隐私暴力)中生成有害响应的比例。通过显著性检验(P值),看得出Qwen2-72B-Instruct模型在安全性方面,与GPT-4的表现相当,并且显著优于Mistral-8x22B模型。 阿里云持续开源自研模型,牵头建设中国最大的AI开源社区魔搭,正是为了推动AI应用门槛的降低。如今,大模型应用创新的奇点还没有到来。当大模型的大部分潜力被真正挖掘出来,当越来越多开发者和企业结合自己需求,促进大模型的发展和应用,届时必将发生天翻地覆的变化。 1.2.卫星行业动态: “超重-星舰”第四次综合飞行测试情况简析(中国航天微信公众号) 美国东部时间2024年6月6日上午8:50(北京时间2024年6月6日20:50)SpaceX在德克萨斯州星基地的轨道发