您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:人工智能周报(24年第13周):Meta推出内置AI功能的智能眼镜,以及视觉模型SceneScript - 发现报告
当前位置:首页/行业研究/报告详情/

人工智能周报(24年第13周):Meta推出内置AI功能的智能眼镜,以及视觉模型SceneScript

文化传媒2024-03-31张伦可、陈淑媛国信证券董***
人工智能周报(24年第13周):Meta推出内置AI功能的智能眼镜,以及视觉模型SceneScript

人工智能动态:1)产品应用:Meta推出内置多模态AI功能的智能眼镜,支持翻译、物体识别、动物及景物识别等功能;微软照片应用加入了Copilot插件,可创建幻灯片和设置桌面壁纸;OPPO/一加ColorOSAI功能上新,支持英语教学、面试培训和问答互动。 2)底层技术:StabilityAI发布的新的代码模型StableCodeInstruct3B,该模型在代码生成、数学和其他与软件开发相关的查询方面表现出色,还精通FIM(代码中间填充)任务、数据库查询、代码翻译、解释和创建,并针对各种编程语言进行了训练 ; 微软设计发布了新型AI生态系统TaskMatrix.AI,将基础大模型与数百万应用程序编程接口(APIs)连接起来,能够完成各种数字和物理任务;Meta公司推出视觉模型“SceneScript”,可编程语言快速建立场景,实时推断房间几何形状,并将相关数据转换为建筑学层面的近似值,能够高效且轻量地建立室内3D模型。 3)行业政策:美国政府要求各联邦机构设置“首席人工智能官”,负责协调政府各部门对人工智能的使用,同时进行风险评估并设定运营和治理指标;工业和信息化部将开展“人工智能+”行动,促进人工智能与实体经济深度融合,加快推动以大模型为代表的人工智能赋能制造业发展。 投资建议:美国CPI趋势上持续下降,海外预计在年内开启降息。彭博一致性预测显示2024年美国CPI增长低于3%,CME利率期货市场预期5月前完成首次降息,2024年全年降息次数预期超过5次。市场风险偏好进一步提升,叠加AI等科技创新驱动,近期纳指与北美科技股表现强劲,指数持续创2023年以来新高。国内经济政策方面,近期地产政策持续松绑、货币利率政策进一步宽松,央行大幅降准50bp释放流动性,国内整体仍处于经济复苏阶段,政策支持持续推出,有望对需求持续形成支撑。综合海外利率流动性与国内经济政策边际优化,推荐增加恒生科技配置,推荐长期竞争格局清晰的腾讯、短期边际变化明显的美团和京东集团、AI驱动增长的美图公司。 风险提示:政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行风险,游戏公司新产品不能如期上线或表现不及预期风险等。 AI相关网站流量数据 图1:AI相关网站周访问量(百万) 图2:第一梯队AI相关网站周访问量变动(百万) 图3:第二梯队AI相关网站周访问量变动(百万) 图4:第三梯队AI相关网站周访问量变动(百万) 图5:新增聊天、教育类AI相关网站周访问量变动(百万) Meta推出内置AI功能智能眼镜,StabilityAI发布新代码模型表现出色 (一)产品应用 Meta将为其Ray-Ban智能眼镜推出一系列多模态AI功能,包括翻译、物体识别、动物及景物识别等。用户可通过语音激活内置AI助手,眼镜内置扬声器进行回应。 测试发现,该眼镜在多种场景下可正确识别并描述周围的物品如宠物及艺术品等,但并非百分百准确。翻译功能支持英语、西班牙语、意大利语、法语和德语。MetaCEO扎克伯格和首席技术官博斯沃思均展示了该AI助手的功能。目前,该眼镜的AI功能仅限美国一小部分用户测试使用。 微软照片应用加入了Copilot插件,可创建幻灯片和设置桌面壁纸。用户需在插件设置区开启Copilot功能。此版本仅能帮助用户创建和浏览照片幻灯片,以及将指定照片设置为桌面背景。用户还可在设置中添加微软账户,查看存储在OneDrive云端的图片。去年11月,微软面向Windows Insider成员在照片应用中加入了一些其他基于人工智能的功能。这些功能包括移除并替换照片背景、改进Filmstrip幻灯片模式以及根据图像时间范围设置的时间轴滚动条。 OPPO/一加ColorOS AI功能上新:支持英语教学、面试培训和问答互动。小布英语老师提供AI模拟真人教学和一对一口语陪练;小布面试官支持AI模拟面试,帮助用户掌握面试技巧;小布问答帮助用户完成各类商品评论、社交平台文案和全套旅行规划等。 (二)底层技术 StabilityAI发布了新的代码模型StableCodeInstruct3B。该代码模型在之前的StableCode3B基础上进行了指令调优,性能优于同级竞品,甚至能与7B、15B的模型竞争。测试表明,Stable CodeInstruct 3B在代码完成准确性、对自然语言指令的理解,以及跨不同编程语言的多功能性方面,都能够打平甚至超越竞争对手。该模型在代码生成、数学和其他与软件开发相关的查询方面表现出色,还精通FIM(代码中间填充)任务、数据库查询、代码翻译、解释和创建。并针对Python、JavaScript、Java、C、C++和Go等编程语言进行了训练,并且即使在没有经过训练的的语言(如Lua)中,也能提供强大的测试性能。 图6:模型比较结果 微软设计发布新型AI生态系统TaskMatrix.AI,将基础大模型与数百万应用程序编程接口(APIs)连接起来完成任务。TaskMatrix.AI的核心技术包括多模态对话基础模型(MCFM)、API平台、API选择器和API执行器。MCFM负责与用户沟通,理解他们的目标和上下文,并生成可执行代码以完成特定任务。API平台提供了一个统一的API文档架构,用于存储数以百万计具有不同功能的API。API选择器根据MCFM对用户指令的理解,推荐相关的API。API执行器通过调用相关API执行生成的动作代码,并返回中间和最终的执行结果。此外,TaskMatrix.AI还提供了两个可学习的机制,以更有效地将MCFM与API对齐。TaskMatrix.AI能够完成各种数字和物理任务,包括图像处理、办公自动化和机器人及物联网设备控制等。 Meta公司推出视觉模型“SceneScript”。该模型可编程语言快速建立场景,实时推断房间几何形状,并将相关数据转换为建筑学层面的近似值。Meta声称,该模型能够高效且轻量地建立室内3D模型,仅需数KB的内存即可生成清晰且完整的几何形状,并且相关形状数据具有可解释性,用户可以轻松阅读和编辑这些数据表示。开发人员借鉴了大语言模型“预测单词”的方法来开发SceneScript,通过前序输入内容推出后文,并使用这些建筑学层面的描述重建出复杂的室内3D环境。 (三)行业政策 白宫要求美国各联邦机构设置“首席人工智能官”,确保AI使用情况公开透明。 各机构需建立AI治理委员会,设立“首席人工智能官”一职,负责协调政府各部门对人工智能的使用,同时进行风险评估并设定运营和治理指标。各机构还需向管理和预算办公室提交年度报告,列出其使用的所有人工智能系统、与之相关的任何风险以及计划如何降低这些风险。白宫要求各机构在使用AI时,若有可能影响美国人权利或安全,将被要求在12月1日前实施具体的保障措施,包括详细的公开披露。美国副总统卡马拉・哈里斯表示,CAIO的人选需要具有经验、专业知识和权力,来监督各机构所使用的所有人工智能技术,以确保人工智能能够负责任地使用。 开展“人工智能+”行动,促进人工智能与实体经济深度融合。3月26日,国新办举行发布会,工业和信息化部新闻发言人、总工程师赵志国在发布会上表示,加快推动以大模型为代表的人工智能赋能制造业发展。今年将开展“人工智能+”行动,促进人工智能与实体经济深度融合,推动人工智能赋能新型工业化。持续优化创新平台网络。按照已经印发的《制造业中试创新发展实施意见》,加快建设现代化中试能力,还要新建一批国家制造业创新中心、试验验证平台。打造世界领先的科技园区和创新高地。 (四)重点事件预告 4月16日-4月17日:2024百度CreateAI开发者大会 6月10日-4月14日:苹果WWDC24全球开发者大会 投资建议 美国CPI趋势上持续下降,海外预计在年内开启降息。彭博一致性预测显示2024年美国CPI增长低于3%,CME利率期货市场预期5月前完成首次降息,2024年全年降息次数预期超过5次。市场风险偏好进一步提升,叠加AI等科技创新驱动,近期纳指与北美科技股表现强劲,指数持续创2023年以来新高。国内经济政策方面,近期地产政策持续松绑、货币利率政策进一步宽松,央行大幅降准50bp释放流动性,国内整体仍处于经济复苏阶段,政策支持持续推出,有望对需求持续形成支撑。综合海外利率流动性与国内经济政策边际优化,推荐增加恒生科技配置,推荐长期竞争格局清晰的腾讯、短期边际变化明显的美团和京东集团、AI驱动增长的美图公司。 风险提示 政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行导致广告大盘增速不及预期的风险,游戏公司新产品不能如期上线或者表现不及预期的风险等。