您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[安信证券]:计算机行业周报:GPT~4V发布,多模态为AI注入新动能 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业周报:GPT~4V发布,多模态为AI注入新动能

计算机行业周报:GPT~4V发布,多模态为AI注入新动能

本报告版权属于安信证券股份有限公司,各项声明请参见报告尾页。 1 2023年10月09日 计算机 行业周报 GPT-4V发布,多模态为AI注入新动能 证券研究报告 投资评级 领先大市-A 维持评级 首选股票 目标价(元) 评级 行业表现 资料来源:Wind资讯 升幅% 1M 3M 12M 相对收益 2.5 -8.9 29.3 绝对收益 0.8 -12.8 25.7 赵阳 分析师 SAC执业证书编号:S1450522040001 zhaoyang1@essence.com.cn 夏瀛韬 分析师 SAC执业证书编号:S1450521120006 xiayt@essence.com.cn 相关报告 新型工业化风起,工业软件和工业互联网再迎催化 2023-09-25 打造国产计算产业,华为战略布局践行信创 2023-09-18 四大因子共振,信创或迎边际加速 2023-09-18 华为新机发布,带动计算机三大投资增量 2023-09-11 计算机行业2023年中报总结 2023-09-04 OpenAI发布GPT-4V,大模型交互能力进一步提升 9月25日,OpenAI发布论文《GPT-4V(ision) System Card》,GPT-4V允许用户输入图像并结合文本prompt进行输出。同日,OpenAI在官网宣布,对ChatGPT进行重磅升级,实现看图、听声音、输出语音内容三大功能。OpenAI发布了一个ChatGPT的多模态短视频,从视频中可以看出,在融入了GPT-4V的能力后,ChatGPT具备了从图像中进行识别和推理的能力,多模态注入新的动能。 9月29日,微软研究团队发布《The Dawn of LMMs:Preliminary Explorations with GPT-4V(ision)》,这是一篇长达166页的GPT-4V测评报告,详细测评了GPT-4V在十大任务上的表现,分别为:开放世界视觉理解(open-world visual understanding)、视觉描述(visual description)、多模态知识(multimodal knowledge)、常识(commonsense)、场景文本理解(scene text understandin)、文档推理(document reasoning)、写代码(coding)、时间推理(temporal reasonin)、抽象推理(abstract reasoning)、情感理解(emotion understanding)。其中的亮点在于: 1)图像识别:GPT-4V既能识别知识型的公众人物和地标,也能够识别专业领域的知识(如肺部影像的判定),还可以识别人类的表情从而做出情感判断。 2)图像推理:GPT-4V可以实现相似图片“找不同”的功能,甚至可以做出IQ测试中的图形推理问题。 3)动态内容分析:GPT-4V可以根据一组有时间顺序的图片,还原出事件的过程,甚至预测接下来可能发生的事情,这已经具备了从图像向视频分析的能力。 AI大模型向多模态迈进,全产业链有望注入新动能 我们认为多模态更符合通用AGI的演进方向,也有助于大模型算法对世界的多维度认知,从而促使算法能力的进一步改善,有望带来更多的算力消耗和应用场景,同时对AI算力的可视化和算力优化的需求也将进一步提升。因此,AI向多模态迈进,有望促使全产业链的需求提升,建议关注:1)AI算力:润泽科技、浪潮信息、中科曙光、神州数码、拓维信息、华勤技术等;2)AI多模态算法和应用:科大讯飞、金山办公、万兴科技、虹软科技、当虹科技、拓尔思、同花顺、大华股份等;3)AI算力可视化:浩瀚深度、恒为科技等。 -10%0%10%20%30%40%50%60%2022-102023-022023-062023-09计算机沪深300999565742 本报告版权属于安信证券股份有限公司,各项声明请参见报告尾页。 2 行业周报/计算机 建议关注 基础工具:普源精电、鼎阳科技、坤恒顺维、中望软件、索辰科技、华大九天。 智能汽车:德赛西威、中科创达、光庭信息、虹软科技、四维图新、万集科技。 工业软件:宝信软件、中控技术、容知日新、赛意信息、能科科技、鼎捷软件。 数字能源:朗新科技、国能日新、南网科技、龙软科技、国网信通、远光软件。 人工智能:金山办公、科大讯飞、海康威视、商汤-W、奥比中光、寒武纪。 网络安全:深信服、安恒信息、启明星辰、天融信、奇安信-U、信安世纪。 风险提示 1)宏观经济变化影响企业信息化支出;2)财政与货币政策低于预期;3)供应链波动加大,影响科技产业发展。 eVPBiWHXqRmNrQqR7NaO7NtRoOoMmPlOrQrRfQrRuNaQrQtQNZsOmRNZmOrO 本报告版权属于安信证券股份有限公司,各项声明请参见报告尾页。 3 行业周报/计算机 内容目录 1. 本周行业观点 ............................................................... 4 2. 市场行情回顾 ............................................................... 5 本周板块指数涨跌幅 ................................................... 5 本周计算机个股表现 ................................................... 6 3. 重要行业新闻 ............................................................... 7 智能网联汽车 ......................................................... 7 工业软件与数字化转型 ................................................. 7 数字经济 ............................................................. 8 数字金融 ............................................................. 8 AI大数据 ............................................................. 8 4. 重点公司动态 .............................................................. 10 工业软件 ............................................................ 10 智能网联车 .......................................................... 11 数字金融 ............................................................ 11 数字能源 ............................................................ 11 网络安全与数据安全 .................................................. 11 基础软硬件 .......................................................... 12 基础工具链 .......................................................... 12 天空信息化 .......................................................... 12 风险提示: ................................................................... 12 图表目录 本周各行业涨跌幅统计 .................................................... 5 表1: 本周各类指数行情统计 ................................................... 5 表2: 本周计算机个股涨跌幅统计 ............................................... 6 表3: 本周陆港通持股情况统计 ................................................. 6 本报告版权属于安信证券股份有限公司,各项声明请参见报告尾页。 4 行业周报/计算机 1.本周行业观点 OpenAI发布GPT-4V,大模型交互能力进一步提升 9月25日,OpenAI发布论文《GPT-4V(ision) System Card》,GPT-4V允许用户输入图像并结合文本prompt进行输出。同日,OpenAI在官网宣布,对ChatGPT进行重磅升级,实现看图、听声音、输出语音内容三大功能。OpenAI发布了一个ChatGPT的多模态短视频,从视频中可以看出,在融入了GPT-4V的能力后,ChatGPT具备了从图像中进行识别和推理的能力,多模态注入新的动能。 9月29日,微软研究团队发布《The Dawn of LMMs:Preliminary Explorations with GPT-4V(ision)》,这是一篇长达166页的GPT-4V测评报告,详细测评了GPT-4V在十大任务上的表现,分别为:开放世界视觉理解(open-world visual understanding)、视觉描述(visual description)、多模态知识(multimodal knowledge)、常识(commonsense)、场景文本理解(scene text understandin)、文档推理(document reasoning)、写代码(coding)、时间推理(temporal reasonin)、抽象推理(abstract reasoning)、情感理解(emotion understanding)。其中的亮点在于: 1)图像识别:GPT-4V既能识别知识型的公众人物和地标,也能够识别专业领域的知识(如肺部影像的判定),还可以识别人类的表情从而做出情感判断。 2)图像推理:GPT-4V可以实现相似图片“找不同”的功能,甚至可以做出IQ测试中的图形推理问题。 3)动态内容分析:GPT-4V可以根据一组有时间顺序的图片,还原出事件的过程,甚至预测接下来可能发生的事情,这已经具备了从图像向视频分析的能力。 AI大模型向多模态迈进,全产业链有望注入新动能 我们认为多模态更符合通用AGI的演进方向,也有助于大模型算法对世界的多维度认知,从而促使算法能力的进一步改善,有望带来更多的算力消耗和应用场景,同时对AI算力的可视化和算力优化的需求也将进一步提升