对等关税新质生产力低空经济 DeepSeek AIGC 人形机器人智能驾驶大模型固态电池半导体银发经济

2024年中国大模型行研能力年中评测

信息技术2024-08-26沙利文Y***

AI智能总结

中国大模型行研能力年中评测（摘要版）

背景与概述

背景：自2022年底ChatGPT公开发布以来，AI技术从科技企业的闭门探索走向全人类视野，预训练大模型成为国家技术和产业的关键战略要素。中国地区涌现了数百个预训练语言大模型，参与者包括顶尖学术研究机构和互联网科技企业。
评测目的：沙利文与头豹研究院联手，基于最新的大模型能力，梳理并评估市场上领先的多家大模型，深入分析它们的当前行研综合能力。

大模型技术与应用

大模型定义：大模型是自然语言处理领域中深度学习技术的高阶应用，通过深度训练吸纳并提炼丰富的语言学知识与语义内涵，具备高度精准的自然语言理解与生成能力。
应用场景：广泛应用于机器翻译、智能问答、文本摘要等领域。
技术演进：从基于深度神经网络训练，到预训练与微调结合，再到预训练结合提示训练，这一过程标志着自然语言处理在模拟人类思维交流方面的重大突破。

行研能力评测

评测方法：
- 时间区间：2023年7月15日至8月2日。
- 评测模型：16个中国领先大模型。
- 评测内容：涵盖报告撰写能力、基础能力和行业理解能力。
- 评测工具：8-D方法论，由八个核心模块构成，形成系统化、全面性的行业深度分析框架。
- 评测维度：报告撰写（20篇不同行业报告撰写，300道问题），模型基础能力（6大文本产出核心能力，60道问题），行业理解（15大核心行业，180道问题）。
评测结果：
- 报告撰写能力：逻辑推理、总结提炼、知识能力、角色扮演、意图理解、长文本生成六大基础能力。
- 行业理解能力：涵盖政策分析、行业定义、行业分类、发展历程、产业链分析、市场规模、竞争格局等15大核心行业。
- 基础能力：模型基础能力包括逻辑推理、知识能力、意图理解等。

大模型在行研中的作用

效率提升：大模型通过AI辅助，显著提升行业研究的效率和质量，减少信息检索和文本检查的时间投入。
准确性增强：通过信息溯源系统和写作规范，降低信息溯源困难和信息合规风险，提高文本准确性和撰写效率。
创新赋能：大模型在报告撰写、行业理解和基础能力方面展现出强大的创造力和准确性，助力行业研究向更高效、精准的新范式转变。

结论

大模型在中国行研领域的应用：中国大模型在行研领域的应用价值显著，通过提升研究效率和质量，推动行研领域的创新与变革。
未来展望：大模型将继续在行研领域发挥重要作用，引领行业研究进入更高效、精准的新范式。

以上是对提供的文字内容的总结归纳，突出了主要内容和关键数据。

2024年中国大模型行研能力年中评测（摘要版） AI变革行业创新发展 2024EvaluationofChinaLLMinIndustryResearchMid-YearReport 评测| 人工智能系列研究 OPPORTUNITYGROWTHINVESTMENTINSIGHTS 报告提供的任何内容（包括但不限于数据、文字、图表、图像等）均系头豹研究院独有的高度机密性文件（在报告中另行标明�处者除外）。未经头豹研究院事先书面许可，任何人不得以任何方式擅自复制、再造、传播、�版、引用、改编、汇编本报告内容，若有违反上述约定的行为发生，头豹研究院保留采取法律措施、追究相关人员责任的权利。头豹研究院开展的所有商业活动均使用“头豹研究院”或“头豹”的商号、商标，头豹研究院无任何前述名称之外的其他分支机构，也未授权或聘用其他任何第三方代表头豹研究院开展商业活动。 1 头豹研究院弗若斯特沙利文咨询（中国） 大模型是自然语言处理领域中深度学习技术的高阶应用，其通过对海量文本数据的深度训练，能够全面吸纳并提炼�丰富的语言学知识与语义内涵。这类大模型通常拥有庞大的参数规模，动辄数亿乃至数十亿参数，从而具备了高度精准的自然语言理解与生成能力，几乎能够实现与人类的无障碍交流。其广泛的应用场景涵盖了机器翻译、智能问答、文本摘要等多个领域。从技术发展的视角来看，语言模型的演进路径具有重要的启示意义。最初，模型基于深度神经网络进行训练；随后，业界逐步引入了预训练与微调相结合的模式以提升模型性能；而当前，最前沿的范式已转向预训练结合提示训练，这一转变标志着自然语言处理在模拟人类思维交流方面的又一重大突破。 大模型能够显著增强研究报告的编写效率，通过采纳精细化的询问策略，分析师在研究过程中能够实现效率的最优化。此外，这一模型还能够提供全面的文本编辑支持，包括校正、查重、以及文风润色等功能，从而确保分析师提交的工作成果达到更高的质量标准 大模型技术潮流兴起催生中国大模型百花齐放。沙利文与头豹研究院联手对16个大模型进行综合评估，以深入梳理中国大模型在行研领域的应用表现，为各界提供清晰深入的视角，以应对预训练大模型引发的人工智能浪潮自2022年底ChatGPT向公众发布以来，AI技术从科技企业的闭门探索正式走向全人类的视野。经过一年多的发展，基于GPT起源的大模型技术已成为国家技术和产业的关键战略要素，受到国际高度重视。在此背景下，中国地区涌现了数百个预训练语言大模型，参与者涵盖了顶尖学术研究机构和互联网科技企业。为梳理中国大模型能力梯队与企业背景，沙利文头豹研究院于2023年12月首次对大模型行研能力进行了多维度综合评测。半年后，随着大模型能力持续迭代升级，市场竞争格局经历多轮洗牌，当下的大模型市场已焕然一新。不仅百度、阿里、腾讯等互联网大厂继续引领市场，诸如Moonshot、零一万物、百川智能等大模型创业企业也纷纷崭露头角，挑战传统大牌互联网厂商的地位。为反映当前最真实的竞争态势，沙利文头豹研究院与2024年8月，基于最新的大模型能力，梳理并评估了市场上领先的多家大模型，深入分析它们的当前行研综合能力。 1 研究目的基于数字行研解决方案的研究和实践基础，头豹研究院联合沙利文凭借百人分析师团队匿名投票机制，筛选了16个大模型，进行了多维度的综合评估，旨在全面了解并系统梳理中国大模型参与者在行研领域的应用表现。 研究目标 •了解中国大模型在行研领域的应用价值 2 •探析中国大模型在行研领域的综合表现 •梳理中国大模型的参与者现状 •评估中国大模型行研领域的发展潜力 本报告的关键问题 •参与者发展现状：中国大模型的参与者有哪些？在行研领域的发展现状如何？ •行研应用表现：中国大模型在行业研究领域的实际应用表现如何？ •报告撰写能力：中国大模型在撰写行业研究报告方面的表现能力如何？ •模型基础能力：中国大模型逻辑推理能力、类比迁移能力等基础能力表现如何？ •行业理解能力：目前中国大模型在不同行业下的理解能力以及表现如何？ 4 中国：人工智能系列大模型行研评测|2024/08 Chapter1 大模型行研能力评测背景及方法 •行业研究通过深入分析特定行业的定义、竞争格局和市场规模等关键要素提供深刻的洞察和见解。其方法论涵盖了从宏观的产业层到微观的产品层的全面分析，对企业战略规划、政策制定以及金融决策具有重要影响中国大模型行研能力评测——行研背景概述，行研背景概述价值体现企业规划政务服务金融决策教育培训新闻传媒… 研究路径行业定义行业分类发展历程行业特征产业链分析市场规模政策分析竞争格局千行百业互联网金融医疗教育制造零售泛娱乐房地产农林牧渔采矿旅游 … 行研价值链 行业研究通过深入分析，为企业战略规划和决策提供关键洞察和支持行业研究是一项全面分析特定行业发展现状和市场动态的深入过程，涵盖行业定义、分类、竞争格局、市场容量等关键维度。分析师通过深入研究，提供深刻的洞察和有价值的观点，为企业战略规划、政策制定、金融投资决策以及教育培训等多个领域提供重要支持。行研范围宏观维度分析中观维度分析政策经济环境法律发展历程产业链分析发展特征市场规模竞争格局产业层行业层产品层重要程度高重要程度低 行业研究涵盖从宏观的产业层到微观的产品层，各层级决定着相应的研究方法，研究方法论囊括外部宏观因素和内部微观细节的全面分析在行业研究中，产业层、行业层和产品层分别代表宏观经济的不同层次：产业层涵盖具有相似特征的行业群体，行业层侧重于特定行业的市场动态和企业状况，而产品层则深入探讨具体产品或服务的设计、功能及市场定位。研究方法论随着这些层次的宏观到微观差异而有所调整，宏观层面关注政策、经济、环境等因素，而微观层面则包括发展历程、产业链分析等更为细致的内容。 •从基础数据收集到深度分析输出，传统行业研究流程面临工具更新滞后、团队知识传承困难、信息溯源复杂性以及研报质量控制等重大挑战，这些问题共同制约了行业研究的产出效率和创新能力，限制了其发展潜力一手数据行业专家访谈、消费者调研（问卷，圆桌）、自行监测数据…… 建模行业规模与预测模型传统工具Excel 撰写行业定义、特征、分类、历史、政策、中国大模型行研能力评测——传统行研发展痛点分析产� 调研二手数据统计局数据、文献、网页、垂直媒体、招股书、第三方研报、专业数据库…… 分析制图产业链、竞争格局研究成果研究报告、演讲稿、招股书行业章节、视频……. 传统行研发展痛点 1生产工具停滞 PPT和Word仍是生产核心工具，20年来没有更新新的行研生产工具 2团队知识难以复用行业人员流动性较大，新人成长周期较长，分析师掌握的经验和知识复用性差 3溯源难考证面对海量信息和时间成本，信息来源难以考证，信息合规无法全面保障 4质量把控难度高质控人员缺乏专业撰写技能，而专业分析师则通常无暇进行广泛质控行研发展痛点 传统行业研究面临工具滞后、知识传承困难、信息溯源复杂和质量控制难度高等挑战，严重制约其产�效率和创新能力传统行业研究的产�流程包括三个步骤：首先是基础调研，聚焦于一手和二手行业数据的收集；其次是数据加工，涉及整理逻辑、验证数据真实性，并对关键信息进行可视化处理；最后是产�结果，确保全文逻辑一致、可视化清晰并且观点合理。在实际操作中，行业研究面临多个挑战：1）工具更新停滞，自互联网兴起以来，行研主要依赖网络检索和办公软件，近20年未见显著革新；2）团队知识难以复用，由于高人员流动性和新成员培养周期长，分析师的经验和知识传承困难；3）信息溯源和合规性考量复杂，在应对海量信息和时间成本压力下，信息来源和合规性难以全面保障；4）质量控制难度高，质控人员缺乏专业撰写技能，同时专业分析师缺乏时间进行广泛质控，导致质量监控极为困难。这些核心挑战共同影响着行研的产�效率和创新，阻碍行研进一步发展。 •数字行研解决方案，结合标准化工具和先进的大模型技术，有效克服了传统行业研究的核心制约因素，显著提升研究的精度和效率，并引领行业研究进入一个效率更高和质量更优的新产出范式中国大模型行研能力评测——数字行研革新数字行研革新（以头豹脑力擎为例）数字行研全面赋能信息调研综合分析结果呈现开源 Web 3.0 协同创作词条接入智能技术工具提效辅助分析师 AI 生成 AI 续写协同智能数字头豹写作系统身份“脑力擎” 赋能头豹研报产�提质增效 AIGC 文本创作 AI 改写可信高效 AI 赋能 AI 检索标准体系化培训工具创作沉淀，数据资产化智能AI 研报生成审核 数字化行研解决方案通过标准化工具和大模型技术，解决了行业研究的核心难题，提高了研究质量和效率，为行业分析带来了高效、精准的新范式数字化行研解决方案为行业研究带来范式革新。该系统通过引入一系列标准化工具，如精准的信息溯源系统和写作规范，极大降低了行业研究的门槛，提升了撰写效率，并简化了质量控制流程。此外，数字行研基于大模型的强大底层支持，为分析师提供AI辅助工具，包括专家访谈、智能检索、查重、校对和改写功能，有效减少信息检索的难度，提升文本的准确性和撰写效率，同时加速分析师的专业成长。数字行研解决方案不仅解决了传统行业研究中的关键痛点，如信息溯源困难、严峻的质控挑战、知识低复用率和工具更新滞后，还借助大模型技术推动行业研究质量和分析师成长速度，引领行业研究向更高效、精准的新范式转变。 •大模型在数字行业研究中扮演核心角色，其功能特性极大提升了研究的效率和质量。本研究聚焦于挖掘中国大模型在行业研究中的实际应用和优势，了解大模型当前的能力边界，以推动行研领域的创新与变革中国大模型行研能力评测——大模型赋能行研大模型行研赋能运用大模型的互联网检索访问功能，结合精准的提问策略，帮助分析师定位关键信息，从而提升资料搜索效率超60% AI资料检索通过使用大模型的文字生成功能，结合恰当的提问问题，让大模型帮助产�结构化内容，提高研报的产�效率50% AI内容生成利用大模型的改写、续写和查重功能，可以显著减少错别字、病句和重复内容，从而提升文本质量和可读性，同时减少分析师在文本检查上的时间投入，降低超过70% AI文字校对通过利用AI大模型进行行业专家访谈，分析师可以迅速掌握行业的核心信息和精确的定义、分类，从而将初期行业研究阶段的时间缩短30% AI专家访谈大模型赋能行研 大模型在数字行业研究中扮演核心角色，其功能特性极大提升了研究的效率和质量。本研究主要聚焦于中国大模型在行业研究中的实际应用和优势，知晓大模型的能力边界，旨在推动行研领域的创新与变革作为数字行研的关键支撑，大模型通过其创作、生成、改写和检索等核心功能，全方位推动行业研究向前发展。首先，大模型扮演第三方AI专家角色，协助分析师在研究初期进行框架搭建和内容创作，有效减轻案头工作负担。其次，通过与分析师的有效互动，大模型助力生成结构化内容和洞察，显著提高基础内容的产�效率。进一步，它通过减少文本错误和重复内容，优化校对流程，提升产�质量。最后，大模型能够快速处理海量数据，提供实时信息检索，增强分析师在有限时间内获取全面信息的能力。鉴于此，深入了解中国大模型行业的发展态势和技术创新对引领数字行业研究新范式至关重要。本研究的目标是全面评价中国领先的大模型技术，深入分析其在行业研究领域的实际应用和优势，全面审视大模型对行业研究发展的影响，以促进数字行业研究的创新和变革。 •大模型在辅助行业研究中，通过“两个创新”和“三个准确”有效赋能行业分析。本次评测将通过报告撰写、行业理解和基础能力三方面测试，全面评估大模型表现，甄别出最能有效辅助分析师生成高质量内容的大模型中国大模型行研能力评测——大模型赋能行

点击免费查看完整报告