热门搜索：

阿里巴巴-赵中州-通义AIGC-传媒领域下内容生产到消费的全链路技术实践

文化传媒2024-08-212023第十二届全球TOP100软件案例研究峰会哪***

AI智能总结

通义AIGC在传媒领域的全链路实践

一、背景与趋势

行业变革：新一轮人工智能产业革命推动大模型引领行业应用，如智能办公、智能问诊、智能推荐等。
大模型优势：基础大模型在理解能力、生成能力和推理能力方面表现出色，但仍然存在专业问题和挑战。

二、传媒领域AIGC的应用与挑战

期望与挑战：
- 内容多样化和传播性：有深度有广度。
- 事件实时跟踪和精准表达：准确实时。
- 主流价值观、正确导向：安全稳定。
- 策采编发运全链路协同：可控可干预。
AIGC生产力演进：
- 数据驱动修正经验主义。
- 智能要素的注入与运用：智能生产大幅提升效率，加速多媒体整合与融合。

三、基础大模型的挑战与解决方案

基础大模型的挑战：
- 预训练阶段的数据问题。
- 指令微调阶段的专业问题。
- 反馈对齐阶段的成本问题。
- 上线应用阶段的协同问题。
解决方案：
- 数据清洗与增强：知识对齐的循环增强，事实对齐与比例控制。
- 推理增强：逻辑迁移和多粒度知识对齐。
- 控制增强：稳定立场与鲁棒问答，反事实增强。

四、传媒大模型的实际应用

案例展示：
- 虚拟换装：通过AI技术生成虚拟换装体验。
- 自动化新闻写作：如撰写关于“国泰毛毯事件”的评论分析文章。
- 多媒体生成：文字、图片、视频等多种形式的多媒体内容生成。

五、技术与生态建设

平台建设：
- 阿里云百炼：五级引擎构建一站式大模型服务平台，涵盖生态增强、模型增强、数据增强、应用范式增强。
生态合作：
- 开放三方模型广场，支持多行业模型预训练/微调，提供全面的数据处理和应用服务。

六、总结

未来展望：大模型AIGC将助力媒体四力持续创新发展，包括传播力、引导力、影响力和公信力，为内容生产与消费提供更加丰富、个性化和多元化的体验。

通义AIGC落地探索：传媒领域下内容生产到消费的全链路实践赵中州阿里云飞天实验室 www.top100summit.com 讲师简介赵中州 “•阿里云飞天实验室大模型商业化、数字人内容与互动算法负责人 •十余年人机交互领域经验，阿里小蜜与智慧数字人创始成员在人机对话系统、多模态交互、AIGC等领域有丰富经验 ” •带领团队在相关领域顶会发表论文三十余篇，落地业界首个超过真人转化的电商虚拟主播、首个支持双向交互的手语数字人、首批大模型落地解决方案新一轮人工智能产业革命，大模型引领行业应用百花齐放 MaaS(ModelasaService) 以模型为中心的开发范式传媒智能检索消费者洞察智能制造智能办公智能推荐内容生产自动驾驶智能辅导智能问诊 … 辅助生成零售客服虚拟换装政民咨询行研分析智能角色车载助手学情总结智能随访 … 行业应用解决方案大模型MaaS服务并行计算加速融合算力调度机器学习平台大模型训练大模型服务弹性计算智能计算存储网络安全数据库大数据大模型时代的基础设施零售制造政务金融游戏汽车教育医疗… 公共云专有云 280万+1亿+720亿共同繁荣大模型生态发展社区开发者模型下载量参通义千问开源数 www.top100summit.com www.top100summit.com •内容多样化和传播性->有深度有广度 •事件实时跟踪和精准表达->准确实时 •主流价值观、正确导向->安全稳定 •策采编发运全链路协同->可控可干预传媒领域AIGC的期望与挑战内容介绍 •预训练阶段的数据问题 •指令微调阶段的专业问题 •反馈对齐阶段的成本问题 •上线应用阶段的协同问题基础大模型GAP分析 •数据增强 •事实增强 •推理增强 •可控增强四步骤落地最后一公里 www.top100summit.com 大模型时代下的传媒行业（理想）在传媒行业，AIGC生产力演进呈现以下特点：数据驱动修正经验主义内容产量智能生产大幅提升效率智能要素的注入与运用受AI技术成熟度所限制受内容质量所限加速多媒体整合与融合受产能所限 PGCUGCAI辅助生成AIGC 单一用户体验小范围多用户体验大范围多用户体验元宇宙多用户体验 AIGC，让传媒行业从“数字化”快速走向“智能化” 基础大模型在解决专业问题时依然面临挑战（现实）新闻场景的要求： •事件明确：要求能够还原事件的准确的信息（包含人物、时间、地点、主要矛盾、冲突等） •观点鲜明：在事件之上能够明确的表达观点和态度(立场正确，态度可控，口吻多样，观点丰富) www.top100summit.com 基础大模型在解决专业问题时依然面临挑战帮我围绕“国泰毛毯事件”写一篇评论分析文章策：受众分析、角度定位…采：报道、会议、史料…编：结构、风格、篇幅…发：时间、渠道、传播语… 正文：“如果他们不会说毛毯的英文，那他们就不配毛毯。”有网友日前在社交平台发帖称，在搭乘国泰航空CX987航班时… 更懂你的业务 BasePre-trainLLM InstructiontunedLLM DedicatedLLM www.top100summit.com 帮我围绕“国泰毛毯事件”写一篇评论分析文章你难到我了实际的业务需求不止于此中国的首都在哪里？中国最大的城市是哪个？中国的人口有多少？但可能不是想要的结果白日依山尽黄河入海流突出的预测生成能力中国的首都在哪里？中国的首都是北京更对齐 (helpful,honest,harmless) www.top100summit.com ReinforcementLearning •不稳定，难以掌握，标注成本高 •对齐维度有限（有益/诚实/无害） •对齐不专业（主观性/粒度粗/非专家） 8卡A100 天级别训练 8卡A100 天级别训练强化学习最大化reward的token序列生成分类器预测reward ~1万-10万Prompts ~10万-100万排序标注结合大模型训练过程的挑战分析训练阶段数据集算法算力消耗领域GAP Pretraining 语料过时、有错误、权威性差，专业内容覆盖有限千卡A1002个月左右训练大语言模型预测下一个token 千亿~万亿token互联网公开语料 SupervisedFinetuning •任务专业度不足 •未结合实时信息 •端到端过程不可控 8卡A100 天级别训练大语言模型预测下一个token ~1万-10万标注数据（prompt,completionpair) RewardModelling 参考：AndrejKarpathy'sKeynoteatMicrosoftBuild2023 www.top100summit.com LLMPoweredAutonomousAgents:https://lilianweng.github.io/posts/2023-06-23-agent/ 解决实际问题需要一套复杂系统和大模型配合大模型需要上下游的能力串联解决实际场景问题 1.理解能力 2.生成能力 3.推理能力大模型的关键优势 1.数据+指令 2.记忆(上下文、用户画像) 3.函数(外部系统交互）用好大模型的依赖领域大模型+系统解决方案支撑传媒全链路落地行业目标策采选编发馈环节解决方案专业数据结合内容生成文体构建内容质量态度立场真实性及时性多样化观点表达内容安全准确可溯源主流化态度鲜明公开数据私域数据新闻报道央媒数据主流媒体报道官方评论文章 ……. 采访素材精标数据领袖金句内部规章 ……. 行业模型系统级解决方案行业技能+领域数据知识增强+搜索增强+编辑反馈基础模型基础技能+通用数据 www.top100summit.com 数据增强事实增强推理增强可控性增强细粒度对齐算法多样化数据增广自动化评估过滤外部检索增强主题/切入对齐推理可解释多专家蒸馏干预可控结构可控安全可控构建思路核心优势大模数据清洗型构建评估打分素材补充知识对齐传媒大模型数据精洗比例调整 www.top100summit.com 反馈对齐模型训练数据增强：知识对齐的Cycle-Instruction www.top100summit.com 正向样本构建基于SelfInstruction构建包括如分类、抽取、润色、摘要等任务的SFT数据，提升模型在传媒领域的指令理解能力，缓解新闻领域相关的通用技能遗忘问题 Wang,Yizhong,etal.Self-Instruct:AligningLanguageModelwithSelfGeneratedInstructions.Dec.2022. 反向样本构建基于InstructionInduction新闻反向生成instruction，提升模型写作的文风和文体的专业度，对齐已有范文保障数据质量 ZhouY,etal.Largelanguagemodelsarehuman-levelpromptengineers 事实对齐与比例控制结合不同数据源和不同维度数据，还原写作中的原始素材，避免事实类内容无中生有多源知识对齐 DocumentsWebsitesAudiosandVideosPDF/Word/TXTToText 常见误区事实增强：生产级RAG需要什么 Database RetrievalAugmentedGeneration Building AlsoImportant Query SplitChunk ChunkEmbeddingVectorDB Expansion •Embedding+向量数据库=RAG? •提供给LLM的输入信息越长越好？ •问答效果核心取决于LLM的性能？ QueryRewrite SparseRetrieval ChunkRetrieval Query Ranking Queryembedding LLM Summary QueryQuery www.top100summit.com 推理增强：多粒度知识对齐逻辑蒸馏：CoTDistillation 基于千亿级MOE多模型，结合领域专业维度及范例，拆解思考过程与校验逻辑，增强领域模型推理效果逻辑迁移：CoTTransferring 复用开放域多步推理样本（数学、代码、分析等） "human": 一块7英尺的木板。9英寸长分成3等份。每个部分的长度是多少？\n选项：\n(A)31英寸\n(B)32英寸\n(C) 33英寸\n(D)34英寸\n(E)35英寸让我们先想想。意识流： Assistant:好的，经分析：7英尺9英寸是84+9=93英寸。所以93/3=31英寸或2英尺7英寸。 •切入视角 •文章脉络 •内容要素 •结构组织 •… Human:一块7英尺的木板。9英寸长分成3等份。每个部分的长度是多少？\n选项：\n(A)31英寸\n(B)32 英寸\n(C)33英寸\n(D)34英寸\n(E)35英寸让我们先想想。意识流：好的，经分析：7英尺9英寸是84+9=93英寸。所以93/3=31英寸或2英尺7英寸。请依照分析结果推理出答案。","assistant":"所以，答案是（A）。"] ["system":"","human":"先给出意识流再给出最终答案。如果1卢比在40年内产生9卢比，求单利？\n选项：\n(A)221/8%\n(B)223/2%\n(C)281/2%\n(D)221/2%\n(E)321/2% Assistant:好的，经分析：9=(1*40*R)/100\nR=221/2% Human:先给出意识流再给出最终答案。如果1卢比在40年内产生9卢比，求单利？\n选项：\n(A)221/8 %\n(B)223/2%\n(C)281/2%\n(D)221/2%\n(E)321/2% 好的，经分析：9=(1*40*R)/100\nR=221/2%请依照分析结果推理出答案。 www.top100summit.com Liu,Weize,etal.Mind’sMirror:DistillingSelf-EvaluationCapabilityandComprehensiveThinkingfromLargeLanguageModels.Nov.2023. "assistant": 最终答案：（D）。开源推理任务复用可控性增强：长文写作下的复杂指令遵循大纲可控率低，基于大纲生成的文章差，在结构和一致性上不满足大纲要求多样化学习数据的单一性会使得模型更关注输入素材，难以建立大纲与正文的关联，通过相同输入下的不同写作框架样例来强化模型的一致性对话式学习对齐式学习 www.top100summit.com 在生成每一段大纲下内容时能够将大纲信息进一步提示，从而防止模型由于context太长导致的遗忘。文章生成强对齐【中国高新技术产业发展面临的挑战和压力】我国经济转型升级面临着一系列挑战和压力... 【国家税务总局制定的全流程服务政策的核心理念】全流程服务政策的核心理念是... 【全流程服务政策的具体内容和目的】具体而言，即通过事前精准宣传、事中辅导办理和事后回访答疑的方式... 【全流程服务政策在xx、xx的成功实施情况】以内蒙古鄂尔多斯达拉特经济开发区为例... 【全流程服务政策对高新企业转型升级的意义和作用】全流程服务政策的实施，对于高新企业的转型升级具有重要的意义... 【全流程服务政策实施中面临的挑战及解决办法】然而全流程服务政策的实施还面临一些挑战。首先，税务部门需要加强对政策的解读和培训... 通过构造多轮训练范式，合并大纲生成及 following写作任务，增强任务连贯性大纲

点击免费查看完整报告