您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[腾讯]:理旧基,换新羽——大模型构筑传媒新质生产力 - 发现报告

理旧基,换新羽——大模型构筑传媒新质生产力

2024-03-25腾讯我***
AI智能总结
查看更多
理旧基,换新羽——大模型构筑传媒新质生产力

理旧基,换新羽——大模型构筑传媒新质生产力 曾亮腾讯云智慧传媒行业中心技术总监 面对新事物,人们往往容易高估短期而低估长期。前者让我们焦虑或者沮丧,后者则让我们忽视和错过它带来的颠覆! 大模型适配与传媒行业落地场景 人类与AI协同的5个模式/阶段 谷歌对通用AI(AGI)能力的分级 初级(Emerging)要求与不熟练的人类差不多或略胜。对应狭窄AI中的早期专家系统,通用AI 中的大型语言模型。 熟练(Competent)要求超过50%熟练成人的表现。对应狭窄AI中的语音助手等。尚无通用AI 达到。 专家(Expert)要求超过90%熟练成人的表现。对应狭窄AI中的语法检查、图像生成模型 等。尚无通用AI达到。 大师(Virtuoso)要求超过99%熟练成人的表现。对应狭窄AI中的围棋软件AlphaGo等。尚 无通用AI达到。 超人(Superhuman)要求超过100%人类的表现,做到人类根本无法企及的任务。对应狭窄AI中 的AlphaFold蛋白结构预测等。 大模型时代的全新升级 全面迭代更新AI能力,拥抱大模型 •“后面要结合我们的场景,把混元大模型应用到各个场景中,……结合到我们所有的产品里面提升效率。” 大模型能在专业模型的基础上,极大提升AI在传媒应用中的价值,产生新的应用场景。 ——马化腾(2024) 行业化专属化 •“企业的大模型应用需要综合考虑行业专业性、数据安全、持续迭代和综合成本等因素。基于行业大模型,构建自己的专属模型,也许是企业更优的选项。“ 所有的媒体都值得拥有自己的大模型未来每个媒体都将拥有多个自己专属的大模型,这些大模型来自每个媒体自身的数据和积累,并专属化部署。 ——汤道生(2023) 自有大模型是未来媒体的核心竞争力 •“在每个特定场景里100%的解决客户问题,而不是试图找到1个的产品来解决每个场景70%-80%的问题。”——吴运声 基于上述专属模型塑造的(智能体)“数字员工”ToG、ToB、ToC提供全新服务。这类大模型能力,是未来媒体最核心的数字资产和竞争力。 大模型工具的场景化使用案例——腾讯会议小助手 大模型对媒体发展的机遇 通用大模型与传媒垂直领域的结合,将会对产业发展产生真正深远的影响 知识引擎 内容创作 搜索推荐 风控模型 视频标签、跨模态检索、多模态检索、小样本特征、广告投放、用户运营、内容运营…… 内容交互、知识服务、栏目助手、专家咨询、政策助手、心理咨询、智能助教、培训辅导…… 访谈提纲、选题助手、文案初稿、新闻综述、分镜脚本、视频合成、稿件插图、广告创意…… 视频审核、文本审校、评论审核、账号安全…… 应用开发 精调模型 腾讯云行业大模型 媒体行业内容生成场景能力进展 大模型强大的文字内容生成能力 用户可以通过传入不同的参数控制生成内容的类型,并通过自然语言给模型以内容生成的指令,可以满足多种场景的文本生成需求,包括但不限于文章写作、营销文案、视频脚本、电商文案、纪要整理、翻译等。目前支持以API形式接入。 视频生产——无中生有&有中生有 无中生有:细节、效果、指令遵循 有中生有:细节、物理规律的理解 基于内容理解+重组Prompt指令的有中生有 安全、合规的解决传媒供给侧内容不足与传播的问题 媒体行业内容检索场景能力进展 传统内容检索的限制 需要引入新的技术能力来升级检索体验,提高检索效果,作为基于编目全文检索的必要的补充 跨模态检索的场景和检索流程 传统的标签检索到自然语言理解的跨模态检索 传统的标签检索的瓶颈 人物形象描述:发型、服装、性别、年龄等 •查询描述受限:仅支持单要素,无法支持精细化描述或者多要素组合描述的匹配•检索召回不全:检索范围仅限于标签,无法召回兼容相近的描述的检索,无法深入理解多标签的关系 知识引擎推动服务创新 举个例子:腾讯乐享 参与者 传播者 见证者 知识引擎服务示例 3增强检索生成的回答 1基底模型通用回答 2导入知识文档 •支持导入word、PDF等格式•支持对表格、图片等进行解析 基于LLM+RAG框架,做深做透全链路能力 知识切分2 知识解析 用户问题 •通过长文本大模型对文本进行多级语义拆分(标题、副标题、段落等) •OCR解析大模型准确率提升25% 能力 •业内首个的长文本切分大模型,比传统切分方式准确率提升x%•将OCR识别的标题提供给切分模型,进行多级切分,避免语义截断,提升检索及阅读理解准确率 •8种元素:段落、表格、公式、图标等;•算法能力:版面分析、元素排序 场景 端到端问答 3知识检索 模型阅读理解&答案生成 •深入上百个客户的应用场景,亿级行业数据针对性训练 •Embedding模型从512字提升到4k,支持多套检索策略 1.在国际知名的C-MTEB榜单上,模型在8个中文任务上可以达到效果最优 数字问答 操作步骤问答 190天,赎回手续费是多少?” 表格问答 推理比较 “我想在南山西丽街道组每月每平方60元左右的办公场地,有什么推荐” “标准版和旗舰版差多少钱?” 2.使用向量关键词混合检索策略、表格文字混合检索策略等,提升模型在多场景下的应对能力和鲁棒性 大模型RAG在媒体的应用场景 02 01 04 03 内容交互 栏目服务 专业服务 本地服务 学习既往王牌栏目的内容,接受观众对话式咨询,提升栏目关注度,同时拉动私域流量。 财经类节目,接受财经类问答,接受输入财报等PDF,输出简报或总结分析。 接受本地观众或外地游客的相关资讯,提供美食、旅行、酒店、特产、外卖等服务。 阅读理解,用户可以对发布的报道提出问题,要求摘要总结,找到和我观点一致的受众等。 06 05 08 07 政策咨询 四史百科问答 外挂大模型RAG的数字人,多轮交互、强意图理解,不再“不知道”和“乱答”。 提供《党史》、《新中国史》、《改革开放史》、《社会主义发展史》等百科问答。 输入单位政策文件、技术资料等,接受员工问答型资讯。 接受本地入学、购房、社保等各类政策咨询服务,拉动私域流量 上车! 关注智慧传媒公众号