您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[腾讯]:腾讯云 X DeepSeek产品技术方案分享 - 发现报告

腾讯云 X DeepSeek产品技术方案分享

2025-03-05腾讯惊***
AI智能总结
查看更多
腾讯云 X DeepSeek产品技术方案分享

腾讯云XDeepSeek产品技术方案 ——国内率先提供DeepSeek联网搜索 一、腾讯云知识引擎+DeepSeek ——免部署,分钟级搭建应⽤ 目二、腾讯云TI平台+DeepSeek 录——灵活精调和部署私有DeepSeek 三、腾讯云向量数据库+DeepSeek ——构建⾼质量国产「纯⾎」RAG应⽤ 腾讯云知识引擎+DeepSeek ——免部署,分钟级搭建应⽤ 腾讯云全栈AI服务上线DeepSeek模型 通过DeepSeekAPI和应用开发平台多级能力,满足用户各类需求 (满血版)(零代码) API服务:面向资深开发者&企业开发者 知识引擎应用开发平台:面向初级开发者&企业运营 腾讯云DeepSeekAPI服务调Ⴈ——安全、ۚ可Ⴈ •ᱎػԍ$—;ਏ؎ᕆ֎ᇱ;α/ᤒ཮ਏ؎$,ഗകᨗ᧦]ใ׻Çᕆ֎ᐟ਌Çूഐ֓。 •آᐮس@ඩᠴ൉ʐஆƒʐqmbqddingʐ]ᦪ౯ԟ÷ഐ֓᧰ៈᐟ៰,;ի;αÇूAIα֓。 •APIഐ֓അጞ;ʐࣞAʐೃᅠ;྿᥃Xୢ᫁ᅠ,آЦਨઔ୘ࣻ྿᥃࣮ୁᰱຢ;౪ம᣻ϣÇू¢؎; •ԑࣻOpqnAIᇱAPI௳Дאᡓ,آੳᨛᢣᅠ[ᳵ。 腾讯云大模型应用开发平台“知识引擎” ——免部署,分钟级搭建应用 目标客户和场景: •面向具备简单开发能力的初级开发者、企业运营人员; •可通过模型选择、提示词模版、RAG配置能力等加速大模型应用构建,实现与自身业务系统的无缝对接。 主要优势: •国内率先支持「DeepSeek满血版+私域知识管理+实时搜索」于一体; •分钟级搭建大模型应用; •集成私域知识库,让AI更专业,支持复杂图文混排文档解析。 6 接⼊搜狗搜索增强API,⼀键开关,即可让DeepSeek实时获取互联⽹最新资讯,提升时效性和回答准确度。 腾讯云TI平台+DeepSeek ——灵活精调和部署私有DeepSeek TI平台产品核心能力 面向实战的一站式大模型精调部署解决方案 大模型精调 快速试一试: 零代码一键部署大模型,网页问答体验推理效果 AI建模部署 精调训练: 低代码、灵活自定义两种精调模式自由选择 数据训练调试部署应用 数据构建 数 预置3大类精调数据 据处理pipeline 中 心数据标注 CV,大模型相关的标 注工具 多种训练工具:具备周期调度能力的可视化建模,低门槛深度学习场景化工具,交互式代码开发工具,专业的通用任务调度工具 训 练 工 分布式稳定训练:支持多机多卡大规模训练,故障自动重启续训镜像制作:基于jupyter的高效自定义镜像制作工具 坊 训练指标监控:丰富的指标监控及告警,覆盖网络及GPU算力 内置训练加速:全新升级Angel训练框架加速能力,性能提升30%精调数据配比训练:内置100+任务类型精调配比数据 分布式推理: 解决大参数量模型部署,提供超长上下文窗口 模 型内置推理加速: 部全新升级Angel推理加速能力,加速比可达2倍 署大模型调用: 统一的大模型调用API及体验工具,大幅缩短业务接入大模型能力周期 自研混元大模型 从零训练自主创新的通用大模型 7b13b70b不同参数量级 自研行业大模型 金融/汽车/医疗,提升垂类任务性能 支持知识增强、实时更新知识库 AI资产管理 开源大模型 DeepSeek全系 Llama/baichuan/chatglm/Qwen等 AI框架 Pyspark,pytorch,vllm,megatron等通用训练框架 triton,vllm,sglang,sd,pmml等通用推理框架 资源管理 云服务器 公有云HCC高性能服务器,一键纳管 私有化服务器,支持X86+ARM统一纳管 分布式文件存储 公有云分布式文件存储CFS/Turbofs/Goosefsx 私有化NFS协议存储NAS/CSP 容器底座 公有云自带容器底座TKE 私有化自带容器底座TCS TI平台DeepSeek使用场景 DeepSeek全系支持 DeepSeek企业级精调与推理 前端应用 AI业务系统 知识引擎应用 数智人 智能客服 专属模型产出 知识引擎 开发对接 DeepSeek联网助手 DeepSeek全系模型精调 快速基于垂直领域高质量数据,进一步提升模型在特定领域的效果基于DeepSeekR1蒸馏较小模型 实现知识迁移。大幅降低推理成本,在保证效果的同时提升响应速度。 私有API调用 文档问答知识摘要 文档解析文档拆分 向量检索多轮改写 意图识别 RAG知识文档 知识问答 DeepSeek系列模型 工作流 联网搜索 腾讯云精调知识大模型 配置项 大模型API 模型服务 混元系列模型 行业大模型 客户专属模型 TI平台 兼容OpenAI接口规范 私有API(公网、VPC) 客户专属模型 其他开源模型 混元系列模型 DeepSeek全系模型 模型部署 模型训练 DeepSeek满血版 DeepSeek全系模型部署 从算力,模型,调用接口完全自主可控的部署方案,服务于前端AI应用 专属模型 全参/LoRASFT DeepSeek蒸馏版模型 蒸馏 其他开源模型 DeepSeek部署方案 DeepSeek全系大语言模型支持服务部署 DeepSeek全系列 一体化服务管理工具及推理加速能力 核心收益 R1-Distill-Llama-70B R1、V3满血版 一体化服务管理工具 长上下文(64~128K) Angel 超大模型启动加速 推理加速 服务管理 与运营 指标监控 鉴权/限流 流量分配 实时掌握服务性能、调用量、资源消耗等关键指标 自动调度符算力资源,弹性灵活应对业务峰谷 容器调度 HPA扩缩容定时扩缩容组合扩缩容 提供多种扩缩容策略,满足不同场景的灵活资源需求 算力调度 纳管资源组按量计费算力池 大模型专属GPU算力CPU及传统GPU算力包月独享按需按量 R1-Distill-Qwen-14B 模型量化 私有API服务调用 R1-Distill-Llama-8B 并行优化 高并发、高可用 R1-Distill-Qwen-7B Sampling及batch优化 企业级鉴权流控 R1-Distill-Qwen-1.5B 算力投入持续降低 R1-Distill-Qwen-32B 并行解码 独享GPU算力集群 DeepSeek精调方案 满血版模型一键精调 •256卡H20 •全参SFT •8小时 •全流程训推⼯具链,注重实战灵活性、扩展性 •内置Angel加速能⼒,切实提升训推效率 •训练过程⽩盒化、资源碎⽚监控、训练资源调度灵活可配,切实提升资源利⽤率 R1、V3满血版 DeepSeek全系大语言模型支持SFT •全参+LoRA双模式 •低至1卡A10 蒸馏后模型多模式精调 R1-Distill-Qwen-1.5B R1-Distill-Qwen-7B R1-Distill-Llama-8B R1-Distill-Qwen-14B R1-Distill-Qwen-32B R1-Distill-Llama-70B DeepSeek全系列 注重灵活性、扩展性的生产级大模型精调工具链 核心收益 DeepSeek蒸馏方案 DeepSeek全系大语言模型支持SFT 基于TI平台精调工具链,迁移R1高级推理能力至小尺寸模型,以更低推理成本满足垂直场景下的业务需求 在线服务数据构建数据构建数据构建任务式建模模型评测 R1模型部署 内置R1模型一键部署 R1问题清洗 无关数据过滤剔除 R1推理结果⽣成 R1推理服务调用 构造蒸馏数据集 清洗R1推理结果 蒸馏模型 选择并精调目标模型 效果评估 评估对比模型效果 快速 灵活、易扩展 快速 直观 TI平台的DeepSeek实践 全行业适用、让DeepSeek更好用 启动阶段启动阶段 痛点TI平台价值痛点TI平台价值 不知道怎么基于R1蒸馏模型开源框架繁多,不知道怎么选 内置蒸馏方案,开箱即用内置全系模型,一键精调 开源资源分散,准备周期长解决技术问题,体验效果滞后 内置全系模型,一键部署免费体验,快速验证效果 探索期 痛点 TI平台价值 探索期 痛点 TI平台价值 验证效果链路长,耗时久算力空闲情况多,ROI低 工具链易上手,快速验证效果统一资源纳管,灵活腾挪算力 蒸馏精调服务部署 根据业务量探索资源⽤量 机型差异大,选型难 配置⾃主可控,快速验证并发⽤量 统一资源纳管,灵活切换 稳定期 痛点 TI平台价值 稳定期 痛点 TI平台价值 故障多,无法长时间稳定运行规模扩大,人/物料管理难度高 故障感知修复+监控,高可用细致的资源级权限管控 TI平台×DeepSeek 业务量变化,服务调整难度大算力投入大,优化成本长期存在 一键多副本,快速线性扩缩容持续升级推理加速,降本增效 全周期均可切入使用 面向实战的精调部署平台 腾讯云向量数据库+DeepSeek ——构建⾼质量国产「纯⾎」RAG应⽤ DeepSeek+腾讯云向量数据库:构建高质量国产「纯血」RAG应用 腾讯云向量数据库作为RAG应⽤中的核⼼组件,提供独特的「AI套件」功能,⽤户仅需上传原始⽂档即可快速构建知识库,并可结合腾讯云TiOne或HAI平台快速部署DeepSeek模型搭建⾼质量RAG应⽤,如:企业内部知识库、内外部智能客服、代码助⼿等。 客户选择腾讯云向量数据库的核心依据 「腾讯云向量数据库」源⾃集团内部分布式向量检索引擎OLAMA 提供⾼吞吐、低延迟、低成本、⾼可⽤、弹性扩展的全托管向量检索数据库服务 「首家」获得权威机构 业界Top1的性能 99.99%SLA,免运维领先的一站式AI方案 标准认证 千亿规模、500万QPS、毫秒级响应延迟 替换业务⾃建数据库 (Milvus等) ⾏业独家、⾃研⽂档识别模型 20000 15000 10000 17666 QPS对比 4 3 10525 2 单QPS成本(元/月) 3 性能领先⾏业平均⽔平2倍以上,单QPS成本降低75%,极具性价⽐ 5000 0 3381 128维度 腾讯云向量数据库 1594 768维度 1 1.23 0.77 0.19 0 128维度768维度 腾讯云向量数据库 成本、性能大幅度领先 感谢观看! Thankyou