对等关税新质生产力低空经济 DeepSeek AIGC 人形机器人智能驾驶大模型固态电池半导体银发经济

腾讯云大数据AI大模型增强及应用，赋能企业智能化转型

2024-09-11腾讯娱***

极“智”搜索腾讯云大数据ESRAG应用实践分享主讲人：任翔 drop_duplicates算子调优文本向量化调优 mapPartition 去重任务优化热键数据发现及打散过滤任务加速 input文件大小优化过滤与压缩调优 DLC语料数据Spark预处理最佳实践覆盖预清洗、训练数据拼接与标记化等阶段的spark参数调优最佳实践方案产品优势4：LLM训练语料数据预处理业界最佳实践 URL过滤文本压缩文档级别过滤近似去重绝对匹配去重文本向量化训练数据网络爬取数据 01 文本准备 02 文本过滤 03 去重处理 04 聚类及向量化节约算力 30% 性能提升 35.5% 业界独有能力 GPU混部在大模型数据预处理环节，凭借极致弹性+Spark调优+开箱即用，数据湖方案得到有效验证高效的 spark批处理针对长文本、向量化处理的专项优化针对AIGC调优的Spark环境1，提升数据清洗成功率 Spark稳定性对按需弹性需求极高 AI业务的数据处理量并不是每天稳定 AIGC客户核心诉求 DLC产品关键竞争力 Serverless计算CU极致弹性，CPU+GPU资源混部解决方案极致弹性重视开箱即用与易用性 AI场景的客户在技能上“重AI，轻大数据” 支持机器学习及AI场景常用依赖包管理开箱即用 DLC在AIGC的最佳实践：https://iwiki.woa.com/p/4008195203 •1.DLC在AIGC的最佳实践：https://iwiki.woa.com/p/4008195203 RAG检索增强生成 RAG：RetrievalAugmentedGeneration 一种通过检索外部知识库来改进大模型内容生成效果的技术方案预训练大模型（挑战）本地知识库（补充） RAG应用场景大模型搜索应用 知识更新问题 缺乏特定知识 模型幻觉 私域专业知识 信息安全&版权保护 知识问答 智能客服 专家系统在LLM带来的新革命中，搜索比以往任何时候都更重要！搜索与大模型结合得更为紧密！腾讯云ESRAG体验馆腾讯云ES一站式RAG技术架构典型案例（扫描了解）用户问题查询转换转换后的问题上下文窗口提示词工程混元大模型最佳答案微信读书“AI问书” 核心优势 低门槛：一站式向量检索平台 高性能：百万级QPS、千亿级向量 更精准：独有向量和文本混合搜索 更智能：与LLM大模型无缝集成通过生成式回答、标注引用来源、提供猜你想问，大幅提升阅读体验。二维码企业知识库文档图像音频数据处理向量转换混合搜索重排序腾讯云ES 文本&向量索引模型管理公共互联网数据模型上传低门槛一站式向量检索平台高性能支持百万级QPS、千亿级向量规模更精准独有的向量和文本混合搜索能力更智能与LLM大模型无缝集成，轻松构建AI智能问答应用 ES在向量检索与AI增强上的优势小结文本搜索向量检索混合排序聚合分析权限管理腾讯云ES-首个通过信通院RAG权威标准认证中国信通院云计算与大数据研究所大数据与智能化部依托中国通信标准化协会大数据技术标准推进委员会（CCSATC601），联合40余家企业的70余位专家共同编制完成了《检索增强生成（RAG）技术要求》标准。腾讯云ES是国内公有云首个从自然语言处理，到向量生成/存储/检索，并与大模型集成的端到端一站式技术平台腾讯云是核心参编企业，也是首个通过RAG权威标准认证的企业 RAG标准包含知识库构建能力、知识检索能力、内容生成能力、质量评估能力、平台能力等五大能力域，17个能力子域，50个能力项。携手腾讯云ES共创阅读新场景数据规模大超10亿级向量规模，存储成本高，早期预估30亿768维的向量，需要超过400台64G机器运维成本高除了文本搜索服务，同时还需部署向量化服务，在外部进行向量化后，写入到向量数据库，同时向量数据库不存储原始meta信息，还需要额外部署正排服务，多套服务运维成本高。开发成本高调试召回过程中，需要在外部进行向量化后，从向量数据库召回，然后再用召回id访问正排获取meta信息稳定性要求高在线读书平台，超亿级用户，稳定性要求5个9 查询性能要求高高并发场景下查询延迟需要毫秒级返回，全链路多路召回需控制在300ms以内微信读书为什么选择腾讯云ES 机器成本低 ES提供了低成本的索引存储和检索，提供了向量量化以及不要求全内存索引，机器成本大大降低运维成本低提供一站式检索方案，同时提供文本检索、向量检索、机器学习集群,降低服务运维成本所见即所得开发同学在kibana上就可以调试召回流程，所见即所得专业团队支持背靠腾讯云ES团队，大平台专业团队性能卓越经过测试，数亿量级的索引召回平均耗时在 100ms以下，性能卓越腾讯云ES实现RAG的优势高准确率文本+向量的混合搜索，有效应对各场景下的检索需求。开发实现效率高存储成本低运维投入低基于ES独立架构即可完成向量生成->向量存储->向量检索的全流程操作。查询效率高稳定可靠自研基于内存的熔断限流策略，有效应对高并发与大查询，为业务保驾护航。一站式技术方案，上手容易，研发实现高效支持LZ4、Deflate等压缩算法、有效降低存储成本。高并发场景下，十亿级向量检索查询延迟低至毫秒级。离线计算实时计算 MLOPS Monitoring CI/CD ModelDeployment ModelRegistry FeatureStore DataPreparation … NL2SQL LLMAgent 深度强化学习异常检测时序预测 AI中台能力系统效率运营效率业务效率整体框架 03 核心技术 02 TI-ONE Models-StatisticalAlgorithms+MachineLearning+LLM 智能存储缓存预热数据放置学习型索引智能优化 ABO 负载预测任务调度成本优化资源调度内存调优透明压缩 AIOPS 根因分析故障自愈持续可用 Assistant SQLCopilotAI助手智能搜索自治服务异常闭环弹性扩缩容性能调优 LLMAgent Tuning-DeepReinforcementLearning Time-SeriesPrediction 底层依赖 Metric 基础数据 Log Event 混元大模型天穹平台大脑自治系统：提升业务效率、运营效率和系统效率 01自治系统价值三个方面核心价值：业务效率 降低产品的使用门槛提升开发和运维效率运营效率 平台大规模运营提效解决运维效率、成本优化和稳定性难题系统效率 复杂查询的优化和调度数据放置、索引和缓存的优化 THANKS

点击免费查看完整报告

你可能感兴趣

腾讯云大数据AI大模型增强及应用，赋能企业智能化转型

你可能感兴趣

传媒行业周报：腾讯云推动大模型与企业知识库深度结合，加速企业智能化转型

大模型与大数据双向赋能，“WeData+AI”智能化升级

数字浪潮之工业智能化：大数据和AI赋能，工业互联铺强国之路

【天风电子潘暕团队】阿里云将大模型接入工业机器人，赋能制造业将是AI最强应用！

AI赋能资产配置（六）海内外资管机构AI大模型应用探索