热门搜索：

张颖峰-RAG 2.0 引擎的设计挑战和实现

机械设备2024-12-06DataFunSummit2024：生成式AI技术峰会测***

AI智能总结

InfiniFlowRAG 2.0引擎设计挑战和实现

1. InfiniFlowRAG 1.0的痛点和解决方向

痛点：
- 文档结构复杂，数据混乱。
- 向量召回效果不佳。
- 问题与答案相关性差。
解决方向：
- 优化切块（Chunking）策略。
- 引入高级RAG架构，如全文索引、稀疏向量索引、表格布局模型等。
- 提升问题和答案之间的语义匹配。

2. 如何有效Chunking

模型：
- 使用文档结构识别模型，包括页眉页脚、段落、图片、表格等。
- 利用多模态模型进行切块处理。
效果：
- 实验表明，RAGFlow在准确率上有所提升，特别是完全准确率和部分准确率。

3. 如何准确召回

索引数据库：
- 多路召回策略，结合结构化数据查询和融合排序。
- 使用Tensor Sparse Vector、Dense Vector、Full Text Search等多种索引技术。
基准测试：
- 在MLDR长文档检索基准测试中，InfiniFlow表现优异，特别是在使用ColBERT作为排名模型时。

4. 高级RAG和预处理

文档预处理：
- 使用RAPTOR对复杂文档进行预处理，提取关键信息并生成摘要。
知识图谱构建：
- 利用实体、关系和图神经网络（GNN）构建和增强知识图谱。

5. RAG未来的发展方向

多模态RAG：
- 结合视觉编码器和文本解码器，支持多模态检索。
延迟交互模型：
- 探索延迟交互模型，提高RAG的性能和效率。
记忆增强的Agent：
- 在多个领域应用中，利用记忆机制增强智能代理的能力，如个人助理和推荐系统。

RAG2.0引擎设计挑战和实现张颖峰/InfiniFlow创始人 DataFunSummit#2024 RAG1.0的痛点和解决方向如何有效Chunking如何准确召回高级RAG和预处理RAG未来如何发展 01 RAG1.0的痛点和解决方向 RAG架构模式 ExtractionIndexingRetrievalGeneration Chunking Embeddings Question Recommender Chunks Embeddings Embeddingmodel VectorDB Embeddingmodel Answer prompts [[]] Search Relevantchunks ConversationalAI RAG面临的挑战 挑战一：向量的召回无法满足要求 挑战二：文档结构复杂，数据太乱，GarbageIn,GarbageOut 挑战三：问题和答案所在文档关联不大，很难通过问题找到正确文档下一代RAG架构 GarbageIn,GarbageOut 问题和答案之间存在语义鸿沟切块数据抽取模型文档布局模型表格布局模型切块知识图谱构建切块 Embedding模型问题Embedding模型查询改写模型关键词向量稀疏向量切块全文索引向量索引稀疏向量索引图索引 TensorReranker offlineonline LLM 答案和引用生成向量召回无法满足要求 Infinity+RAGFlow=Infiniflow Queryrewritingmodel Rerankingmodel RerevalAugmenaionttit Document structurerecognitionmodel Tablestructure recognitionmodel … Documentparsngi Document Clustering Knowledgegraph constructionmodel Documentsemantic pre-processing ExtractionIndexingRetrievalGeneration Tensor GraphembeddingGraphqueryStructureddataquery Infinity RAGFlow DenseVector FullTextSparseVector Fused Ranking 02 如何有效Chunking 文档结构识别模型页眉页脚段落图片表格扫描？图片截取 Y 表格结构识别模型 OCR 文字换行检测流程图、饼图、柱状图 Chunking结果 Chunking结果多模态模型标题补全 Chunking 概要 Documents N 调整抽取模型的RAGFlow对比 0.97 完全准确率 0.85部分准确率 0.8 0.65 0.65 0.5 0.35 0.15 Accuracy1.0 0.5 0.0 RAGFlowPro RAGFlow CommercialRAGproduct OpensourcenaiveRAG 单元格边界判定 表头信息判定 单元格合并判定 表格跨页判定 Image CNNEncoder CodeBook CNNDecoder VAE Encoder TransformerEncoder Decoder TransformerDecoder <Table> <tr> <td></td> </tr> </Table> 文档“大”模型表格流程图饼图 Transformer Encoder Transformer Decoder HTML 柱状图 VisionEncoder TextDecoder … 03 如何准确召回 IndexingDatabase DenseVector SparseVecortTensor 融合排序 FullTextSearch 多路召回结构化数据查询 ColumnarStore Numeric/String DenseVector SparseVector Tensor Text SecondaryIndex VectorIndex SparseVectorIndex TensorIndex FulltextIndex Benchmark Efficiency RAG数据库选型对比 Infinity VectorDatabases 全文搜索+向量 Weaviate TraditionalDatabases LanceDB Elasticsearch Effect 几路召回？ MLDRlong-documentretrievalbenchmark(English) 74.54 63.33 66.72 67.51 61.64 59.86 63.52 49.05 80 nDCG@10 60 40 BM25 DenseSparse Dense +Sparse BM25 +Dense BM25 +Sparse BM25 +Dense BM25+Dense +Sparse EmbeddingModel:BGE-M3 +RRF +RRF +RRF +Sparse +RRF +ColBERT Reranker Transformer Query Transformer DocumentPassage Transformer Query DocumentPassage Embedding Embedding Embedding Embedding Embedding Embedding Embedding Embedding Embedding Embedding Embedding Embedding Embedding Embedding Embedding Embedding Embedding Embedding Embedding OfflineIndexing 排序模型 Similarity Pooling Pooling ∑ Score MaxSim MaxSim MaxSim Transformer Transformer Query DocumentPassage Embedding Embedding DualEncoderCrossEncoderLateInteractionEncoder Score MLP QuestionQuestion Top10results Topresults VectorDB VS Question DenseVector FullTextSearch Top1000 results TensorReranker SparseVector Topresults 2 MLDRlong-documentretrievalbenchmark(English) 73.35 74.54 72.82 73.35 73.45 66.72 63.33 65.63 61.64 59.86 63.52 49.05 nDCG@10 80 60 40 BM25 BM25 Dense Dense Sparse Sparse Dense Dense BM25 BM25 BM25 BM25 +ColBERT +ColBERT +ColBERT+Sparse +Sparse +Dense +Dense +Dense +Dense EmbeddingModel:BGE-M3 +RRF +ColBERT +RRF +ColBERT+Sparse +RRF +Sparse +ColBERT ColBERTranker还是reranker？ 72.23 73.35 74.11 MLDRlong-documentretrievalbenchmark(English) 80 nDCG@10 60 40 ColBERT EMVBIndex BM25 +ColBERT Reranker ColBERT Bruteforce EmbeddingModel:BGE-M3 78 73.8 MIRACL 80 JaColBERT 60 40 Bge-m3JaColBERT Jina-ColBERTv2 answerai-colbert-small-v1基于JaColBERT33M参数 超过BGE110M 每个Token96维 Binary量化后每个Token12byte 04 高级RAG和预处理复杂问答之文档预处理——RAPTOR 原始文档ChunksChunksandsummariesacrosschunks Query FlattenAndIndexing 复杂问答之AgenticRAG Yes Answer question? No Answer Retrieval Grade Yes Relevant? Generation Router1 No QueryRewrite Query QueryIntent Router2 WebSearch Router3 AskLLM 复杂问答之知识图谱 Entity Entity Summary Entity Entity Summary … … … … DataEntitiesGraphConstructionandAugmentationCommunity Passage Entity Passage Entity Query Embedding 用QA来改进GNN PageRank(Node2vec) GNN 05 RAG未来如何发展多模态RAG—“雕花”还是？ ObjectDetection Text VisionEncoder TextDecoder Text VisionEncoder PatchEmbedding 多模态RAG与延迟交互模型 80 60 40 提问：2019年一天当中平均哪个小时电力消耗最高？ AVG BiPaliColPali ColPali 记忆增强的Agent 领域应用医疗/金融/法律：记忆案例、知识、市场信息、成功经验，辅助决策能力 角色扮演和社交模拟记忆个性化行为 个人助理记忆保存多次交互中的事实信息，以及用户的个人风格，方便提供个性化行为 游戏记忆获得的技能，行为轨迹等 推荐系统记忆保存用户行为，历史对话，提供个性化上下文 THANKS DataFunSummit#2024 https://github.com/infiniflow/ragflowhttps://github.com/infiniflow/infinity

点击免费查看完整报告