破除知见障 大模型时代AI算法人才成长的思考 汽车之家李航宇 www.top100summit.com 讲师简介 李航宇 汽车之家资深经理 •本、硕毕业于北京航空航天大学 “ •13~22年就职于百度 •22年至今担任汽车之家人工智能技术负责人 -从0到1搭建之家核心算法团队 -带领团队在C端场景成功落地大模型应用——万斗天枢 ” www.top100summit.com 背景 大模型你怎么看?Langchain你怎么看?Agent你怎么看? ——某圈外好友 大模型真的太火了! 两周内把大模型产品搞上线,一定要做垂类行业第一个上线的! ——某垂类经理 站着看、坐着看、躺着看 热钱容易进也容易出,就像手心的白月光 背景 Chatgpt成为历史上日活增长最快的应用 入选自然杂志年度十大“人物” 大模型发展迅速 大模型百花齐放,仅国内就超200多款,应用更是不计其数 www.top100summit.com 背景大模型“知见障” 大模型是算法进化唯一方向,ALLIN的时候到了! 现在做大模型就是49年入国军,想想元宇宙吧! 应该切入哪个细分领域?大模型下我如何持续成长?大模型如何落地业务?…… 知见障:已有的知识获取和思考模式,会困住我们,无法做出(正确的)决策 《侠客行》里,因为石破天不识字,反而没有被武功的文字所影响,而是直接洞穿本质,看到武功秘籍的行气图,练成绝世武功 《太玄经》 见 知 践 获取外部信息迭代认知模型 www.top100summit.com www.top100summit.com 目录 见 践 知 见大模型带动产业模式变革 生产力变革交互方式变革算法范式变革 •内容创作新范式: -AIGC生产文章、图片、视频 •办公生产力新范式: -编码辅助:百度超20%代码覆盖 -Office辅助:Microsoft365 •全行业赋能: -营销、设计、服务业、智能驾驶/交通/家居 -社会学、军事学 •before:图形交互界面 -完全由产品设计确定交互方式,非个性化或低个性化,多层级 -输出能力非常受限 -固定需求场景内高效 •after:对话式交互 -个性化、低门槛、多模态、扁平化表达 对话式交互 -输出能力无限制、上下文友好 图形交互界面 •复杂算法设计→prompt -案例:从用户口碑数据中摘取出口语化、个性化的“一句话口碑” -before:人工标注+情感分析+摘要抽取+工程实现+…… -after:chatgpt4+prompt- “请从以下的评论中随机抽取一句相关车的优点评论,要求真实鲜活有态度,……” -月级→分钟级,效果不输 •Agent:复杂问题的通用解决方案 -LLM+Planning+Feedback+Tool -目标AGI:AutoGPT,langchain… •算法门槛大幅降低 www.top100summit.com www.top100summit.com 见 大模型也不是万金油 幻觉时效性烧钱 耗时可解释性稳定性 知识产权安全伦理 上帝不会掷骰子 但大模型是概率游戏 www.top100summit.com 见 大模型带动算法成长路径的变革 •Before:聚类分类,有监督无监督,深度学习、DNN、RNN、Transformer、NLP、CV…… •After:PromptEngineering;PT、SFT、RLHF;ICL、COT(TOT、GOT)…… www.top100summit.com 目录 见 践 知 www.top100summit.com 践 简单介绍一下汽车之家 团队主要解决的问题:买 www.top100summit.com 践 买车用户转化周期 买车初期阶段 买车中期阶段 买车后期阶段 选车意图逐渐明确 •选定3-5意向车系,综合对比 优缺点和适合度 •查看目标车系参配等细节信息 •明确购车预算:30万左右 确认最终选择 •线下试驾体验目标车系 •贷款和保养相关知识 •用车相关成本核算 相对不明确的选车意图 •知道车相关的知识和品牌信息较为 有限 •有不明确的选车意图 •预算是个区间(20万~40万) 点 用户特 信息收集/兴趣激发 需求收敛 买车决策 践 信息收集需求收敛买车决策 买车决策痛点 交互模式陈旧内容生产/获取低效 1.固定交互、层级化设计、操作冗余 2.先有意图后满足,激发 能力差 1.OPU3GC为主,生产效率低、质量参差不齐 2.信息过载或过于专业, 难理解、难决策 大模型能力 •对话式交互,无层级,直接分发 •多模输入输出,交互能力更强 •全场域能力调度 •规模化生产优质内容 •精炼关键信息、减少过载 •个性化兴趣激发 •多Agent协同,降低研发成本 •口语化,易于理解 •AI质检 www.top100summit.com www.top100summit.com 践 万斗天枢: 一站式用户选车决策解决方案 AIGC资讯大模型选车引擎AIGC决策信息页 其他 推荐 对比 单车 生成式搜索 沉浸式搜索 热点话题 优质内容 应用层:解决信息收集、需求收敛、买车决策问题 •“读心术”般的无词搜索体验 •真实、专业、有态度,紧跟时事 大模型底座原子知识底座 内容质检 多模协同 Llama2 QWen 自研:仓颉 多级标签体系 知识原子化 RLHF SFT Pretrain •千人千面解决用户选车决策痛点 支持层:供给大模型能力和优质知识 •大模型底座:仓颉 全网信息挖掘/清洗 其他来源 外站数据挖掘 之家汽车知识库 之家产品库 全之家资讯内容 •抽象高密度、原子化看买用换经验为知识底座 数据层:挖掘全网信息,供给模型训练和知识精炼 www.top100summit.com 目录 见 践 知 www.top100summit.com 知 AI算法人才成长思考 算法能力 •大模型和传统算法互为补充 •掌握算法sense才能万变不离其宗 思考模式 •开放心态激活知见飞轮 •加减除乘法解决具体问题 发展方向 •大模型驱动分工模式变化 •关键在于找准定位 •大模型未来发展 知 掌握算法sense才能万变不离其宗 AI生图/视频如火如荼,设计师还有核心竞争力吗?“算法sense”有哪些? 有,审美良好的算法基础 •数学:概率、矩阵、微积分 •深度学习、Transformer 大模型时代下,算法工程师还有核心竞争力吗? 业务理解和算法设计 有,算法sense •数据敏感,算法视角对业务有引导,不要“自嗨” •足够的经验,算法设计有自己的认知框架 www.top100summit.com 知大模型和传统算法互为补充 场景专精 特定场景,通用性低 高成本 传统模型 大模型 高泛化 快速响应,通用性强 低门槛 •生成类、约束少的场景更适合纯大模型:AI生图、闲聊、仿真、创作等 •高质量、强约束的领域场景需大模型和传统算法互补: -大模型易幻觉、不稳定,必须要有约束 -应用架构整合:如搜索增强、工具使用 -模型架构整合:Mistral8*7B>Llama270B (LLM+MOE) -开发流程结合:LLM冷启+传统算法精调 大量标注、业务数据 复用率低,研发周期长 高适配 需约束 少量标注+适量业务数据 LLM+业务任务微调 All In LLM? 无需外部约束 幻觉、不稳定,需外部约束 All About LLM! www.top100summit.com www.top100summit.com 知 AI算法人才成长思考 算法能力 •大模型和传统算法互为补充 •掌握算法sense才能万变不离其宗 思考模式 •开放心态激活知见飞轮 •加减除乘法解决具体问题 发展方向 •大模型驱动分工模式变化 •关键在于找准定位 •大模型未来发展 知 知 践 为什么太阳从东方升起? 开放心态激活知见飞轮 原始人:太阳从东方升起 近代人:太阳自西向东转 牛顿力学:角动量守恒 见 获取外部信息迭代认知模型 时间平移对称性:物理定律不随时间推移而变化 高频更新知识来源充分的实践打破固有认知框架 诺特定律:时间平移对称性本质上是能量守恒 苟日新,日日新,又日新论文、会议(top100)、资讯,培养前沿技术视野 每天问自己: 纸上得来终觉浅,绝知此事要躬行 心态上拒绝说:不可能、一定不行 因果推断认识本质关系 实验室从来未发现过违背能量守恒的现象所以……如果宇宙加速膨胀了呢? 是否学到了新的知识?是否真正试过了?是否已经穷尽了所有方法? www.top100summit.com 知 加减除乘法解决具体问题 以万斗天枢为例: •尽可能收集足够多的外部 信息 •eg.充分枚举选车痛点和大模型的能力和不足 •删除无用和干扰内容息,聚焦最关键的信息 •eg.删除大模型仿真、保留AIGC、多轮交互 •总结直达成功的“道”和踩坑的“雷” •eg.切入细分场景,不破坏用户原有认知惯性;解决方案为体、LLM为用 •经验快速复制到其他业务场景 •eg.车系页IM等 www.top100summit.com 脑爆执行复盘复制 www.top100summit.com 知 AI算法人才成长思考 算法能力 •大模型和传统算法互为补充 •掌握算法sense才能万变不离其宗 思考模式 •开放心态激活知见飞轮 •加减除乘法解决具体问题 发展方向 •大模型驱动分工模式变化 •关键在于找准定位 •大模型未来发展 见大模型驱动分工模式变化 直接应用; 门槛低,全民PE PT、SFT;开源Agent (langchain,transformers) 深入业务场景定制模型、自研 Agent(搜索增强、全局调度等) 大企业真•自研,算法科学家newbing、文心等;通用AI和应用 PromptEngineering成熟框架应用 企业级应用 评估体系 通用/垂域,主观/客观 推理架构 加速框架、量化 通用AI 工程部署 在线推理、缓存设计… 数据建设 去重、脱敏、标注、质检… 云基建 基础设施、计算资源… ToB/ToC/ToG www.top100summit.com 知 找准定位 找准自己的定位 •擅长钻研算法/应用/管理? •能力匹配行业趋势:定制垂类应用可能是最容易发挥价值的方向 选择>努力? 理想的发展模式: 找准公司的定位 •自研/定制/云? •中小体量公司:基于业务场景设 计大模型应用;烧钱 •商业化能力 找准产品的定位 •当前大模型还没有那么智能,跟传统算法能力结合是近期可能的发力点 •不要试图打破已有的高效工具,五花八门的功能不如专注几个能提效的关键点 www.top100summit.com 人公司产品行业 知 大模型未来发展方向思考 Prompt=搜索理性思维存在空间真正高效的多模交互 •COT/Agent? •理性思维能力内化 •对话式交互真的高效吗? •Gemini开了个坏头, 但…… www.top100summit.com www.top100summit.com 共勉 勿意,勿必,勿固,勿我 Thanks 微信官方公众号:壹佰案例关注查看更多年度实践案例 www.top100summit.com