登录
注册
个人信息
我的订单
我的报告豆
我的优惠券
我的笔记
我的阅读
我的收藏
我的下载
我的上传
我的订阅
在线客服
退出登录
回到首页
AI
搜索
发现报告
发现数据
发现专题
专题报告
专题百科
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
seedance2.0
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
从 AI 平台演进获得的十点架构启示 - 谷歌_王顺
信息技术
2022-11-02
ArchSummit杭州2022|全球架构师峰会
徐雨泽
变与不变
: 训练和推理是AI的两大核心任务,平台演进需兼顾两者。
合二为一
: AutoML和定制化训练SDK统一,简化开发流程。
敏捷开发
: 可持续的集成/训练/部署/监控(CI/CT/CD/CM)是关键,工作流示意包括数据与模型管理、代码与配置、训练流水线、注册模型、服务包、服务日志等。
用户驱动
: 托管ScaNN满足企业客户需求,提升用户体验。
海纳百川
: PyTorch和TensorFlow框架相同优先级,2018年官方支持PyTorch,2020年Cloud TPU支持PyTorch/XLA,2021年Vertex AI提供预安装PyTorch的容器选项。
出类拔萃
: NAS搜索SOTA网络结构,以Image recognition为例,pyglove开源项目助力模型优化。
脱颖而出
: Reduction Server提高分布式训练效率,通过高带宽低成本的CPU-only VMs,在BERT-large MNLI finetune任务中,增加20个reduction server节点将训练吞吐量提升75%,成本每步降低42%。
八面玲珑
: 客户横跨多行业,包括Twitter、Spotify等。
独孤九剑
: 覆盖AI/ML全生命周期,提供端到端解决方案。
继往开来
: JAX和Pathways定义下一代框架和平台,JAX支持可组合函数变换,Pathways通过GPipe、GShard/GSPMD等技术实现高效训练。
你可能感兴趣
谷歌TPU架构演进趋势
商贸零售
-
2025-12-31
01-从NewSQL到全新的HTAP分布式架构演进-张潇
商贸零售
ArchSummit北京2023|全球架构师峰会
2023-06-06
AI 无界,Kimi 万亿参数大模型的全球云网架构演进之路 Kimi 全球训推网络用云实践分享
商贸零售
月之暗面
2025-09-26
服务性能可见性:从不同的网络架构中获得全面的见解
商贸零售
GSMA
2020-06-05
03酷家乐多云架构演进和落地--王栋年
商贸零售
ArchSummit北京2023|全球架构师峰会
2023-06-06