您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:传媒日报 |北京政策鼓励算力发展,新模型架构提升大模型运作效率【建投传媒互联网】 - 发现报告
当前位置:首页/会议纪要/报告详情/

传媒日报 |北京政策鼓励算力发展,新模型架构提升大模型运作效率【建投传媒互联网】

2023-05-30未知机构点***
传媒日报 |北京政策鼓励算力发展,新模型架构提升大模型运作效率【建投传媒互联网】

传媒日报|北京政策鼓励算力发展,新模型架构提升大模型运作效率【建投传媒互联网】 【AI产业】 #北京推动国产人工智能芯片实现突破。 据第一财经,《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》提出,推动国产人工智能芯片实现突破。 面向人工智能云端分布式训练需求,开展通用高算力训练芯片研发;面向边缘端应用场景的低功耗需求,研制多模态智能传感芯片、自主智能传媒日报|北京政策鼓励算力发展,新模型架构提升大模型运作效率【建投传媒互联网】 【AI产业】 #北京推动国产人工智能芯片实现突破。 据第一财经,《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》提出,推动国产人工智能芯片实现突破。 面向人工智能云端分布式训练需求,开展通用高算力训练芯片研发;面向边缘端应用场景的低功耗需求,研制多模态智能传感芯片、自主智能决策执行芯片等。 积极引导大模型研发企业应用国产人工智能芯片,加快提升人工智能算力供给的国产化率。 #北京将新增算力建设项目纳入算力伙伴计划。 据证券时报,北京市政府办公厅印发《北京市促进通用人工智能创新发展的若干措施》,其中提出,将新增算力建设项目纳入算力伙伴计划,加快推动海淀区、朝阳区建设北京人工智能公共算力中心、北京数字经济算力中心,形成规模化先进算力供给能力,支撑千亿级参数量的大型语言模型、大型视觉模型、多模态大模型、科学计算大模型等研发。 #商汤联合发布“通才AI智能体”通关《》。 据量子位,在《》(Minecraft)游戏中,商汤科技联合清华大学、上海人工智能实验室等机构发布通才AI智能体GhostintheMinecraft(GITM)。 GITM在《》内主世界的所有技术挑战上实现了100%的任务覆盖率。 在”获取钻石”任务上,GITM成功率达67.5%,相比于OpenAIVPT提高了47.5%。 训练效率上,GITM单一CPU节点训练2天即可完成,而OpenAIVPT需要6480个GPU天。 #Meta发布全新Megabyte模型。 据新智元,Meta近日发布了一种全新的模型架构Megabyte,可以有效减少算力损耗。 该架构可以对超过一百万字节的序列进行端到端可微分建模,能跨多种格式生成超过100万个token,并超越GPT-4等模型背后的现有 Transformer架构的功能。 #谷歌等提出新框架提高复杂任务执行效率。 据新智元,来自GoogleDeepMind,普林斯顿和斯坦福的团队提出了一种全新的框架LargeLanguageModelsasToolMakers,让两个LLM 合作,例如让GPT-4制造出的工具,给GPT-3.5Turbo使用时,可以在成本低、速度快的GPT-3.5Turbo上实现与GPT-4相当的性能。#猿辅导推出教育硬件产品“小猿学练机”。 据猿辅导,该产品为不同于学习机的全新教育平板,将AI与数字化结合,具有智能出题、批改、讲解等功能,也搭载护眼纸墨水屏。该产品的发布也标志着猿辅导正式进军千亿智能硬件市场。