半导体实践 需要提高半导体制造效率吗?寻求维护 设备恢复、计划维修、零部件管理 可以提高半导体晶圆厂的设备可用性和效率。 作者:RyanFletcher,YorgosFriligos,JoydeepGuha和AbhijitMahindroo 2023年12月 全球半导体产业我们的分析表明,到2030年,该行业将以每年6%至8%的速度增长,届时将达到1万亿美元的年收入。 来自终端市场的需求——用于计算、数据存储、无线通信和人工智能——约占这一增长的60%。其余的来自需要成熟节点(晶片小于200毫米[mm])的行业,例如汽车、工业和有线通信部分。虽然需要领先芯片的终端市场(如计算和人工智能)的动态可能会造成需求的轻微波动,但半导体行业将整体增长,至少在未来十年是这样。 该行业的增长伴随着投资。在过去的20年中,我们已经看到领先的300毫米晶圆在研发和运营最佳实践方面获得了大量投资,这使得提高制造能力相对容易。但对于200毫米或更小的晶圆平台——经常用于汽车、工业和有线通信——情况就不同了。 在这些平台上制造的芯片被称为“成熟节点”,从历史上看,它们对固定需求和平稳增长做出了反应。但是,当巨大的终端市场需求将成熟的节点制造设施(称为“晶圆厂”)推向满负荷时,这种情况发生了变化。 许多晶圆厂需要快速提升产能。其他晶圆厂需要性能提升 ,以最大限度地降低维护工具的成本。但是大多数具有成熟节点的晶圆厂至少有20年的历史,设备、工艺和生产力都可以匹配。 在这种情况下,晶圆厂效率对于满足市场需求和成本至关重要 期望。潜力是巨大的。根据我们的经验,提高设备可靠性可以帮助晶圆厂将其工具可用性(一台设备准备处理传入工作的时间)提高15%以上。当应用于瓶颈时,这种改进的大约70%至80%转化为工厂的整体设备效率(OEE)(制造操作相对于其全部潜力的总体利用率)。因此,晶圆厂可以迅速利用巨大的潜在产能——通常超过10%——而无需增加工具或扩大占地面积。 实现这一目标需要在思维方式、流程和系统上进行重大改变,从反应性转向预防和提前规划。Fab领导者需要优先考虑设备恢复,进行一致的计划维护,并有效地管理零件。本文中的见解将为200毫米或更小的晶圆平台带来最大的好处,但这些概念适用于所有半导体晶圆厂 。 旧习惯使晶圆厂处于反应模式 许多运行成熟节点的晶圆厂尚未使用数据管理系统、精益制造流程和实践以及工业4.0工具方面的最新进展。多年来的成本降低以及通过人才流失而失去的机构知识削弱了生产车间的能力。综合起来,这些因素使得对维护问题的响应变得困难-并且在发生维护问题时效率低下。 随着时间的推移,缺乏有计划、有组织的行动会给许多晶圆厂造成一个反动的维护周期,导致整个晶圆厂的可用性降低和晶圆产量降低。根据我们的经验,一些晶圆厂的维护比率(M比率)已经降到1.0以下,这意味着非计划维护时间超过了计划维护时间。 陷入这种消防转移 计划和实施战略维护计划的注意力和资源。如果计划外维护大大超过计划维护,则该工具有效地控制了维护组织,而不是 相反。达到季度出货目标的压力会增加晶圆厂团队的压力 ,这并不总是有利于严格解决问题。结果是对问题的反动反应,导致停机时间更长,故障再次发生和工具可用性降低-最终影响晶圆产量。 工具可用性是影响OEE的关键因素之一,除了工具性能 、晶圆负载和质量之外。工具可用性有时会下降,但决策者对此的反应至关重要(参见侧栏“整体设备有效性的关键因素”)。 从理论上讲,决策者和从业者将准备并实施有效的计划维护计划,随着时间的推移,降低意外维护的频率。在实践中,这样做是困难的,因为晶片流程中的步骤 (晶片在芯片中的路径- 制造过程)是相互依存和复杂的-设备也是如此。因此,我们观察到,在40%到70%的工具发生故障的情况下,管理者将重点放在消防上。这种方法必然促使他们优先考虑短期胜利。在其余情况下,管理人员可能会尝试完成一项计划,但这些努力往往注定要失败,因为消防消耗了不成比例的资源。 转变晶圆厂的可用性 根据我们的经验,在大多数情况下,可以通过解决计划外维护来提高工具的可用性。我们发现,一个小时的计划维护通常可以节省三到四个小时的计划外维护。 半导体晶圆厂的一流维护计划包括三个主要元素:通过短循环根本原因分析(RCA)快速解决问题,建立强大的计划维护基础以及有效地管理零件。 设备整体效能的关键因素 七个因素显著影响晶圆厂整体设备效率(OEE) 。 计划外停机时间,按维护率(M-ratio)衡量。The M-ratio是计划停机时间的比率 (理想,因为它通常是预防性和计划性的)任何设备的计划外停机时间。健康的M比率大于或等于4.0,这意味着20%或更少的生产设备停机时间是计划外的。 计划的停机时间。这包括一套有效的预防措施 ,旨在避免潜在的工具故障,基于对过去故障的根本原因分析或OEM的规定措施。 速度损失。这是当设备运行比其目标运行速率更慢时。 空闲时间。在有和没有晶片等待处理的情况下,这是设备可用于生产但尚未装载的时间。 备用损失。这种损失是由于装载和运输晶片和零件以及由于主路径由于工具停机而被阻塞时不清楚的替代晶片流动而发生的。 资格审查时间。这是在维护后花费的时间,以测试并确保设备符合规格。 工程时间。这是工程师检查、调整和改进设备所花费的时间。 上下文中的短循环根本原因分析 我们的讨论专注于短循环根本原因分析(RCA )。但是,还有其他三种有效的方法可以解决问题并减少半导体晶圆厂的计划外停机时间。 1.以可靠性为中心的维护。最全面的方法,这种技术涉及 分析关键工具主要部件的失效模式,并设计降低失效风险的措施。 2.周而复始(即持续改进)。使用这种方法的团队首先调查尚未确定的故障模式,以了解其可能的原因 然后验证并确定这些原因的解决方案。根据故障模式的严重程度,kaizen事件可以像一天一样简短。 3.解决方案工作会议。当团队已经知道问题的主要根源并且需要专注于设计解决方案时,他们就会使用这种方法。 使用短循环RCA快速解决问题短循环RCA是一种敏捷的解决问题的技术,可以帮助团队分解原因并生成解决方案,可以帮助团队达成对工具停机的主要原因的共同理解,并制定解决这些问题的计划。 该方法可以解决中度复杂的维护问题,根据我们的经验,这些问题约占纠正性维护中出现的问题的一半(请参阅侧栏“上下文中的短循环根本原因分析”)。 半导体制造团队可以使用短循环RCA来找到解决特定工具(展示)出现的问题的最佳方法。 对于每一件针对根本原因分析的设备,团队将阐明要解决的问题,并评估其频率和 团队还将确定调查问题所需的内部和外部资源。 下一步将是收集有关设备的历史数据,与相关机器技术人员重新确认问题的性质,并确定任何相邻的问题。 为了进行RCA,工作团队将聚集在一个专门的空间来制定假设,采用五为什么分析(一种用于确定问题来源的特定疑问问题解决技术),优先考虑可能的根本原因,并头脑风暴潜在解决方案。结果 这个练习可能是一个很可能成功的行动过程。如果没有 ,团队可以回到使用历史数据来产生可以转化为解决方案的见解。 Exhibit 框架可以帮助维护技术人员和设备工程师优先考虑分析和有针对性的改进工具。 1 2 3 4 5 6 确定根本原因 确认要解决的 收集诊断 对目标工具进 铰接式纠 实施解决方案 分析(RCA)工具的优先级 问题 数据 行RCA 正措施 并跟踪效果 麦肯锡公司 作为最后一步,团队将实施他们的解决方案并跟踪其有效性。此处的文档至关重要,特别是如果团队了解特定设备的问题是否是系统性的,以及它们是否对其他业务领域产生影响,例如晶圆厂的备件战略。 模糊逻辑等分析框架(使用一组不精确的设备注释来识别关键工具停机问题)可以帮助团队根据停机时间和频率识别最常见的问题。临时团队——包括供应商和工具供应商,如果需要的话——然后可以集中参加研讨会,重点是查明每个问题的根本原因(参见侧栏“在半导体制造工厂中应用模糊逻辑进行维护”)。 当然,实施这些习惯需要正确的专业知识、资源、纪律和 执法。拥有这个一致的框架的一个好处是,晶圆厂团队可以利用他们已经拥有的人才来使用它。它还可以帮助抵消有经验的员工流失的影响。Fab团队可以分配资源以完全解决团队识别的任何问题,以便每个问题只能解决一次。从经验中获取的知识可用于培训员工并解决将来的问题。 建立强大的计划维护基础 Inourexperience,effectiveplanned-maintenanceprogramsincreasesfabavailabilityby5to7percentagepoints.Althoughtherewardsaresignificantandthesteps -planning, implementation,andcontinuousimprovement—arestrainly,planned-maintenanceprogramsaredifficulttoestablishconsistentlyinmanyfabs.Thestatusofresource-sappingfirefatingisonehumdle,asisbeautifulmaintenanceprocedures. 自上而下的承诺,问责制和领导工作的利益相关者的支持可以帮助计划维护计划扎根。 成功的计划维护计划的基础是晶圆厂团队逐步采用正确做法的机会。每个里程碑都允许团队认识到他们有效预防工作的影响。不同任务的标准和评级,如铜牌、银牌和金牌,可以激励团队改进并实现更高水平的绩效。 最成功的计划每周都有团队会议,以审查由KPI衡量的进度,并进行反馈,以帮助团队计划进一步改进。这些计划中的计划涉及提前安排维护并通知相关利益相关者。最有效的团队在接下来的两周内安排维护活动,并至少提前十天通知利益相关者。 Theimplementationstageisfocusedoncheckinginwithstakeholdersandremovinghurdlestoplanned-maintenanceactivities.Best-in-classteamscheckinatleasttwoplanned-maintenanceactivitiesoneachshiftandresolveroadblockswithin30minutes. 从那里开始,持续改进就是采用或拒绝可能改进的持续过程。最有效的团队在一周内做出采用和拒绝决定 这样新的建议就能迅速融入他们的工作方式。 有效管理零件 零件管理可能是晶圆厂可用性的无声杀手,因为更换零件并不总是与严重问题相关。但是,延迟或不可用的解决方案(在这种情况下是一部分)会延长或恶化最初的问题 。采购团队可能需要挖掘替代供应商,零件可能不在库存中,多个团队或团队成员可能在没有协调或明确职责的情况下处理相同的问题。 在半导体制造工厂中应用模糊逻辑进行维护 晶圆厂中的工具维护工具停机事件的运行日志(即,当设备运行时 stoppages)astheyoccur.Wenttime,theamountofrawdatainlogstendstoswellandsufferfromalackofstructureandorganization.Asaresult,decisionmakersonthefloorstruggesttoprioritizeissuestomaximizetheefficiencyoftoolrecovery. 一家工厂使用模糊逻辑等分析技术(即使用一组不精确的设备注释来识别关键工具停机问题)来梳理整个 数据集-日志条目的文本-用于与不同类型的错误相关的关键字,包括技术人员和设备工程师使用的缩写。模糊逻辑(和类似的分析工具)可以将分析注释所需的时间从几个小时减少到几分钟,并通过自定义仪表板提