Newsletter 26005

Gen AI 很聪明，但工厂更需要机器学习

固德科技报｜Gen AI 很聪明，但工厂更需要机器学习

#AI

#机器学习

#PHM

Posted On : 4 June 2026
对于工业设备而言，最重要的问题并不是如何生成一份漂亮的分析报告，而是如何在数万次、数十万次重複动作之中，判断设备是否仍然维持正常状态。这项工作并非 Gen AI 的强项，而是机器学习真正发挥价值的地方。

当全世界都在谈 Gen AI？

工厂真正需要的是「可验证的设备理解」？
在近年来，ChatGPT、Gemini、Copilot 等 Gen AI 技术快速崛起，掀起全球企业数位转型热潮。从撰写报告、整理资料、生成图片到自动客服， Gen AI 展现出前所未有的能力，也让许多人开始思考，未来工厂是否也能透过 Gen AI 来管理设备、判断故障，甚至取代传统设备监测系统。

然而，当我们真正走进工厂现场，面对机械手臂、冲压机、打线机、切割机、晶圆搬送设备等高度自动化的生产设备时，会发现一个非常现实的问题： Gen AI 虽然很聪明，但它其实不知道「这一台设备」正常运转时应该长什么样子。

对于工业设备而言，最重要的问题并不是如何生成一份漂亮的分析报告，而是如何在数万次、数十万次重複动作之中，判断设备是否仍然维持正常状态。这项工作并非 Gen AI 的强项，而是机器学习真正发挥价值的地方。

更精确地说，工厂需要的不是单纯的 AI 回答能力，而是能被现场验证、能和历史资料比较、能在製程脉络中解释的设备健康模型。 Gen AI 擅长语言与知识整合，但设备健康管理的核心是时间序列、讯号特徵、动作週期、基准偏移与异常趋势。这些资料并不只是「文字问题」，而是需要透过感测、特徵萃取、模型训练与持续比对，才能逐步建立出来的设备理解。

因此，在智慧製造场景中， Gen AI 与机器学习并不是谁取代谁，而是一种分工合作的关係：机器学习负责理解设备， Gen AI 负责理解人；机器学习负责产生可信赖的设备健康指标， Gen AI 负责把这些指标转换成现场主管、维修人员与经营管理层都能理解的决策语言。

设备没有停机，就是设备没有问题？

当手臂关节、滑轨逐渐磨耗，轴承开始劣化，或结构产生微小松动时，设备控制系统仍然显示正常，机台依然能够持续运转，但搬送精度却可能已经开始下降。...

在许多工厂里，设备管理人员最常遇到的问题之一，就是设备明明没有停机，却开始出现良率下降、品质不稳定甚至客户抱怨等问题。这类问题最麻烦的地方在于，它不会立刻以故障警报的形式出现，而是先以微小偏移、节拍变慢、震动增加、定位误差或品质波动的形式发生。

以半导体产业为例，一支晶圆搬送手臂每天可能执行数万次取放晶圆动作。当手臂关节、滑轨逐渐磨耗，轴承开始劣化，或结构产生微小松动时，设备控制系统仍然显示正常，机台依然能够持续运转，但搬送精度却可能已经开始下降。而这个轻微的偏差，可能就会导致晶圆刮伤、破片或定位失准。

同样的情况也发生在冲压设备上。冲压机可能每天重複数千次甚至数万次加工动作。当模具磨耗、导柱间隙改变或机构疲劳发生时，设备依然能够完成冲压程序，但产品尺寸误差却逐渐增加，造成后续重工与产品报废。

问题在于，这些异常通常不会立即造成停机，因此很容易被忽略。当企业发现良率下降时，往往已经产生大量不良品；当设备真正发出故障警报时，问题通常已经恶化到必须停机维修的程度。因此，设备管理最大的挑战从来不是故障之后如何维修，而是在故障发生之前，如何发现那些看不见的异常徵兆。

这也是设备健康管理与一般维修管理最大的差异。维修管理关心的是「坏了怎么修」；设备健康管理关心的是「还没坏以前，哪些讯号已经开始改变」。前者属于反应式管理，后者则是预测式与预防式管理。

週期性设备最大的敌人不是故障，而是动作偏移？

每一次动作都有固定流程、固定节奏以及固定机械特徵。当设备处于最佳状态时，每一次动作几乎完全一致。然而随着设备老化，滑轨磨耗、轴承劣化、马达性能衰退、齿轮间隙增加、机构松动、润滑不足等问题会逐渐产生。

许多人认为设备异常等同于设备故障，但对于週期性设备而言，真正的风险其实来自于动作偏移。所谓週期性设备，是指每天执行相同或高度重複动作的生产设备，例如晶圆搬送机械手臂、自动化焊接手臂、CNC 工具机、冲压机、打线机、切割机、自动上下料设备、Stocker 与 Crane 系统。

这些设备的共同特性在于，每一次动作都有固定流程、固定节奏以及固定机械特徵。当设备处于最佳状态时，每一次动作几乎完全一致。然而随着设备老化，滑轨磨耗、轴承劣化、马达性能衰退、齿轮间隙增加、机构松动、润滑不足等问题会逐渐产生。

这些问题不一定会立即造成停机，但却会让设备开始偏离原本的标准动作。也许只是多了 0.1 秒的延迟，也许只是增加微小振动，也许只是搬送位置偏移十几微米。但对高精度製造业而言，这些微小差异都可能成为品质问题的开始。

动作偏移的可怕之处：它通常比故障更早发生

真正的故障往往只是结果，偏移才是过程。以设备劣化曲线来看，设备通常不会从健康状态瞬间变成故障状态，而是先进入「可运转但品质开始不稳」的灰色区间。这个阶段最容易被忽略，因为设备仍然会动，PLC 也没有报警，操作员也不一定听得出差异。

但机器学习可以做的事情，就是把这个灰色区间量化。透过每一次动作的波形、频谱、时间长度、峰值位置、能量分布与相似度变化，系统可以判断设备是否逐渐偏离原本的正常轨迹。换句话说，机器学习不是等设备坏掉才看见异常，而是在设备「还能动但已经不一样」的时候，就把变化抓出来。

传统警报门槛为什么越来越不够用？

以机械手臂为例，一次完整动作可能包含启动、加速、移动、定位、取放、回位等阶段，每个阶段都会产生不同讯号特徵。即使是同一台设备，只要加工不同产品、执行不同程式或使用不同速度，讯号模式就可能完全不同。

过去设备监测主要依靠固定门槛管理，例如振动超过 5 mm/s 警报、电流超过 10A 警报、温度超过 80°C 警报。这种方式对于马达、泵浦、风机等连续运转设备也许有效，但对于週期性设备而言，却存在明显限制。

因为週期性设备的讯号本身就是动态变化的。以机械手臂为例，一次完整动作可能包含启动、加速、移动、定位、取放、回位等阶段，每个阶段都会产生不同讯号特徵。即使是同一台设备，只要加工不同产品、执行不同程式或使用不同速度，讯号模式就可能完全不同。

因此，单纯使用固定数值门槛，往往会产生两种问题：第一种是正常设备被误判异常，造成现场对系统失去信任；第二种则是真正异常设备没有被发现，让风险一路累积到品质事故或停机事故。

门槛管理的限制，本质上是「没有脉络」

固定门槛最大的问题不是数值设定得太高或太低，而是它缺乏脉络。5 mm/s 对某一台设备可能已经偏高，但对另一台设备可能仍在正常范围；某个频率峰值在 A 製程可能代表异常，在 B 製程却可能是正常动作特徵。若系统只看单一数值，而不看设备身份、动作阶段、历史基准与製程条件，就很难做出精准判断。

这也是为什么越来越多工厂开始从传统门槛管理，转向机器学习监测技术。因为机器学习不是只问「有没有超过某个值」，而是问「这次动作和过去正常动作相比，有没有变得不一样」。这个问题才更接近工厂现场真正想知道的答案。

机器学习真正学习的是设备正常的样子

工业设备的模型通常不能只靠通用知识。因为每一台设备的安装方式、负载条件、工件重量、运转速度、保养习惯与现场环境都不同。

许多人以为机器学习是在学习故障。事实上，机器学习最重要的工作是先学习正常。这个概念很像老师傅。资深维修人员之所以能够快速判断设备异常，并不是因为他们看过所有故障案例，而是因为他们非常熟悉设备正常运转时的样子。只要设备声音、振动或动作稍有不同，他们就能察觉异常。机器学习其实也是相同原理。

透过感测器收集设备正常运转数据后，系统会建立专属于该设备的行为模型。例如正常搬送动作、正常冲压动作、正常切割路径、正常打线程序，都会形成设备专属规范。未来每一次动作执行时，系统都会与规范进行比对。只要出现差异，便代表设备开始发生变化。

这里最重要的观念是：工业设备的模型通常不能只靠通用知识。因为每一台设备的安装方式、负载条件、工件重量、运转速度、保养习惯与现场环境都不同。即使是同品牌、同型号设备，装在不同产线，也可能呈现不同的振动特徵。因此，好的设备健康模型必须具有「设备专属性」，而不是只依靠通用故障百科。

从单点判断到趋势判断：设备健康分数的真正价值

机器学习在设备管理中的价值，不只是判断某一次动作是否异常，更重要的是建立长期趋势。单次异常可能只是杂讯、操作条件差异或短暂干扰，但如果相似度持续下降、频谱特徵逐步偏移、动作时间逐渐拉长，就代表设备健康状态正在发生系统性变化。

因此，设备健康分数不应被视为单一警报，而应被视为设备状态的连续性语言。当健康分数从 95 分下降到 85 分，可能代表设备仍可运转，但已进入观察区；当健康分数下降到 70 分，可能需要安排检查；当健康分数持续下降且与良率波动同步，就可能需要立即介入。这种趋势式管理，正是预知保养与品质预防能够连结的关键。

特徵值清洗才是工业 AI 最重要的核心技术

真正困难的其实是资料处理。工厂设备每天产生大量讯号，包括振动讯号、电流讯号、压力讯号、声音讯号。如果直接把原始数据交给 Gen AI 分析，不但效率低，也很难得到准确结果。

许多人认为 AI 的重点在于模型演算法。但在工业领域，真正困难的其实是资料处理。工厂设备每天产生大量讯号，包括振动讯号、电流讯号、压力讯号、声音讯号。如果直接把原始数据交给 Gen AI 分析，不但效率低，也很难得到准确结果。

因此必须先透过感测器与机器学习流程进行特徵值清洗，将大量原始讯号转换成具有意义的设备健康指标，例如 Dynamic Similarity（动态相似度）、Frequency Similarity（频谱相似度）、Health Score（健康度）、Stability Score（稳定度）、Frequency Over Rate（频率超标率）等。

这些特徵值就像医院检验报告中的血压、血糖、心率与血氧。医生不会只看一整段没有处理过的生理讯号，而是需要经过整理后的关键指标。设备诊断也是如此。特徵值让複杂讯号变得容易理解，也成为后续 AI 分析的重要依据。

资料清洗不是前置作业，而是工业 AI 的成败关键

在工业现场，资料常常比想像中更混乱。例如感测器安装角度不同、取样频率不一致、设备动作未正确分段、异常资料被误标为正常、维修纪录不完整、製程参数没有同步，都会影响模型判断。若前端资料治理不足，再先进的 AI 模型也只会放大错误。

因此，导入设备健康管理时，资料清洗不应被视为工程细节，而应被视为核心能力。企业必须回答几个问题：哪些资料代表正常？哪些资料应排除？设备动作如何切分？不同产品配方是否需要建立不同基准？维修后是否需要重新建模？模型漂移如何监控？这些问题看似技术性，实际上决定了系统能否长期被现场信任。

Gen AI 其实无法直接判断设备好坏？

Gen AI 的限制在于，它擅长基于大量知识进行推论与表达，但设备健康判断需要的是具体现场资料、历史基准与即时比较。

许多人认为，只要把设备数据交给 ChatGPT，就能完成设备诊断。实际上并非如此。假设今天把一张 FFT 频谱图交给 Gen AI，它或许能告诉你可能有 1X 频率特徵、可能存在不平衡现象、可能有对中不良问题。

但它并不知道：这台设备以前长什么样子？这个频率对这台设备而言是否正常？最近三个月是否有变化？与历史资料相比是否异常？这些资讯都必须来自机器学习建立的设备模型。换句话说，Gen AI 知道什么是轴承故障，但机器学习才知道你的轴承是否正在故障。

Gen AI 的限制在于，它擅长基于大量知识进行推论与表达，但设备健康判断需要的是具体现场资料、历史基准与即时比较。若没有这些基础，Gen AI 很容易给出看似合理但无法验证的答案。对工厂而言，最危险的不是 AI 不会回答，而是 AI 回答得很像真的，却缺乏现场证据。

工业 AI 需要的是可追溯、可验证、可行动的答案

设备诊断不能只停留在「可能是轴承问题」这种模糊描述，而应该进一步回答：是哪一台设备？哪一个动作段？哪一个频段开始变化？从什么时间开始恶化？与哪一次维修或製程切换有关？是否需要立即停机？或是可以安排在下一次保养窗口检查？

这些答案需要资料链支撑。机器学习提供异常分数、相似度变化、趋势图与历史比较； Gen AI 则能把这些资料整理成维修建议、风险说明与管理报告。因此，真正可靠的做法不是让 Gen AI 直接诊断设备，而是让 Gen AI 站在机器学习已经产生的可信资料上，进行解释与辅助决策。

第一，导入前要先定义「要解决的问题」
许多企业导入 AI 系统时，容易从技术出发，先问模型有多准、演算法多先进。但真正应该先问的是：这套系统要解决什么问题？是要降低非预期停机？降低刮片风险？减少不良品？延长模具寿命？还是让维修排程更准确？

问题定义不同，资料收集方式、模型设计、警报逻辑与绩效指标都会不同。如果没有先定义清楚，最后很容易变成系统看似很完整，却不知道要如何判断成效。

第二，导入中要建立现场回馈机制
机器学习不是一次建好就永远正确。现场设备会维修、改机、换料、换程式，也会因季节、温度、负载而改变。因此，系统必须和现场人员建立回馈机制。当系统发出异常提示时，维修人员应回填检查结果；当设备保养后，系统应记录事件；当製程条件改变时，模型也应知道资料背景已不同。

这种回馈机制能让模型逐步成熟，也能让现场人员感受到系统不是黑盒子，而是可以共同调整的管理工具。

第三，导入后要用管理指标验证价值
设备健康管理系统的价值，不应只用警报数量衡量。更重要的是要看它是否降低非预期停机、是否缩短异常排查时间、是否减少重工与报废、是否提升保养排程准确度、是否让新人也能依据资料做出接近老师傅的判断。

换句话说，AI 系统不是为了展示技术，而是为了改变管理结果。只有当系统能与 OEE、良率、MTBF、MTTR、维修成本、备品管理与客诉风险连结时，企业才真正把 AI 从展示专案转化为营运能力。

机器学习负责发现异常，Gen AI 负责解释异常

未来智慧工厂最理想的架构，其实是两种 AI 共同合作。

未来智慧工厂最理想的架构，其实是两种 AI 共同合作。第一层是感测器，负责收集设备运转讯号；第二层是机器学习，负责建立规范、特徵值清洗、动作比对、健康度评分与异常侦测；第三层才是 Gen AI，负责解读分析结果、产生诊断报告、提供维修建议与协助决策管理。

如果没有机器学习提供可靠基础资料， Gen AI 就像没有检验报告的医生，即使再聪明，也难以做出正确判断。相反地，如果只有机器学习，没有 Gen AI，系统可能产生大量图表与分数，却无法被管理者快速理解，也无法转换成跨部门沟通语言。

因此，双 AI 架构的价值在于把「设备讯号」转换成「管理行动」。机器学习先把複杂讯号转换成健康指标， Gen AI 再把健康指标转换成现场可以採取的行动，例如：建议检查滑轨润滑状态、观察 X 轴马达振动趋势、安排下一次停机窗口检查模具、比对近期良率下降是否与设备健康分数同步。

双脑分工：机器学习与 Gen AI 的核心能力对比

评估维度	机器学习	Gen AI
核心角色	看懂设备	看懂人
资料输入	物理感测数据、高频时间序列	文字、历史报告、健康分数
核心强项	基准偏移比对、微小异常侦测	知识推论、脉络解释、跨部门沟通
产出形式	健康度、动态相似度	维修建议、风险说明报告

半导体产业案例：机械手臂如何避免刮片风险

当动态相似度下降时，系统即可提前发现异常，避免问题扩大成产品损失。这种方式不只是设备监测，更是品质管理的重要工具。

在半导体工厂中，晶圆搬送手臂是极为重要的设备。每一次搬送动作都关係着产品良率。当 Fork 结构磨耗、滑轨老化或机构松动时，设备不一定会停机，但却可能导致刮片、撞片、定位误差与良率下降。

透过机器学习建立搬送动作规范后，每一次取放晶圆动作都会被持续比对。当动态相似度下降时，系统即可提前发现异常，避免问题扩大成产品损失。这种方式不只是设备监测，更是品质管理的重要工具。

从「设备异常」延伸到「製程风险」

半导体产线的设备健康管理不能只看维修成本，还必须看製程风险。一支手臂的微小偏移，可能影响的不只是设备本身，而是晶圆刮伤、破片、批量报废、客诉与交期延误。因此，设备健康分数若能与良率、破片纪录、Alarm log、保养纪录与 Recipe 资料整合，就能从单纯维修工具升级为製程风险预警工具。

举例来说，当某台搬送手臂的动态相似度在两週内逐步下降，同时某一站点的刮伤率略微上升，即使尚未达到传统警报门槛，管理者也能提前安排检查。这种做法能把维修决策从「被警报推着走」转变为「用数据主动排程」。

光阻涂布机手臂动作如何监测？

专用于光阻涂布机搬送晶圆的机械手臂必须具有高度的精度和稳定性，确保减小机械振动对晶圆表面的影响，如何确保手臂稳定度？

光阻涂布机手臂动作如何监测？

为各别动作进行监测与诊断

冲压设备案例：从设备监测走向不良品预防

一旦动作开始偏离正常规范，即可提早安排检查。企业不再只是等设备坏掉，而是能够主动避免大量不良品产生。

传统冲压设备维护大多依靠定期保养。然而模具磨耗速度并不一定固定。有些模具提前劣化，有些模具则仍然维持良好状态。如果只依靠时间保养，容易造成过度维护、维护不足与不必要成本增加。

透过机器学习监测冲压动作后，系统可以持续比较每次加工特徵。一旦动作开始偏离正常规范，即可提早安排检查。企业不再只是等设备坏掉，而是能够主动避免大量不良品产生。

冲压监测的重点不只在机台，也在模具生命週期

冲压产线的品质变异，常常与模具状态高度相关。模具磨耗、间隙改变、材料批次差异、润滑条件与送料稳定性，都可能改变冲压瞬间的振动与力量特徵。若系统能把每一次冲压动作转换成可比较的特徵值，就能建立模具生命週期的健康曲线。

这样的管理方式可以协助企业回答更精准的问题：某组模具是否比预期更快劣化？哪一段加工动作最先出现异常？目前应该立即换模，还是可以维持到下一个排程窗口？这些问题若只靠经验判断，很容易受人员能力与班别差异影响；若能透过机器学习量化，就能形成更一致的管理标准。

冲压模具异常造成大量不良品产生？

高速冲压机台在短时间内大量重複产品生产，若发生模具磨损或异常，将会产生大批量的不良品。

冲压模具异常造成大量不良品产生？

冲压模具异常？

及时拦截不良品

最好的工业 AI，不是最会说话，而是最懂设备

Gen AI 的出现确实改变了世界。但在工业现场，Gen AI 并不会取代机器学习。因为设备管理最重要的工作不是写报告，而是找出异常。机器学习负责学习设备正常状态，负责清洗特徵数据，负责建立健康模型，负责判断设备好坏；而 Gen AI 则负责把这些结果转换成人类容易理解的语言。

因此未来真正成功的工业 AI 架构，并不是单一依靠 Gen AI，而是结合机器学习与 Gen AI 的双 AI 架构。机器学习负责看懂设备， Gen AI 负责看懂人。当两者结合时，企业不只能掌握设备健康状态，更能进一步提升良率、降低停机风险，并真正实现智慧製造的目标。

对製造业而言，这场 AI 转型的重点不是追逐最流行的工具，而是建立一套能长期累积、持续学习、被现场信任的设备知识系统。 Gen AI 可以让知识被更快理解，但机器学习才是让设备状态被正确看见的基础。当工厂能同时做到「看见异常」、「解释异常」与「採取行动」，AI 才不只是技术名词，而会真正成为企业竞争力的一部分。

所以，当企业讨论 Gen AI 如何进入工厂时，真正应该思考的不是「能不能让 AI 帮我写报告」，而是「我是否已经有足够可靠的设备健康资料，让 AI 能够说出有根据的报告」。这正是机器学习在设备健康管理中不可取代的原因。

未来的智慧工厂，不会只靠会说话的 AI，而会靠懂设备的 AI。机器学习让工厂看见设备正在发生什么， Gen AI 让人理解下一步应该做什么。两者结合，才是工业 AI 真正成熟的样子。

上一期下一期