系统的可靠性
最近在讨论GM汽车质量问题时,相当一部分人把汽车质量问题推给生产线上
的组装工人。当然组装工人肯定是有责任的。但是组装工人应该承担多少责
任,如果你对现代化大系统的可靠性成因不甚了解,你是不能正确回答这个
问题的。
真正在大学里讲可靠性那要讲好几本厚书呢。我在这只不过是科普一番,力
求简洁。
大系统诸如汽车,其可靠性是在设计,组装,维修中建立的。维修主要是客
户的事,不在这里花费太多笔墨。
可靠性首先是在设计中产生的。一般都把大系统看成是子系统的串连,所以
每个子系统可靠性的乘积才是大系统的可靠性。为了达到总体可靠性,设计
人员应该选用可靠性较高的零件。这个模型是粗略模型,更加精确的模型是
压力-承受力分析(Stress-Strength Analysis)。例如,某模块的运行电
压是这么高,这模块能不能承受这个电压。在某环境温度下,半导体结温度
会达到这么高,半导体结能不能承受这个温度。某材料在运行中要受到机械
压力,而这材料能否在当时的环境温度下承受这个压力。压力和承受力都不
是常数而是时间的函数。随着时间的推移,零件老化,承受力会逐渐降低,
而压力会逐渐升高。当压力高于承受力的时候,这零件就出故障了。
系统的工作性能(Performance)越高,子系统受到的压力越大。从这个角度
看,工作性能和可靠性是相互冲突的。系统设计的越合理,子系统受到的压
力越小。所以要想获得较高的系统可靠性,工作性能不能太高,子系统间的
运行关系要非常合理,子系统,零件的承受力要很高。这就需要设计者权衡
工作性能和系统可靠性,了解子系统在不同环境下承受力的衰减曲线,以高
超的设计技巧减低子系统受到的压力,选择合适的零件。
可靠性工程师要对设计的不同层次做可靠性实验。用高压,恶劣环境来模拟
常用环境时间效应以求验证在常用环境下,某段时间后,承受力仍然高于压
力。可靠性工程师在组装前,还要领导“婴儿”实验,让所有零件和子系统
度过“婴儿高亡期”。
对生产线的组装做质量控制也是实现可靠性关键的一环。质量工程师要对生
产线的输出品进行监测,把测量值和目标值进行比较。如果误差小于允许值
就判定合格。如果误差高于允许值就判定不合格。当有误差高于允许值时,
质量工程师要对输出品做统计分析,来确定这误差是偶然因素造成,还是必
然因素造成。如果误差是偶然因素造成的,只把这个不合格的输出品挑出来
就行了。如果误差是必然因素造成的,质量工程师要通知生产线系统工程师
寻找出错根源(Root Cause Analysis)。找到后,要改正,调整生产线系统
使得误差小于允许值。
如果生产线的输出品全部合格,组装就应该满足系统的设计可靠性。那么生
产线工人的操作能不能影响系统可靠性呢?当然能,如果一个工人的操作失
误率太高,其有错输出品又逃过了质量工程师的监测,肯定会影响系统可靠
性的。可是就算这种情况发生了,质量工程师还是要负主要责任。
综上所述,系统的可靠性主要取决于设计工程师,可靠性工程师,质量工程
师,生产线系统工程师。而工人的操作失误主要是因不合格品给公司造成经
济损失。
维修也是为了减低零件和子系统所受的压力。主动维修比故障维修廉价且更
能维持系统的可靠性。还有一种维修叫机会维修。例如,某个车灯在接近其
寿命期的时候坏了。当你打开车灯舱换车灯的时候,应该把舱内的灯泡都换
了。灯泡才两到三美金一个。这种做法也是廉价且更能维持系统的可靠性的
维修。
|