系統的可靠性
最近在討論GM汽車質量問題時,相當一部分人把汽車質量問題推給生產線上
的組裝工人。當然組裝工人肯定是有責任的。但是組裝工人應該承擔多少責
任,如果你對現代化大系統的可靠性成因不甚了解,你是不能正確回答這個
問題的。
真正在大學裡講可靠性那要講好幾本厚書呢。我在這只不過是科普一番,力
求簡潔。
大系統諸如汽車,其可靠性是在設計,組裝,維修中建立的。維修主要是客
戶的事,不在這裡花費太多筆墨。
可靠性首先是在設計中產生的。一般都把大系統看成是子系統的串連,所以
每個子系統可靠性的乘積才是大系統的可靠性。為了達到總體可靠性,設計
人員應該選用可靠性較高的零件。這個模型是粗略模型,更加精確的模型是
壓力-承受力分析(Stress-Strength Analysis)。例如,某模塊的運行電
壓是這麼高,這模塊能不能承受這個電壓。在某環境溫度下,半導體結溫度
會達到這麼高,半導體結能不能承受這個溫度。某材料在運行中要受到機械
壓力,而這材料能否在當時的環境溫度下承受這個壓力。壓力和承受力都不
是常數而是時間的函數。隨着時間的推移,零件老化,承受力會逐漸降低,
而壓力會逐漸升高。當壓力高於承受力的時候,這零件就出故障了。
系統的工作性能(Performance)越高,子系統受到的壓力越大。從這個角度
看,工作性能和可靠性是相互衝突的。系統設計的越合理,子系統受到的壓
力越小。所以要想獲得較高的系統可靠性,工作性能不能太高,子系統間的
運行關係要非常合理,子系統,零件的承受力要很高。這就需要設計者權衡
工作性能和系統可靠性,了解子系統在不同環境下承受力的衰減曲線,以高
超的設計技巧減低子系統受到的壓力,選擇合適的零件。
可靠性工程師要對設計的不同層次做可靠性實驗。用高壓,惡劣環境來模擬
常用環境時間效應以求驗證在常用環境下,某段時間後,承受力仍然高於壓
力。可靠性工程師在組裝前,還要領導“嬰兒”實驗,讓所有零件和子系統
度過“嬰兒高亡期”。
對生產線的組裝做質量控制也是實現可靠性關鍵的一環。質量工程師要對生
產線的輸出品進行監測,把測量值和目標值進行比較。如果誤差小於允許值
就判定合格。如果誤差高於允許值就判定不合格。當有誤差高於允許值時,
質量工程師要對輸出品做統計分析,來確定這誤差是偶然因素造成,還是必
然因素造成。如果誤差是偶然因素造成的,只把這個不合格的輸出品挑出來
就行了。如果誤差是必然因素造成的,質量工程師要通知生產線系統工程師
尋找出錯根源(Root Cause Analysis)。找到後,要改正,調整生產線系統
使得誤差小於允許值。
如果生產線的輸出品全部合格,組裝就應該滿足系統的設計可靠性。那麼生
產線工人的操作能不能影響系統可靠性呢?當然能,如果一個工人的操作失
誤率太高,其有錯輸出品又逃過了質量工程師的監測,肯定會影響系統可靠
性的。可是就算這種情況發生了,質量工程師還是要負主要責任。
綜上所述,系統的可靠性主要取決於設計工程師,可靠性工程師,質量工程
師,生產線系統工程師。而工人的操作失誤主要是因不合格品給公司造成經
濟損失。
維修也是為了減低零件和子系統所受的壓力。主動維修比故障維修廉價且更
能維持系統的可靠性。還有一種維修叫機會維修。例如,某個車燈在接近其
壽命期的時候壞了。當你打開車燈艙換車燈的時候,應該把艙內的燈泡都換
了。燈泡才兩到三美金一個。這種做法也是廉價且更能維持系統的可靠性的
維修。
|