關(guān) 閉

新聞中心

EEPW首頁(yè) > 工控自動(dòng)化 > 設(shè)計(jì)應(yīng)用 > 電子電路中偶發(fā)故障的成因與探查方法

電子電路中偶發(fā)故障的成因與探查方法

作者:于悅1,于杏2,武曄卿3(1.中北大學(xué),太原 030051;2.北京自動(dòng)化控制設(shè)備研究所,北京 100074;3.瑞迪航科(北京)技術(shù)有限公司,北京 100176) 時(shí)間:2023-05-09 來(lái)源:電子產(chǎn)品世界 收藏
編者按:電子產(chǎn)品有兩類小概率故障,量產(chǎn)電子產(chǎn)品中極少產(chǎn)品發(fā)生偶發(fā)故障,或單臺(tái)產(chǎn)品在長(zhǎng)時(shí)間工作下發(fā)生偶發(fā)可恢復(fù)故障。如何再現(xiàn)這兩類故障,成為困擾設(shè)計(jì)師的難題。本文通過(guò)類比方法論,闡明了這類故障的發(fā)生機(jī)理,并得出探查測(cè)試出此類問(wèn)題隱患的技術(shù)方法,以及對(duì)故障發(fā)生概率的量化預(yù)判。在此方法得出的結(jié)論基礎(chǔ)上,后續(xù)技術(shù)工程師可以簡(jiǎn)單明了地找到偶發(fā)故障的解決思路。

批量生產(chǎn)的電子產(chǎn)品在投入市場(chǎng)應(yīng)用后,常會(huì)有個(gè)別出現(xiàn)一些,退回到廠家實(shí)驗(yàn)室后,施加各種應(yīng)力進(jìn)行故障激發(fā)試驗(yàn),卻又不能故障再現(xiàn);還有一種情況是研制的有限臺(tái)數(shù)樣機(jī)產(chǎn)品,長(zhǎng)時(shí)間拷機(jī)運(yùn)行中,個(gè)別臺(tái)次有很低概率的,或者可自行恢復(fù),或者經(jīng)過(guò)人工重啟后也能恢復(fù),但人為施加各種應(yīng)力進(jìn)行試驗(yàn),卻不能再現(xiàn)?;蛘呒词构收显佻F(xiàn)了,卻需要超常規(guī)高應(yīng)力的激發(fā),在現(xiàn)實(shí)工況中,這種應(yīng)力又根本不會(huì)存在,這樣的實(shí)驗(yàn)方法即使有故障再現(xiàn),也缺乏技術(shù)支持的說(shuō)服力。

本文引用地址:http://m.butianyuan.cn/article/202305/446372.htm

在生產(chǎn)檢驗(yàn)階段,批量較大的產(chǎn)品,限于制程過(guò)程成本,不太可能做到逐臺(tái)的全性能檢驗(yàn),只能采用抽樣的方式,抽取少量的樣機(jī)進(jìn)行全性能參數(shù)的測(cè)試(大多數(shù)機(jī)器做主要參數(shù)測(cè)試即可),然后將抽樣樣機(jī)的測(cè)試結(jié)果與預(yù)期設(shè)計(jì)性能指標(biāo)對(duì)比,如果都在指標(biāo)要求范圍內(nèi),則批次性放行。但是這種貌似合理的方法里,卻蘊(yùn)藏著一個(gè)大隱患,就是小概率隱患的機(jī)器抽樣時(shí)抽不到的問(wèn)題。

如何確認(rèn)單臺(tái)產(chǎn)品工作狀態(tài)的穩(wěn)定性,以及多臺(tái)產(chǎn)品批次生產(chǎn)質(zhì)量控制的一致性這兩個(gè)問(wèn)題呢?這兩項(xiàng)是產(chǎn)品質(zhì)量可靠性的核心問(wèn)題。這兩個(gè)問(wèn)題的成因、機(jī)理、檢測(cè)方法,是本文研究的主題。

1 方法描述

下面用類比的方法來(lái)解釋問(wèn)題的機(jī)理。假設(shè)1 個(gè)班級(jí),有50 個(gè)孩子,兩周后要去市里參加統(tǒng)考,如果100% 的孩子統(tǒng)考都及格則重獎(jiǎng)老師。作為老師,一般會(huì)先出1 套模擬試卷做摸底測(cè)驗(yàn),如果摸底的結(jié)果是50 個(gè)孩子都及格,那兩周后的市統(tǒng)考是不是也一定能保證100% 及格呢?答案自然是不能肯定的。雖然都及格了,但50 個(gè)孩子的分?jǐn)?shù)從60~100 分都有,按照常識(shí)判斷,60~65 分的孩子統(tǒng)考不及格的風(fēng)險(xiǎn)概率就會(huì)大一些??墒沁@幾個(gè)孩子就一定會(huì)不及格嗎?答案是也不一定。

每個(gè)孩子的實(shí)際水平會(huì)是一個(gè)基數(shù),考試的次數(shù)足夠多,其分?jǐn)?shù)就會(huì)圍繞這個(gè)基數(shù)波動(dòng),這個(gè)基數(shù)就是多次考試結(jié)果的均值μ,用(圖1)來(lái)解釋,A 孩子多次考試的均值μa = 64,B 孩子的均值為μb = 72,當(dāng)A 某次考試的種種隨機(jī)原因影響,則有一定的小概率跌到60分以下;而B(niǎo) 因?yàn)閷?shí)際水平均值在72 分,即使發(fā)生一些隨機(jī)因素影響,即便考砸的后果也能在65 分以上。

1683638388630341.png

圖1

A 和B 這兩類不及格的原因會(huì)有所區(qū)別,A 會(huì)因?yàn)槌煽?jī)均值水平偏低(μa = 64)和隨機(jī)概率事件(如題型變化、心理變化等)引起的波動(dòng)導(dǎo)致小概率性不及格;B 則基本不太會(huì)因?yàn)槌R?guī)隨機(jī)小概率事件影響導(dǎo)致不及格,但它有另一種隱患,就是可能會(huì)因?yàn)榘l(fā)生大的特定意外(如發(fā)燒、牙疼、情感受挫等)而不及格。

因此,為了確保參加市統(tǒng)考的50 個(gè)孩子都能及格,就可以針對(duì)可能不及格的因素,針對(duì)性地做好預(yù)防,對(duì)A 類孩子強(qiáng)化補(bǔ)課,補(bǔ)課把分?jǐn)?shù)都提高到80 分以上;對(duì)B 類孩子呵護(hù)有加,防止考前發(fā)生大的意外,比如封閉管理,清淡飲食,禁止激烈對(duì)抗性運(yùn)動(dòng)等。做好這兩點(diǎn),隨機(jī)小事件不至于導(dǎo)致不及格,個(gè)別大意外不會(huì)發(fā)生或者即使發(fā)生也不讓它影響到考試,批量統(tǒng)考不及格問(wèn)題便迎刃而解。

依據(jù)如上道理,做類比分析,1 臺(tái)產(chǎn)品里,假設(shè)有50 個(gè)參數(shù),每個(gè)參數(shù)類比于1 個(gè)孩子的成績(jī),參數(shù)的類型有電壓、電流、溫度、扭矩、流量、壓力等,每個(gè)參數(shù)在工作中多少總有點(diǎn)波動(dòng),但設(shè)計(jì)師在產(chǎn)品設(shè)計(jì)上對(duì)這些波動(dòng)也會(huì)有一定的容忍度,這個(gè)容忍度的邊界便是及格線60 分。在廠區(qū)里拷機(jī)的時(shí)候設(shè)備一切正常,可以理解成摸底考試的每個(gè)參數(shù)都在60 分以上。

但到了客戶現(xiàn)場(chǎng)后,工況條件有所變化,這些參數(shù)工作時(shí)會(huì)有所波動(dòng),原來(lái)在廠區(qū)A 類的參數(shù)(類比A類的孩子)因現(xiàn)場(chǎng)隨機(jī)工況導(dǎo)致波動(dòng)偶發(fā)偏大,參數(shù)低于60 分臨界值的小概率偶發(fā)故障就可能發(fā)生了。隨機(jī)事件在現(xiàn)場(chǎng)是不可消除的,解決方法是提高A 類孩子的均值分?jǐn)?shù),即使有隨機(jī)事件減分的影響,也不至于低于及格線,便可降低整機(jī)的故障概率了。

而遠(yuǎn)離臨界值余量比較大的B 類參數(shù)(類比為B類的孩子),常規(guī)的一般性波動(dòng),不會(huì)造成小概率的偶發(fā)故障,但有可能因?yàn)橥话l(fā)大事件工況導(dǎo)致B 類參數(shù)也會(huì)超出臨界值,如電機(jī)的突然啟停、突然的沖擊振動(dòng)等。解決方法是抑制大事件的幅度、處理大事件耦合過(guò)來(lái)的影響程度、提高受擾部分的抗擾能力,便可降低B 類問(wèn)題的故障概率。

理解了如上的原理,針對(duì)偶發(fā)故障的探查方法就可以得出如下幾條思路:

1)對(duì)于現(xiàn)場(chǎng)的偶發(fā)故障,故障機(jī)器返廠回實(shí)驗(yàn)室后,不必再把故障復(fù)現(xiàn)作為首選工作方案,因?yàn)檫@種小概率偶發(fā)故障有可能根本復(fù)現(xiàn)不了,就好像A類的孩子,摸底考三五份試卷,不一定肯定會(huì)低于60 分,考上千份試卷或許可能有一兩次不及格,但時(shí)間成本、試驗(yàn)費(fèi)用,又不能接受。

2)根據(jù)故障現(xiàn)象,分析可能導(dǎo)致此問(wèn)題的被懷疑參數(shù);

3)查出每個(gè)被懷疑參數(shù)的臨界值(電學(xué)參數(shù)可查閱信號(hào)接收入口端的電壓或電流容限[1]);

4)若故障機(jī)器不方便返廠,甚至可以找1 臺(tái)跟故障機(jī)器在設(shè)計(jì)方案、器件型號(hào)和廠家、工藝幾方面完全相同的機(jī)器,對(duì)被懷疑的問(wèn)題參數(shù)(數(shù)據(jù)或波形)進(jìn)行測(cè)量;

5)將測(cè)試結(jié)果與臨界值(類比于60 分及格線)做對(duì)比,評(píng)估出其大概分?jǐn)?shù),定性分析看是否在臨界值以上的余量是否夠大;

6)對(duì)測(cè)量出的在常態(tài)工作下參數(shù)分值都高出60 分余量不多的參數(shù),進(jìn)行專項(xiàng)整改,提高其常態(tài)均值。然后做批量驗(yàn)證,如果偶發(fā)小概率故障不再出現(xiàn)的話,整改方案則可評(píng)審?fù)ㄟ^(guò)。完美避開(kāi)故障再現(xiàn)不能實(shí)現(xiàn)的難題。這個(gè)做法類比對(duì)應(yīng)針對(duì)A 類孩子的做法;

7)檢查產(chǎn)品中的功能模塊、以及產(chǎn)品周邊配套的設(shè)備,是否有瞬態(tài)啟停的大功率工況。搭建模擬實(shí)驗(yàn)環(huán)境,人為制造這種工況,在相應(yīng)工況下,測(cè)試余量較大的被懷疑相關(guān)參數(shù),檢查波動(dòng)時(shí)是否有低于或接近于臨界值的情況,如果有,則針對(duì)這種工況下的參數(shù)進(jìn)行整改,整改后,做單臺(tái)測(cè)試,模擬干擾工況下,該參數(shù)波動(dòng)值都能遠(yuǎn)離臨界值,整改方案則可評(píng)審?fù)ㄟ^(guò)。這個(gè)做法類比針對(duì)B 類孩子的做法。

2 量化分析

通過(guò)對(duì)參數(shù)數(shù)據(jù)的風(fēng)險(xiǎn)評(píng)估,判斷偶發(fā)故障是否由該參數(shù)引起,僅靠定性判斷既缺乏說(shuō)服力,也讓技術(shù)決策比較困難。因此需要有定量的分析方法。以信號(hào)電壓參數(shù)波動(dòng)導(dǎo)致出現(xiàn)偶發(fā)故障示例來(lái)說(shuō)明量化分析的步驟,以便據(jù)此判斷是否由此參數(shù)導(dǎo)致的偶發(fā)故障、也可根據(jù)分析結(jié)果預(yù)測(cè)實(shí)際產(chǎn)品的偶發(fā)故障概率值。

1)首先測(cè)試該波形,然后隨機(jī)取樣,取樣值數(shù)量應(yīng)具備統(tǒng)計(jì)參考價(jià)值,可根據(jù)統(tǒng)計(jì)參考價(jià)值和實(shí)際操作的時(shí)間和人力成本綜合決定,推薦適當(dāng)多取一點(diǎn),也可根據(jù)統(tǒng)計(jì)采樣樣本量的計(jì)算公式來(lái)[2],按照顯著性水平5%,置信水平95%,計(jì)算得出適用的樣本數(shù)量。

2)取樣后,計(jì)算電壓值的均值μ 和標(biāo)準(zhǔn)差σ;

3)計(jì)算電路參數(shù),確認(rèn)電路對(duì)該輸入電壓要求的臨界值Vmax、Vmin 的具體值,這個(gè)值要結(jié)合具體電路確定,如5 V CMOS 數(shù)字芯片,輸入信號(hào)管腳的高電平臨界判定電壓一般為0.7×Vcc=3.5 V,常規(guī)標(biāo)稱值為4.9~5 V,最大允許值為Vcc+0.5 V,意指該管腳允許輸入的電壓應(yīng)該在(3.5 V,5.5 V)之間,超出這個(gè)區(qū)間,則有可能損壞或者電平信號(hào)出錯(cuò);

4)對(duì)比計(jì)算參數(shù)和電壓臨界值參數(shù),如3)中示例,至少需要滿足如下條件:

image.png

5)如果不滿足4)的條件,則需對(duì)該電路的紋波進(jìn)行整改,反復(fù)迭代,最終滿足要求。計(jì)算的過(guò)程可以借助EXCEL 或者統(tǒng)計(jì)分析軟件的強(qiáng)大計(jì)算功能來(lái)完成,以節(jié)省人力。

6)根據(jù)2)計(jì)算出的均值μ 和標(biāo)準(zhǔn)差σ 的結(jié)果,在不整改的情況下,看臨界值在統(tǒng)計(jì)分布中的位置,利用正態(tài)分布的計(jì)算方法[3],可以計(jì)算出超出臨界值的發(fā)生概率,由此推斷出現(xiàn)場(chǎng)工況下的偶發(fā)故障概率。

3 案例應(yīng)用

某產(chǎn)品電源電壓紋波大,是偶發(fā)故障的疑似根源,波形如圖2。

1683638624685303.png

圖2

圖2 為5 V 的電源紋波波形圖(該圖為交流耦合測(cè)試結(jié)果),通過(guò)功能分析,產(chǎn)品偶發(fā)故障疑似與此電源的波動(dòng)相關(guān),于是測(cè)試該波形。結(jié)合電路分析,導(dǎo)致偶發(fā)故障的是下降的尖峰電壓,因?yàn)樾盘?hào)電壓直接跟隨電源電壓而波動(dòng),本應(yīng)該輸出高電平信號(hào),卻因?yàn)橄聸_的電源電壓導(dǎo)致輸出端的高電平電壓低,發(fā)送到接收端時(shí)可能識(shí)別不出來(lái)。以紋波電壓為研究對(duì)象,按照本文第三章的方法進(jìn)行測(cè)試分析。

1)以下沖的尖峰為研究對(duì)象,結(jié)合工程經(jīng)驗(yàn),這些突出的尖峰一般是開(kāi)關(guān)電源的MOSFET 開(kāi)和關(guān)瞬間形成的,預(yù)估定義下沖200 mV 以內(nèi)的波動(dòng)為電路的隨機(jī)事件引發(fā),超出200 mV 的為開(kāi)、關(guān)瞬態(tài)導(dǎo)致,而開(kāi)關(guān)瞬態(tài)形成的尖峰組事件也符合隨機(jī)事件的特征,以時(shí)間軸為抽樣點(diǎn),連續(xù)抽取下沖超出200 mV 的每個(gè)尖峰的電壓值,并記錄采樣數(shù)據(jù)1 000 個(gè)。

2)計(jì)算該下沖電壓的均值μ 和標(biāo)準(zhǔn)差σ(因?yàn)槭窍陆惦妷海陀诨€電壓,因此是個(gè)負(fù)數(shù));

3)計(jì)算電路參數(shù),確認(rèn)對(duì)電源Vcc 要求的低電平臨界值Vcc min;

4)對(duì)比計(jì)算參數(shù)和Vcc 臨界值參數(shù),應(yīng)滿足如下條件(由本節(jié)2)中可知,此公式中μ、σ 均為負(fù)值):

image.png

5)不滿足4)的條件,則需對(duì)紋波進(jìn)行整改抑制。

反復(fù)整改迭代直到滿足1683638782995521.png1683638797160337.png的要求。

4 結(jié)束語(yǔ)

總結(jié)起來(lái),本文的核心描述了偶發(fā)故障的兩個(gè)成因和解決方法,總結(jié)如下:

1)超出臨界值余量不多的參數(shù),即在及格線以上附近波動(dòng)的參數(shù)是偶發(fā)故障的根源之一,這里命名為“60分原理”,針對(duì)這類參數(shù)進(jìn)行整改提升,使參數(shù)值達(dá)到80,甚至90 分以上即可。這樣,可以繞開(kāi)故障再現(xiàn)的難題,在隱患產(chǎn)品正常工作的情況下,卻可以定位到問(wèn)題點(diǎn)、找到解決問(wèn)題的目標(biāo)對(duì)象和措施。量化值判斷的方法和故障概率的評(píng)估可運(yùn)用正態(tài)分布的原理和計(jì)算方法作為指導(dǎo)。

2)另一種引起偶發(fā)故障的根源是產(chǎn)品內(nèi)大功率模塊、以及周邊配套的大功率設(shè)備,在瞬態(tài)啟停的工況下,將本來(lái)余量足夠大、隨機(jī)干擾根本不足以導(dǎo)致其故障的參數(shù),給影響到了超出限制引起故障的地步。這部分的具體實(shí)驗(yàn)方法和機(jī)理比較易于理解,因此在本文中未做重點(diǎn)展開(kāi)和案例說(shuō)明,但它仍是一個(gè)需要重點(diǎn)關(guān)注的點(diǎn)和解決思路。

參考文獻(xiàn):

[1] 武曄卿,李東偉,石小兵.電路設(shè)計(jì)工程計(jì)算基礎(chǔ)[M].北京:電子工業(yè)出版社,2018,7.

[2] 賈俊平,何曉群,金勇進(jìn).統(tǒng)計(jì)學(xué)[M].第六版.北京:中國(guó)人民大學(xué)出版社,2015,1.

(本文來(lái)源于《電子產(chǎn)品世界》雜志2023年4月期)



評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉