下面以項目數(shù)據(jù)為例進行K值分析。
● K值并不是不變的,而是隨著樣本數(shù)據(jù)的增多在不斷改變。接下來,我們會以實際項目數(shù)據(jù)為例來分析K值的變化情況。原始數(shù)據(jù)個數(shù)是78,測試結(jié)果是得到100個預(yù)測點。本實驗只考慮Gompertz模型和Logistic模型。
◆ 測試開始初期,僅有9個數(shù)據(jù)時進行預(yù)測,如圖2
選擇9個數(shù)據(jù)是因為三和法對數(shù)據(jù)的基本要求即為“樣本數(shù)據(jù)個數(shù)大于9個”,所以我們選擇起點:9個數(shù)據(jù)點作為漸近值分析的起點。
從圖2中可以看出,9個數(shù)據(jù)時,樣本數(shù)據(jù)的累積值為100,預(yù)測值(即K)為187.0和103.5,這意味著樣本的趨近值為187.0和103.5,即到100個數(shù)據(jù)時,應(yīng)當(dāng)發(fā)現(xiàn)187.0或103.5個缺陷。Gompertz模型和Logistic模型都較為符合樣本趨勢,Gompertz模型稍好。
圖2 9個樣本數(shù)據(jù)時的預(yù)測
圖3 29個樣本數(shù)據(jù)時的預(yù)測圖
◆ 測試逐步進行,Gompertz模型數(shù)據(jù)增加到29個時進行預(yù)測,如圖3
選擇數(shù)據(jù)個數(shù)29的原因:根據(jù)實驗得出,Gompertz模型的拐點出現(xiàn)在大約在37%(1/e)的位置。這里我們使用的歷史數(shù)據(jù)個數(shù)是78個,因此得到拐點的位置大概在第29個。
從圖3中可以看出,29個數(shù)據(jù)時,樣本數(shù)據(jù)累積值是555,可見之前預(yù)測得到的K(187.0和103.5)都不再符合趨勢。此時,Gompertz模型預(yù)測出的K值為953.6,Logistic模型預(yù)測出的K值為536.8,這意味著樣本的趨近值為953.6或536.8,即到100個數(shù)據(jù)時,應(yīng)當(dāng)發(fā)現(xiàn)953.6或536.8個缺陷。這時的Gompertz模型和Logistic模型差異較大,從各個擬合度指標及樣本數(shù)據(jù)累積值來看,Gompertz模型更好。但是,實驗中,Logistic模型的拐點并不在37%處,而是在50%處。