新聞中心

EEPW首頁 > 模擬技術(shù) > 設(shè)計(jì)應(yīng)用 > 基于盒式圖的數(shù)據(jù)過濾與回歸分析算法

基于盒式圖的數(shù)據(jù)過濾與回歸分析算法

作者: 時(shí)間:2010-07-30 來源:網(wǎng)絡(luò) 收藏

接下來要對篩選出來的進(jìn)行,從而得到一個(gè)模型。
void regress(double* m,double* q,int n) //對數(shù)組
//m和q的數(shù)據(jù)用線性回歸法進(jìn)行擬合
//并用一條直線表示出它們之間的對應(yīng)關(guān)系
{ double average_m,average_q,total_m,total_q,L_mq,L_mm;
   double a,b; //擬合直線y=a+bx的2個(gè)待定系數(shù)
   for(int i=0;in;i++) .
   {
   //計(jì)算兩組數(shù)據(jù)的和total_m和total_q
   }
   average_m=total_m/n; //求的第一組數(shù)據(jù)的平均值
   average_q=total_q/n; //求的第二組數(shù)據(jù)的平均值
for(int j=0;jn;j++)
   {
利用公式(1)計(jì)算兩組數(shù)據(jù)m,q它們所有數(shù)據(jù)偏離程度的對應(yīng)相乘之和L_mq
   }
for(int k=0;kn;k++)
{
計(jì)算第一組數(shù)據(jù)m,它的所有數(shù)據(jù)偏離
程度的平方和L_mm
}
b=L_mq/L_mm; //計(jì)算出擬合直線的待定系數(shù)
//b的擬合值
a=average_q-b*average_m; //利用公式(2)算出參
//數(shù)a
}
從而得到一條線性直線,結(jié)束。
3 在實(shí)驗(yàn)數(shù)據(jù)上的實(shí)現(xiàn)
從SSMBSS(上海軟件度量基準(zhǔn)體系)中選取了一組數(shù)據(jù)(見表1),首先將其用散點(diǎn)圖列出來(見圖1),然后用盒形圖進(jìn)行數(shù)據(jù)清洗(見圖2),最后用得出擬合直線(見圖3)。

本文引用地址:http://m.butianyuan.cn/article/187868.htm

綜上所述,對于軟件度量過程中出現(xiàn)的數(shù)據(jù)冗余和失真的情況,可以通過數(shù)據(jù)過濾和進(jìn)行處理,除去那些離群的數(shù)據(jù),并得出相應(yīng)的擬合直線,這樣就可以分析出數(shù)據(jù)的規(guī)律,保證軟件的質(zhì)量,提高效率。
參考文獻(xiàn)
[1] FENTONenton N E, PFLEEGER S L. Softwaremetrics: a rigorouspractical apporach[M](第2版). 北京: 清華大學(xué)出版社, 2003.
[2] 郭志懋,周傲英.數(shù)據(jù)質(zhì)量和數(shù)據(jù)清洗研究綜述.軟件學(xué)報(bào)[J],2002(11).
[3] 王石,李玉忱,劉乃麗,等.在屬性級別上處理噪聲數(shù)據(jù)的數(shù)據(jù)清洗.計(jì)算機(jī)工程[J],2005(5).
[4] 徐建華.現(xiàn)代地理學(xué)中的數(shù)學(xué)方法.北京:高等教育出版社,2002.


上一頁 1 2 下一頁

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉