LSDV mudeli F-statistik

F-statistikut kasutatakse mudeli statistilise olulisuse testimiseks, kus nullhüpoteesiks on, et kõikide tunnuste kordajad on nullid: \(H_0:\;\beta_1=0,\,\beta_2=0,\,...\). Sisukas hüpotees on, et vähemalt ühe tunnuse kordaja on nullist erinev. Nullhüpotees tähendab, et sõltuva tunnuse keskväärtus on konstantne (ei sõltu regressoritest) ning võrdub mudeli vabaliikmega. F-statistik on regressioonhajuvuse keskruudu \(MSR\) ja jääkhajuvuse keskruudu \(MSE\) suhe ning allub F-jaotusele:$$F=\frac{MSR}{MSE}\sim F(k,n-k-1).$$Regressorite arv \(k\) on lugeja vabadusastmete arv ja \(n-k-1\) on nimetaja vabadusastmete arv. Mida suurem on regressioonhajuvus, võrreldes jääkhajuvusega, seda suurem on \(F\).

Fikseeritud efekte modelleeritakse üksikutele objektidele vastavate fiktiivsete tunnuste abil ja neid tunnuseid sisaldav mudel on LSDV (Least Square Dummy Variable) mudel. Mudeli parameetrite hindamiseks kasutatakse grupisisest mudelit, mis on saadud LSDV mudeli teisendamisel. Antud F-statistik iseloomustab nii fiktiivsete tunnuste kui ka regressorite mõju sõltuvale tunnusele.

NB! Kui me soovime hinnata regressorite mõju, tuleb vaadata teist F-testi, mis on regressorite statistilise olulisuse testimiseks.