Binaarne logit mudel
Binaarset mudelit kasutatakse siis, kui sõltuv tunnus Y saab omada vaid kahte väärtust: 0 või 1. Binaarse logit mudeli korral otsitakse binaarse muutuja \(Y\) väärtuse 1 esinemise tõenäosust kujul $$P(Y = 1|\mathbf{X}) = \frac{1}{1 + e^{ -\Lambda }},$$ kus logit \(\Lambda\) on lineaarne funktsioon regressoritest \(x_j\): $$\Lambda = {\theta _0} + {\theta _1}{x_1} + {\theta _2}{x_2} + \cdots + {\theta _k}{x_k}.$$ Parameetrite \(\theta_j\) hindamiseks kasutatakse suurima tõepära meetodit MLE (Maximum Likelihood Estimation).
PõhimenüüstModel -> Limited dependent variable -> Logit -> Binary
Seejärel tuleb aknas "gretl: specify model" olemasolevate tunnuste komplektist valida sõltuv tunnus (Dependent variable) ja üks või mitu regressorit (Regressors).
Lisavalikud
- Set as default - soovitav, kui on plaanis hinnata mitut erinevat mudelit, kus sõltuv tunnus on sama.
- Robust standard errors - parameetrite hinnangute standardvigade leidmiseks kasutatakse kohandatud standardvigu. Soovitav kasutada siis, kui heteroskedastiivsust pole õnnestunud likvideerida. Millist kohandatud standardvigade arvutamise meetodit kasutatakse, saab valida nupu QML alt.
- Show iteration results - kuvatakse logaritmilise tõepära maksimumi otsimisel läbitud sammud;
- Show slopes at mean - aruande viimases veerus kuvatakse tõenäosuse marginaalväärtused;
- Show p-values - aruande viimases veerus kuvatakse tunnuste olulisuse tõenäosused p;
- Nupp "+" võimaldab genereerida uut tunnust.
NÄIDE
Kasutame andmefaili Gujarati Table_15.7.gdt, kus on ühe ülikooli üliõpilaste õppeedukuse andmed. GRADE=1, kui üliõpilase tulemus aines mikroökonoomika oli A ja GRADE=0, kui tulemus oli B või C. Sõltuvaks tunnuseks on GRADE, regressoriteks GPA, TUCE ja PSI. Põhimenüüst Model -> Limited dependent variable -> Logit -> Binary.
Valime sellise aruande, kus kuvatakse olulisuse tõenäosused p.

Genereeritakse vastav aruanne
Sõltuva tunnuse GRADE keskmine 0,344 näitab, et 34,4%-l valimisse kuulunud üliõpilastest GRADE=1.
Tõepära suhte testi olulisuse tõenäosus \(p=0,0015 < 0,05 \) ning nullhüpotees on ümber lükatud: mudel on statistiliselt oluline.
Tunnuse TUCE olulisuse tõenäosus \(p=0,5014 > 0,05 \) ja see tunnus ei ole statistiliselt oluline, teised tunnused on.Õigesti prognoositud vaatluste arv on 26, mis teeb 81,3% kõikidest vaatlustest. Nendest nulle on õigesti prognoositud 18 vaatluse korral, mis on 85,7% kõikidest nullidest. Ühtesid on õigesti prognoositud 8 korral, mis on 72,7% kõikidest ühtedest. Seega nullide prognoosimisvõime on mõnevõrra kõrgem.
Regressorite mõju suunda tõenäosusele \(P(GRADE=1)\) näitavad parameetrite märgid:- kui GPA suureneb, siis tõenäosus, et üliõpilase tulemus oli A (GRADE=1), suureneb;
- kui PSI suureneb, siis tõenäosus, et üliõpilase tulemus oli A (GRADE=1), suureneb;
- tunnuse TUCE mõju pole tõestatud.
Regressorite mõju täpsemaks uurimiseks tuleks vaadata tõenäosuse marginaalväärtusi. Selleks hindame mudelit uuesti ja aknas "gretl: specify model" teeme valiku Show slopes at mean. Kuvatakse samasugune aruanne, kuid tabeli viimases veerus slope on tõenäosuse marginaalväärtused sellise vaatluse jaoks, millel seletavate tunnuste väärtused võrduvad valimi keskmistega.

Tõenäosuse marginaalväärtuste arvutamisel kasutatakse tõenäosuse marginaalväärtust logiti suhtes. Näiteks tõenäosuse marginaalväärtus tunnuse GPA suhtes
$$\frac{\partial P}{\partial \, \text{GPA}}=\frac{dP} {d \Lambda} \theta_j = 0{,}189\cdot 2{,}82611 \approx 0,534.$$ Järelikult, kui üliõpilase sisseastumise testi keskmine tulemus GPA oli 1 punkti võrra kõrgem, siis tõenäosus, et ta mikroökonoomika eksamil sai tulemuseks "A" (GRADE=1), on 0,534 võrra suurem. See kehtib nö keskmise üliõpilase jaoks, kellel GPA, TUCE ja PSI omavad keskmisi väärtusi.