Õpiobjektid -> Andmeanalüüs MS Excelis (MS Excel 2010 baasil)

ANDMEANALÜÜS MS EXCELIS


Õpiobjekti kirjeldus
Õpijuhis
 
Sissejuhatus
 
Peamised andmeanalüüsi teostamise vahendid MS Excelis
Sagedustabelid
Arvkarakteristikud
Usalduspiirid
Hüpoteeside kontrollimine
(ühe ja kahe üldkogumi võrdlus)
Korrelatsioonanalüüs
Regressioonanalüüs
Kahemõõtmeline sagedustabel
Dispersioonanalüüs
Trikke ja nippe
Lisa
¤ Kogu materjal ühe pdf-failina: stat_excelis.pdf

Hii2-test (χ2-test)

Mittearvuliste ja/või diskreetsete arvtunnuste vahelise kahemõõtmelise sagedustabeli kujul esitatud seose statistilise olulisuse testimiseks kasutatakse sagedaimini χ2-testi, millele vastav hüpoteeside paar on kujul:

H0: tunnused on sõltumatud ehk potentsiaalne riskifaktor ei mõjuta uuritava sündmuse toimumist,
H1: tunnused on sõltuvad ehk potentsiaalne riskifaktor mõjutab uuritava sündmuse toimumist.

MS Excelis on χ2-test teostatav funktsiooniga CHISQ.TEST, mis teostab andmetele vastava empiirilise ja nullhüpoteesile vastava teoreetilise sagedustabeli võrdluse ning annab tulemuseks olulisuse tõenäosuse p väärtuse.

Funktsiooni CHISQ.TEST rakendamiseks tuleb

  1. konstrueerida uuritavate tunnuste vaid absoluutsagedusi sisaldav kahemõõtmeline sagedustabel (nö empiiriline, andmetele vastav sagedustabel),
  2. arvutada teise tabelisse tunnuste sõltumatuse juhule (nullhüpoteesile) vastavad oodatavad teoreetilised sagedused valemist

nij = ni.*n.j / n,

kus nij on oodatav sagedus tabeli i. reas ja j. veerus, ni. ja n.j on vastavalt sagedustabeli i. rea ja j. veeru summad ning n on vaatluste arv,

  1. panna kursor lahtrisse, kuhu soovite saada χ2-testi p-väärtust, ning rakendada funktsiooni CHISQ.TEST, andes argumentidena ette
  • empiirilised sagedused (Actual_range) ja
  • oodatavad teoreetilised sagedused (Expected_range).

NB! Funktsiooni CHISQ.TEST argumentidena antakse sagedustabelid ette ilma ääre-summadeta.

Joonisel 65 on näidatud χ2-testi teostamist testimaks tudengite soo ja õllejoomise vahelise seose statistilist olulisust. Nagu eelmise punkti lõpus kirjutatud, on tudengite sugu ja õllejoomine seotud - noormeeste hulgas on õllejoojaid rohkem. χ2-testi alusel saab väita, et see seos on ka statistiliselt oluline (p < 0,001).

Märkus. χ2-test on asümptootiline test, st et arvutatav teststatistik on χ2-jaotusega vaid ligikaudu ja testi tulemus on seda täpsem, mida rohkem on andmeid. Traditsiooniliselt loetakse χ2-testi kasutamine õigustatuks, kui kõigis teoreetilise sagedustabeli lahtrites paiknevad sagedused on viiest suuremad (nij ≥ 5).

Täpsemalt χ2-testi kohta vt õpiobjektist "Binaarsete tunnuste analüüsimeetodid".
 

Joonis 65. χ2-testi läbiviimine Excelis funktsiooniga CHISQ.TEST testimaks tudengite soo ja õllejoomise vahelise seose statistilist olulisust kahemõõtmelise sagedustabeli alusel.

 


< Eelmine

Creative Commons License Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License