Andmeanalüüs MS Exceli abil


Kahemõõtmeline sagedustabel.
c2-test


 

Kahemõõtmeline sagedustabel

c2-test

  
Kahemõõtmeline sagedustabel

Mittepidevate tunnuste vahelise seose iseloomustamiseks kasutatav kahemõõtmeline sagedustabel on MS Excelis konstrueeritav Pivot Table abil.

 1. Selleks tuleb valida reafaktoriks üks ja veerufaktoriks teine uuritav tunnus. 
     
 2. Tabeli Data-lahtrisse lohistada suvaline tunnus paremal asuvast tunnuste loetelust ning peale hiire vasaku nupu topeltklõpsu sellel valida leitavaks arvkarakteristikuks vaatluste arv Count

Pivot Table 2-mõõtmeline sagedustabel

 1. Rea ja/või veeru suhteliste sageduste leidmiseks tuleb korrata sammu 2, st. lohistada tabeli Data-lahtrisse uuesti üks tunnus vasakul asuvast loetelust ning määrata leitavaks arvkarakteristikuks Count
  Kuid lisaks sellele tuleb valida leitavate arvkarakteristikute määramise aknast käsk Options >>, mille tagajärjel avatud aken pikeneb. Pikenenud aknast määrata rippmenüüst Show data as: valik % of row reasageduste või % of column veerusageduste leidmiseks.

Pivot Table - suhtelised sagedused

Konstrueerides absoluutseid sagedusi ja suhtelisi reasagedusi sisaldava kahemõõtmelise sagedustabeli tudengite soo ja mannapudrulembuse uurimiseks, saame tulemuse kujul

    Mannapuder?      
Sugu Data ei  ja  võib-olla Grand Total
Mees Count of Mannapuder? 3 7 1 11
Count of Mannapuder?2 27.27% 63.64% 9.09% 100.00%
Naine Count of Mannapuder? 9 12 1 22
Count of Mannapuder?2 40.91% 54.55% 4.55% 100.00%
Total Count of Mannapuder? 12 19 2 33
Total Count of Mannapuder?2 36.36% 57.58% 6.06% 100.00%

Tabelist loeme välja, et kokku uuriti 33 tudengit, neist 11 olid mehed ja 22 naised, 57,6% armastas ja 36,4% ei armastanud mannaputru, oma suhtumist mannapudrusse ei osanud väljendada 2 tudengit (so.6%). Meeste ja naiste võrdlusest näeme, et veidi üle veerandi (27,3%) meestest ei armasta mannaputru, samas kui naiste hulgas on mannaputru mittearmastavate isikute osakaal 40,9%. Mannapudrusse suhtusid positiivselt 63,6% mees-tudengitest ja 54,6% naistudengitest.
     


Üles


   
c2-test

Mittepidevate tunnuste vahelise seose statistilise olulisuse kontrollimiseks sobib MS Exceli keskkonnas funktsioon CHITEST(actual_range, expected_range), kus actual_range ja expected_range on vastavalt empiirilise ja teoreetilise sagedustabeli andmeblokid ilma ääresummadeta.

 • Empiiriline (andmete põhjal konstrueeritud) sagedustabel on saadav jällegi Pivot Table abil:
Count of Mannapuder? Mannapuder?      
Sugu ei  ja võib-olla Grand Total
Mees 3 7 1 11
Naine 9 12 1 22
Grand Total 12 19 2 33

Funktsiooni CHITEST esimeseks argumendiks (actual_range) on helehall andmeblokk ülaltoodud sagedustabelist.

 • Teoreetilise (tunnuste sõltumatusele vastava ideaalse) sagedustabeli lahtrid täidetakse valemi järgi arvutatud suurustega. Lihtsaim on seda teha samal lehel Pivot Table'i väljastatud sagedustabeliga. Teoreetilise sagedustabeli ülemine vasakpoolne lahter täidetakse valemi
                                    =$E3*B$5/$E$5 
  väärtusega (siin E3 on lahter, kus paikneb empiirilise sagedustabeli esimese rea summa, B5 on lahter, kus paikneb empiirilise sagedustabeli esimese veeru summa ja E5 on lahter, kus paikneb empiirilise sagedustabeli kogusumma).
    
  Järgnevalt tuleb sisestatud valem kopeerida kõigisse teoreetilise sagedustabeli lahtritesse.
  Tulemuseks on arvude blokk, mis tuleb funktsioonile CHITEST anda ette teise argumendina (expected_range):
4 6.333 0.667
8 12.667 1.333
 • Peale argumentide määramist sisestusaknas

väljastab MS Excel eelnevalt kindlaksmääratud lahtrisse c2-testi olulisuse tõenäosuse p väärtuse. Kui p < 0,05, võime lugeda kahe tunnuse vahelise seose statistiliselt oluliseks.

Antud näite korral saame olulisuse tõenäosuseks p = 0,69. Seega ei ole meil alust lugeda seost tudengite soo ja mannapudrulembuse vahel statistiliselt oluliseks.

Märkus. c2-testi kasutamine on õigustatud vaid juhul, kui kõigis teoreetilise sagedustabeli lahtrites paiknevad sagedused on neljast suuremad (nij > 4).
Seega ei pruugi vaadeldud andmete korral c2-testi põhjal tehtud järeldused vastata tegelikkusele. Saamaks usutavamaid tulemusi, on vajalik andmestiku suurendamine (küsitleda tuleb rohkem tudengeid).

   

Üles


 

ktanel@eau.ee
http://ph.eau.ee/~ktanel/kool_ja_too/
märts, 2000