Õpiobjektid -> Andmeanalüüs MS Excelis (MS Excel 2010 baasil)

ANDMEANALÜÜS MS EXCELIS


Õpiobjekti kirjeldus
Õpijuhis
 
Sissejuhatus
 
Peamised andmeanalüüsi teostamise vahendid MS Excelis
Sagedustabelid
Arvkarakteristikud
Usalduspiirid
Hüpoteeside kontrollimine
(ühe ja kahe üldkogumi võrdlus)
Korrelatsioonanalüüs
Regressioonanalüüs
Kahemõõtmeline sagedustabel
Dispersioonanalüüs
Trikke ja nippe
Lisa
¤ Kogu materjal ühe pdf-failina: stat_excelis.pdf

Arvkarakteristikud protseduuriga Descriptive Statistics

Protseduur Descriptive Statistics väljastab ühekorraga 13 erinevat arvkarakteristikut, lisaks liidetava keskmise usalduspiiride arvutamiseks ja etteantud järjekorranumbriga väärtused.

Arvutused võib seejuures teostada korraga ka enam kui ühe tunnusega, ainukesed tingimused on et tunnused peavad olema arvulised ja paiknema andmetabelis kõrvuti.

Protseduuri Descriptive Statistics rakendamiseks tuleb (Joonis 21)

  1. valida Data-sakilt käsk Data Analysis ning seejärel avanenud aknast protseduur Descriptive Statistics,
     
  2. anda ette analüüsitavad andmed ja määrata väljundi asukoht:
  • Input Range - algandmete blokk (võib sisaldada ka mitut veergu või rida, st et korraga võib analüüsida ka mitut tunnust eeldusel, et need on arvulised ja paiknevad andmetabelis kõrvuti);
  • Grouped By - määratakse andmete paigutus blokis, tavaliselt on erinevad tunnused paigutatud erinevatesse veergudesse (Columns), kuid võivad olla ka erinevates ridades (Rows);
  • Labels In First Column - märgitakse tunnuse nime või tähise olemasolu korral andmebloki ülemises reas;
  • Output options - määratakse tulemuste väljastamise asukoht: samale töölehele (Output Range), uuele töölehele (New Worksheet Ply) või uude faili (New Workbook);
  1. täpsustada lisavalikute abil soovitud tulemuste hulka:
  • valiku Summary statistics tulemusena arvutab Excel kolmeteistkümne põhilise arvkarakteristiku väärtused;
  • valiku Confidence Level for Mean tulemusena arvutatakse pool usaldusintervalli suurusest (so suurus, mis tuleb keskmisele juurde liita ja lahutada, saamaks vastavalt ülemist ja alumist usalduspiiri); vaikimisi kasutatava 95% asemele võib ise trükkida mõne teise arvu (näiteks 90 või 99);
  • valikute Kth Largest ja Kth Smallest tulemusena väljastatakse järjekorranumbriga K väärtus vastavalt suuremate ja väiksemate väärtuste poolt lugedes; K = 1 korral on tulemuseks maksimaalne ja minimaalne väärtus, et aga need suurused sisalduvad ka valiku Summary statistics väljundis, on enamasti mõistlik tellida näiteks suuruselt järgmised väärtused (siis K = 2).

NB! Kui teistel statistikaprotseduuridel on oma vaikimisi väljund ja lisavalikud ei ole kohustuslikud - need võimaldavad väljundit lihtsalt erinevate tabelite ja/või joonistega täiendada -, siis protseduur Descriptive Statistics nõuab vähemalt ühe lisavaliku määramist - vastasel juhul lõpeb arvutusprotsess veateatega.

Joonisel 22 esitatud protseduuri Descriptive Statistics tulemus koos leitud arvkarakteristikute eestikeelsete nimedega.
 

Joonis 21. Protseduuri Descriptive Statistics rakendamine.
 

Joonis 22. Protseduuri Descriptive Statistics tulemus koos arvkarakteristikute eestikeelsete nimedega.

 


< Eelmine

Creative Commons License Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License