Õpiobjektid -> MS Excelile mitteomased andmeanalüüsil kasutatavad joonised

MS EXCELILE MITTEOMASED
ANDMEANALÜÜSIL KASUTATAVAD JOONISED


Õpiobjekti kirjeldus
Sissejuhatus
 
Jooniste valik
¤
¤
¤
¤
¤
¤
¤
¤
¤
¤
¤
¤
¤
¤
¤

Punktdiagrammide maatriks

Mitmed statistikapaketid võimaldavad enam kui kahe arvtunnuse vaheliste seoste uurimisel konstrueerida nö punktdiagrammide maatriksi, kus peadiagonaail paiknevad erinevad tunnuste väärtuste jaotumist kirjeldavad joonised.

Näiteks R-i poolt käsuga scatterplot.matrix vaikimisi konstrueeritav joonis kolmele tunnusele on järgmine:

Muidugi saab antud joonist R-s kujundada, tellides diagonaalile muid joonised jmt. Joonise enam oma soovidele vastavaks tegemiseks võib osutuda mõttekaks konstrueerida ja kujundada kõik üheksa joonist eraldi ning ühendada nad seejärel ühte graafikaknasse …

Huvi pärast proovisin konstrueerida analoogse joonise ka Exceli abil, kasutamata seejuures ühtki joonistamisvahendit (tekstikasti, joonisele käsitsi lisatavaid kaste/jooni jmt).

Täpsemalt oli soov esitada iga tunnuste paari kohta punktdiagramm koos regressioonisirgega ning peadiagonaalil tunnuste histogrammid koos vastavate normaaljaotuse tihedusfunktsiooni graafikutega.

Tulemus:

Põhimõtteliselt saaks sellele joonisele lisada ka regressioonivõrrandid vmt, aga need tuleks algandmetel eraldi välja arvutada ja siis joonisele lisada (erinevalt R2-väärtustest, mis ka antud joonise tarvis teisendatud andmete korral algandmetega analoogsed tulevad ning mis seetõttu ka Excelil automaatselt joonistele lisada on lastud).

Samuti saaks punktdiagrammide telgedele lisada ühikud (lisades telgesid moodustavatele joontele aluseks olevatesse abitabelitesse mõned koordinaadid ka telgede otspunktide vahelt), aga algandmete skaalal arvude saamiseks tuleb need ükshaaval telgedele juurde kirjutada (või siis kasutada keerukamate jooniste tegemisel väga kasulikku aadressilt http://www.appspro.com/Utilities/ChartLabeler.htm tasuta allalaaditavat lisamoodulit "XY Chart Labeler").

Toodud joonise tegemine võttis aega oma 10 tundi (mitte järjest), esimesed kolm tundi oli huvitav, edasise tegevuse juures oli suur roll jonnil ja põikpäisusel (järgmine analoogne joonis saaks muidugi valmis vaid mõne tunniga).

Seejuures on väga oluline enne joonise aluseks olevate abitabelite tegemist skitseerida soovitav joonis paberile ning märkida sinna täpselt juurde iga alamjoonise algus- ja lõpp-punkti koordinaadid tegelikus teljestikus, et nende alusel arvutada väärtused joonisele kantavatele andmeseeriatele.


 

 

Kokku on sellele 9-st alamjoonisest koosnevale joonisele kantud 17 andmeseeriat (vt kõrvalolevat joonist) - kuus andmeseeriat punktdiagrammide tarvis pluss kuus andmeseeriat punktdiagrammide telgede tarvis, kolm andmeseeriat joonise diagonaalil paiknevate normaaljaotuse kõverate tarvis ning kaks andmeseeriat histogrammide tarvis (neist üks, joonisel nö läbipaistvaks muudetu, määrab ära kõrguse, kust joonisel näha olevad tulbad pihta hakkavad).

Kasutusel on kaks horisontaalset ja kaks vertikaalset telge (neist üks komplekt tulpdiagramme esitavate andmeseeriate jaoks - sellisel juhul on x-telg diskreetne - ja teine pideva x-teljega komplekt punktdiagrammide tarvis).

Lisaks veel kuus trendijoont ja neile vastavat determinatsioonikordajat (R2) ning kuue andmepunkti väärtused, mis on muudetud alamjooniste telge nimetusteks.

Soovi korral võib Exceli faili koos joonise ja kõigi selle aluseks olevate abitabelite ja arvutustega alla laadida siit:

scatterplot_matrix.xlsx

(ühilduvuspakett Excel 2003 tarvis http://www.microsoft.com/downloads/en/details.aspx?familyid=941b3470-3ae9-4aee-8f43-c6bb74cd1466&displaylang=en).


< Eelmine
 

Creative Commons License Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License