Õpiobjektid -> Binaarsete tunnuste analüüsimeetodid

BINAARSETE TUNNUSTE ANALÜÜSIMEETODID


Õpiobjekti kirjeldus
Õpijuhis
 
1. Sissejuhatus
2. Binaarse tunnuse seos mittearvulise tunnusega või diskreetse arvtunnusega
3. Binaarse tunnuse seos pideva arvtunnusega
4. Enesekontroll
Lisa
¤ Kogu materjal ühe pdf-failina: bin_tunnuste_analyys.pdf

Optimaalne piirväärtus

Uuritava sündmuse toimumist ja mittetoimumist eristava optimaalseima piirväärtuse leidmiseks on mitmeid võimalusi:

  • üks variant on võtta optimaalseimaks väärtuseks maksimaalsele tundlikkuse ja spetsiifilisuse summale vastav väärtus,
  • teine variant on leida ROC-kõvera diagonaalist kaugeimal paiknev punkt,
  • kolmas variant on kanda nii tundlikkuse kui ka spetsiifilisuse väärtused joonisele prognoositud tõenäosuse suhtes ning valida optimaalseimaks piirväärtuseks tundlikkuse ja spetsiifilisuse kõverate ristumispunktile vastav väärtus.

Pideval skaalal esitatud argumendi ja pideva ROC-kõvera puhul annavad kõik kolm optimaalseima piirväärtuse leidmise varianti sama tulemuse, diskreetse argumendi ja sellelest lähtuvalt murdjoonena esituva ROC-kõvera puhul võivad optimaalseimad piirväärtused pisut erineda.


Tudengite näites vastab maksimaalne tundlikkuse ja spetsiifilisuse summa 0,909+0,690=1,6 nädalas tarbitavale õllekogusele 0,5 liitrit (vt järgnev tabel) - seega on tudengite meheks ja naiseks jagamine täpseim, kui tõmmata nö piir 0,5 liitri juurde, kes tarbivad 0,5 liitrit või enam, on mehed, kes vähem, naised.

Prognoosides aga tudengi meheks osutumise tõenäosust logistilisest mudelist

P(Mees) = 1 / [1 + exp(2,11 - 1,42*Õlu)]

(saadud hinnangud on esitatud järgneva tabeli teises veerus) ning kandes nii tundlikkuse kui ka spetsiifilisuse väärtused joonisele prognoositud tõenäosuste suhtes (vt tabeli järgne vasakpoolne joonis), osutub, et ligikaudne optimaalne logistilisest mudelist hinnatud tõenäosus, eristamaks õlle joomise alusel naisi ja mehi, on 0,3. Tõenäosusele 0,3 vastavad tundlikkus ja spetsiifilisus on mõlemad ligikaudu 0,8 ning vastav mees- ja naistudengite eristamiseks kasutatav õllekogus on arvutatav logistilise regressioonivõrrandi pöördfunktsioonina (vt punkt 3.4):

Õlu30 = {LN[0,3/(1-0,3)] + 2,11}/1,42 = 0,9 l.

Seega võib mees- ja naistudengeid täpseimalt eristavaks õllekoguseks võtta ka 0,9 liitrit.

Nädalas keskmiselt tarbitava õllekoguse ja tudengi soo sõltumatusele vastavast diagonaalist ROC-kõvera joonisel paiknevad mõlemad optimaalsetele piirväärtustele vastavad ROC-kõvera punktid võrdsel kaugusel.

Õlu (l)*
P(Mees)
TP
TN
FP
FN
Tundlikkus
Spetsiifilisus
Tundl.+spets.
0
0,108
22
0
42
0
1
0
1
0,3
0,157
20
27
15
2
0,909
0,643
1,552
0,5
0,198
20
29
13
2
0,909
0,690
1,6
1
0,334
16
35
7
6
0,727
0,833
1,561
1,5
0,505
14
39
3
8
0,636
0,929
1,565
2
0,675
13
39
3
9
0,591
0,929
1,519
3
0,896
11
42
0
11
0,5
1
1,5
3,5
0,946
9
42
0
13
0,409
1
1,409
4
0,973
8
42
0
14
0,364
1
1,364
5
0,993
7
42
0
15
0,318
1
1,318
6
0,998
2
42
0
20
0,091
1
1,091
10
1,000
1
42
0
21
0,045
1
1,045

* Nädalas keskmiselt tarbitav õllekogus, millest alates klassifitseeritakse tudeng meheks.

 

 


< Eelmine

Creative Commons License Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License