FthmFDockDFHMWincdDCGDcCncdCCdsCCaxcrFnTbFnIOArialTxEn textKCmptextKCntTxCnY­5) De indbyggede testrutiner 5a: Uafhængighed Eksempel 1: (side 4 i kursusmaterialet) Køn\Forbrug <1500 kr./måned 1500 kr./måned i alt kvinder 98 102 200 mænd 60 100 160 i alt 158 202 360 Løsning: Vi skal afgøre om de oplyste data er i rimelig overensstemmelse med nulhypotesen om uafhængighed mellem Køn og Forbrug. Vi benytter det indbyggede test for uafhængighed af to variable, der forventer at få oplyst krydstabellen for de observerede hyppigheder: „>>>><0>>><0>><0>>>>><0>>>>><0>>>>><0>>MfsS sttsKCmpDCmpstatsttsTest 1KCntDsCnVSTcnCmRfèŸèInSt-CsInStInÿÿÿàÿÿÿàÿÿÿàÿÿÿàÿÿÿÿÿÿÿÿCDNdCDclCDFlSTmd…TcsiSTtsStHyTchiîTcsi`NVncvalgMTmdäMsAnÄMsALÿÿÿÿMsALÿÿÿÿBrEnsStVcForbrugKønStVcLavtHøjtStVcKvinderMænd2DLVbf<dÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿTablSTbHlTbGm4TGhtdbl runl@M@Q€@4TablSTbHlTbGm4TGhtdbl runl@F€@I@4TablSTbHlTbGm4TGhtdbl runl@M@Q€@4TablSTbHlTbGm4TGhtdbl runl@M@Q€@4TablGTbHlTbGm(TGhtdbl runl@I@4TablGTbHlTbGm(TGhtdbl runl@I@4NVnc variabel1ForbrugNVnc variabel2 KønNVncantalkategorier1NVncantalkategorier2ÿCmRfèŸèSGstStGrSGimSGstCDNdCDclLANd/CDNdCDScCDHlHmCAAtLsgrafKCmpDCmpgrafGraf 1KCntDsCnVGrCnyCmRfèŸèInSt-CsInObInÿÿÿàÿÿÿàÿÿÿàÿÿÿàÿÿÿÿÿÿÿÿCDNdCDclCDFlGraf8ATplAxlsÈaxclAXISaxcdaxcl0x?ð¿ð@1@¿ð@1axclAXISaxcdaxcl0y?ð¿™™™™™™š?Ø?©™™™™™š¿™™™™™™š?ØannmanenannmannmanenannmannmanenannmannmanenannmplfnPtop‡MLPlplfn!anenanenHcustomfxn"chiSquareDensity"[id[comma[string[(**)"x"],string[(**)"df"]]]]FmStbsavFmPrstring[(**)"shadeUpper"]bsblFmPrstring[(**)"shadeLower"]bsmdFmPrpfunFmPrNHcustomfxn"chiSquareDensity"[id[comma[string[(**)"x"],string[(**)"df"]]]]vlwrFmPrstring[(**)"lower"]vuprFmPrstring[(**)"upper"]MvLn?ðCmRfèŸèGrLyäGraf8ATplAxlsÈaxclAXISaxcdaxcl0x?ð¿ð@1@¿ð@1axclAXISaxcdaxcl0y?ð¿™™™™™™š?Ø?©™™™™™š¿™™™™™™š?ØannmanenannmannmanenannmannmanenannmannmanenannmplfnPtop‡MLPlplfn!anenanenHcustomfxn"chiSquareDensity"[id[comma[string[(**)"x"],string[(**)"df"]]]]FmStbsavFmPrstring[(**)"shadeUpper"]bsblFmPrstring[(**)"shadeLower"]bsmdFmPrpfunFmPrNHcustomfxn"chiSquareDensity"[id[comma[string[(**)"x"],string[(**)"df"]]]]vlwrFmPrstring[(**)"lower"]vuprFmPrstring[(**)"upper"]MvLn?ðannmanenannmannmanenannmannmanenannmannmanenannmGrSp'OperNVncpunktstørrelse@CDNdCDclCDSAtextKCmptextKCntTxCnY_Vi får da som vist en række koncentrerede oplysninger: 1) Teststørrelsen har værdien 4.774. 2) Teststørrelsen er chi2 fordelt med 1 frihedsgrad. 3) p-værdien er 2.9%, dvs. sandsynligheden for at finde en teststørrelse, der er mindst lige så skæv som den observerede er 2.89%. Nulhypotesen forkastes altså på signifikansniveauet 5%, men den forkastes ikke på 1% niveau! 4) Vi får adgang til krydstabellen for de forventede værdier: Køn\Forbrug <1500 kr./måned 1500 kr./måned i alt kvinder 87,8 112,2 200 mænd 70,2 89,8 160 i alt 158 202 360 5) Vi får også adgang til en grafisk fremstilling for chi2-testet (højreklik i testboksen)Ò>>>>><0>>MfsS textKCmptextKCntTxCn\oBemærkning: Den ovenstående tabel er sat til at være ordrig! Slår man det fra får man i stedet den kompakte version: Første variabel: Forbrug Antal kategorier: 2 Anden variabel: Køn Antal kategorier: 2 Ho: Forbrug er uafhængig af Køn Chi-i-anden: 4,774 Frihedsgr.: 1 p-værdi: 0,029 Tallene i parentes er de forventede antal.Å>><0>>MfsS textKCmptextKCntTxCnCæ5b: Goodness of fit Eksempel 2: (side 24 i kursusmaterialet) Indkomstfordelingen i stikprøven var: I = Indkomst i 1000 kr. Observeret antal I<50 50I<100 100I<150 150I<200 200I<300 300I<400 400I<500 500<=I 98 88 199 136 210 179 52 38 Den forventede fordeling i stikprøven baseret på de ovenstående procenter er tilsvarende givet ved: Forventet antal I<50 50I<100 100I<150 150I<200 200I<300 300I<400 400I<500 500I 64 93 178 123 243 180 66 53 Sammenholder vi de observerede hyppigheder med de forventede følges de så nogenlunde ad. Men man kunne måske være bekymret for, om de laveste indkomster er overrepræsenteret i stikprøven. Her ligger den observerede hyppighed et godt stykke over den forventede. Løsning: Vi skal afgøre om de oplyste data er i rimelig overensstemmelse med nulhypotesen om samme fordeling for stikprøve og population. Vi benytter det indbyggede test for en fordeling, der forventer at få oplyst lister for dels de observerede hyppigheder, dels de forventede sandsynligheder. Vi får da som vist en række oplysninger: 1) Teststørrelsen har værdien 33.88 2) Teststørrelsen er chi2 fordelt med 7 frihedsgrader 3) p-værdien er 0.0018%, dvs. sandsynligheden for at finde en teststørrelse mindst lige så stor som den observerede er under 0.01%. Da den ligger under signifikansniveauet 1% forkastes nulhypotesen på signifikansniveauet 1%. 4) Vi får også adgang til en grafisk fremstilling for chi2-testet (højreklik i testboksen), men vi kan ikke se det kritiske område, fordi testdata er så ekstreme!5>>>>>>><0>>><0><0>>><0><0>>>>MfsS sttsKCmpDCmpstatsttsTest 2KCntDsCnVSTcnCmRfèŸèInSt-CsInStInÿÿÿàÿÿÿàÿÿÿàÿÿÿàÿÿÿÿÿÿÿÿCDNdCDclCDFlSTmdçTcsgSTtsStHyTchibTcsgNNVncvalgMTmdRCStmMsAnCStaEMsALÿÿÿÿMsALÿÿÿÿBrEnÆStVcindkomstStVcSøjleKategori1StVcQI<50 50<=I<100 100<=I<150 150<=I<200 200<=I<300 300<=I<400 400<=I<500500<=I2DLV(bXLjҳ4&ÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿ?°bMÒñ©ü?·ÎÙ‡+?ÆÈ´9Xb?¿|í‘hr°?ÏŸ¾vÈ´?Ç =p£× ?°å`A‰7H?«"Ðå`ATablSTbHlTbGm4TGhtdbl runl@C@V@@4TablSTbHlTbGm4TGhtdbl runl@N€@P@@4TablSTbHlTbGm4TGhtdbl runl@C@V@@4TablSTbHlTbGm4TGhtdbl runl@C@V@@4Tabl/TbHlTbGmTGhtdbl runlTabl/TbHlTbGmTGhtdbl runlNVncvariabelindkomstNVncantalkategorierNVncvalg af likelihoodÿCmRfèŸèSGstStGrSGimSGstCDNdCDclLANd/CDNdCDScCDHlHmCAAtLsgrafKCmpDCmpgrafGraf 2KCntDsCnVGrCnyCmRfèŸèInSt-CsInObInÿÿÿàÿÿÿàÿÿÿàÿÿÿàÿÿÿÿÿÿÿÿCDNdCDclCDFlGraf8ATplAxlsÈaxclAXISaxcdaxcl0x?ð¿ð@1@¿ð@1axclAXISaxcdaxcl0y?ð¿™™™™™™š?Ø?©™™™™™š¿™™™™™™š?ØannmanenannmannmanenannmannmanenannmannmanenannmplfnPtop‡MLPlplfn!anenanenHcustomfxn"chiSquareDensity"[id[comma[string[(**)"x"],string[(**)"df"]]]]FmStbsavFmPrstring[(**)"shadeUpper"]bsblFmPrstring[(**)"shadeLower"]bsmdFmPrpfunFmPrNHcustomfxn"chiSquareDensity"[id[comma[string[(**)"x"],string[(**)"df"]]]]vlwrFmPrstring[(**)"lower"]vuprFmPrstring[(**)"upper"]MvLn?ðCmRfèŸèGrLyäGraf8ATplAxlsÈaxclAXISaxcdaxcl0x?ð¿ð@1@¿ð@1axclAXISaxcdaxcl0y?ð¿™™™™™™š?Ø?©™™™™™š¿™™™™™™š?ØannmanenannmannmanenannmannmanenannmannmanenannmplfnPtop‡MLPlplfn!anenanenHcustomfxn"chiSquareDensity"[id[comma[string[(**)"x"],string[(**)"df"]]]]FmStbsavFmPrstring[(**)"shadeUpper"]bsblFmPrstring[(**)"shadeLower"]bsmdFmPrpfunFmPrNHcustomfxn"chiSquareDensity"[id[comma[string[(**)"x"],string[(**)"df"]]]]vlwrFmPrstring[(**)"lower"]vuprFmPrstring[(**)"upper"]MvLn?ðannmanenannmannmanenannmannmanenannmannmanenannmGrSp'OperNVncpunktstørrelse@CDNdCDclCDSA textKCmptextKCntTxCn˜Den ovenstående tabel er sat til at være ordrig! Slår man det fra får man i stedet den kompakte version: Ho: Kategorierne fra indkomst har de ovenstående sandsynligheder Antal kategorier: 8 Chi-i-anden: 33,88 Frihedsgrader: 7 p-værdi: < 0,0001^<0>>>>MfsS SFms² stafCmpFNdspFFltFstfrstaf@…¸@uàfram@U@@h`CmRfèŸèGrpFCmpFNdspFFltFGrpF@v€@rpfram@z@@‰CmRfèŸèstafCmpFNdspFFltFstfrstaf@…@@xfram@‹Ð@y@CmRfèŸèGrpFCmpFNdspFFltFGrpF@o@@o@fram@” @Š@CmRfèŸèTxtFCmpFNTxtF@…h@x°fram@‹Ð@$CmRfèŸèTxtFCmpFNTxtF@tð@h`fram@U@@ˆøCmRfèŸèTxtFCmpFNTxtF@…h@i fram@U@@ÐCmRfèŸèTxtFCmpFNTxtF@…à@eàfram@U@@.CmRfèŸèTxtFCmpFNTxtF@yP@`àfram@‹Ð@‰ÈCmRfèŸè †