TERVE! Lukion todennäköisyyslaskennan sovellukset ajankohtaisissa terveysilmiöissä Annina Ruokonen Pro Gradu-tutkielma Kesäkuu 2022 MATEMATIIKAN JA TILASTOTIETEEN LAITOS TURUN YLIOPISTO TURUN YLIOPISTO Matematiikan ja tilastotieteen laitos RUOKONEN, ANNINA: TERVE! Lukion todennäköisyyslaskennan sovellukset ajankohtaisissa terveysilmiöissä Pro gradu -tutkielma, 53 s., 67 liites. Matematiikka Kesäkuu 2022 Tarkastajat: Dosentti Petteri Harjulehto & Professori Peter Hästö Tämän tutkielman tarkoitus on luoda terveysaiheinen tehtäväpaketti lukion pitkän matematiikan Tilastot ja todennäköisyys -opintojaksolle. Opetussuunnitelman perusteiden ja ajan didaktisen keskustelun hengessä tutkielman tehtävät ylittävät oppiaineiden välisiä kuiluja ja tuovat matematiikkaa lähemmäksi opiskelijan kokemusmaailmaa sekä ajankohtaisia yhteiskunnallisia ilmiöitä. Tehtävillä on kolme päätavoitetta: 1) lisätä opiskelijan ymmärrystä siitä, mitä kaikkea matematiikalla voidaan tehdä eli mihin opittua voidaan soveltaa ympäröivässä maailmassa, 2) innostaa opiskelijaa matematiikan opinnoissa sekä 3) tukea opiskelijaa lukion opetussuunnitelman yleisten ja matematiikan tavoitteiden, kuten ymmärtämisen, ongelmanratkaisun ja opitun soveltamisen toteutumisessa. Tutkielman tuloksena kehitetään ajankohtaisiin terveysaiheisiin pureutuva Terve! Terveysaiheinen tehtäväpaketti opiskelijalle –oppimateriaali, jonka matematiikanopettaja voi jakaa opiskelijoille käyttöön kurssikirjaa täydentämään tai josta hän voi poimia yksittäisiä esimerkkitehtäviä koti- tai tuntityöskentelyn tueksi. Tutkielma on jaettu teoriaosioon sekä Terve!-materiaaliin, jonka opiskelija- ja opettajaversiot löytyvät tutkielman liitteistä. Tutkielman teoriaosio koostuu kahdesta luvusta, Tilastot ja Todennäköisyyslaskenta, joissa esitellään Tilastot ja todennäköisyys -opintojakson määritelmät ja tulokset todistuksineen. Näiden tulosten ja määritelmien esitysjärjestys noudattaa lukion opintojakson sekä useiden kurssikirjojen etenemistapaa. Terve!-opiskelijamateriaali koostuu 12:sta terveysaiheisesta tehtävästä ja sanallisista vihjeistä niiden ratkaisemiseksi. Terve!- opettajamateriaali on opiskelijamateriaalin kaltainen, mutta siinä esitetään eräät malliratkaisut tehtäville. Jokaisen tehtävän yhteydessä on kerrottu myös asiatietoa aiheesta sekä koottu linkkejä lisätietoa kaipaavalle opiskelijalle. Materiaalin tehtävät ovat sekalaisessa järjestyksessä. Näin opiskelija pääsee ratkaistavan ongelman määrittelystä ja sopivan matemaattisen ratkaisumenetelmän valinnasta alkaen kehittämään omaa ymmärrystä, kriittistä arviointia sekä ongelmanratkaisu- ja soveltamistaitoja. Asiasanat: todennäköisyyslaskenta, tilastot, terveystieto, terveysilmiöt, oppimateriaali, kokemusmaailma, lukio UNIVERSITY OF TURKU Department of Mathematics and Statistics RUOKONEN, ANNINA: TERVE! Health themed probability calculus applications to upper secondary school Master's thesis, 53 p., 67 app. Mathematics June 2022 Supervisors: Docent Petteri Harjulehto & Professor Peter Hästö The purpose of this thesis is to create exercises with health topics to Finnish upper secondary school advanced mathematics class Probability calculus and statistics. In the spirit of Finnish Upper Secondary School Curriculum the intention of these exercises is to bring down the figurative walls between subjects by integrating health sciences to mathematics and above all bring math closer to students’ experiences and actual, current world health phenomena. There are three main goals with these exercises: 1) increase students’ understanding of math applications in the real world and in that way hopefully 2) inspire them in their math studies and 3) support students with the fulfillment of the curriculum goals, such as improvement of (mathematical) understanding, problem solving skills and applying previously learned things to new contents. These exercises form a handy learning material that delves into current health topics. A class teacher may give the material to students as it is or use only some of the exercises as examples to enliven lessons or homework. This thesis has both a theory part and the learning material part named Terve!, which is in Finnish and is to be found in the appendix. The theory part has two chapters, one for statistics and the other for probability, in which the definitions and theorems of the class are introduced. The order of those is similar to one in the probability class and many set books. Terve! -student material consists of 12 health themed exercises and verbal cues to solve them. The teacher material is very similar to the student material, but it contains answers and solutions. Besides every exercise there are some facts and additional information related to the theme of the exercise. The exercises are not in the same order as topics in the theory part, but in random order because it is important that the students have to figure out themselves how to define the problem and how to choose convenient methods to solve it. The aim of these kind of exercises is to guide students to reflect their own understanding and encourage them to think critically. Ideally, this way exercises are also helping students to improve their analytical problem solving skills and their ability to apply previously learned things to new contents. Descriptors: probability calculus, statistics, health education, real-world problems, learning material, interest, upper secondary school Sisällys 1 Johdanto .......................................................................................................................................................................... 1 2 Tilastot ............................................................................................................................................................................. 3 2.1 Tilastotieteen peruskäsitteitä ........................................................................................................................ 3 2.2 Tilastoaineiston käsittely ................................................................................................................................. 5 3 Todennäköisyyslaskenta ....................................................................................................................................... 15 3.1 Todennäköisyyden perusominaisuuksia................................................................................................ 15 3.2 Kombinatoriikkaa ............................................................................................................................................ 22 3.3 Todennäköisyyden laskusääntöjä ............................................................................................................. 24 3.4 Todennäköisyysjakauma .............................................................................................................................. 31 4 Terve! Terveysaiheinen tehtäväpaketti opiskelijalle -materiaali ......................................................... 48 5 Pohdinta ....................................................................................................................................................................... 49 6 Lähteet........................................................................................................................................................................... 52 Liitteet ............................................................................................................................................................................... 54 1 1 Johdanto Todennäköisyyslaskenta on matematiikan osa-alueena suhteellisen nuori: sen historian voidaan katsoa alkavan ranskalaismatemaatikkojen Blaise Pascalin ja Pierre Fermat’n uhkapeliaiheisesta kirjeenvaihdosta 1600-luvulla [1,2]. Perinteisesti todennäköisyyslaskenta onkin keskittynyt erilaisten rahapelien voiton mahdollisuuden laskemiseen ja nämä todennäköisyyslaskennan juuret ovat havaittavissa myös lukion todennäköisyyslaskennassa. Suuri osa lukion oppikirjojen tehtävistä liittyy pelisovelluksiin, kuten noppa- ja korttipeleihin sekä erilaisiin arvontoihin. Myös muut arkiset aiheet ovat suosittuja, mikä on harvinaisempaa muilla lukiomatematiikan opintojaksoilla. Harmillisesti aiheet jäävät usein irrallisiksi todellisista sovelluskohteista, sillä tehtävänannoissa tehdyt oletukset yksinkertaistavat rajusti tarkasteltavia ilmiöitä. Tällöin arkielämän teemat vaikuttavat hieman päälle liimatuilta. Lisäksi monet näistä aiheista, kuten rahapelit, jäävät etäisiksi useimpien opiskelijoiden kokemusmaailmasta. Tämä on sääli, sillä todennäköisyyslaskennan keinot taipuvat useiden nuoria kiinnostavien ja heidän kokemusmaailmaansa paremmin sopivien arjen, luonnon sekä yhteiskunnan ilmiöiden ja tapahtumien mallintamiseen. Tämän tutkielman tarkoituksena on ollut tuottaa opiskelijalle mielenkiintoinen, terveysaiheinen tehtäväpaketti lukion pitkän matematiikan Tilastot ja todennäköisyys -opintojaksolle. Lukion opetussuunnitelman perusteiden 2019 mukaan matematiikan opetuksen lähtökohdat tulee valita opiskelijoita kiinnostavista aiheista, ilmiöistä ja ongelmista, joita voidaan matematiikan avulla ratkoa [3, s. 221]. Opiskelijoiden kiinnostuksen kohteiden huomioiminen on osa motivoivaa matematiikan opetusta, ja sitä korostetaan opetussuunnitelman lisäksi opetusalan keskusteluissa, kuten Beyranevandin blogikirjoituksessa [4]. Opetussuunnitelman perusteiden ja ajan didaktisen keskustelun hengessä tutkielman tehtävät ylittävät oppiaineiden välisiä kuiluja ja tuovat matematiikkaa lähemmäksi opiskelijan kokemusmaailmaa sekä ajankohtaisia yhteiskunnallisia ilmiöitä. Tehtävillä on kolme päätavoitetta: 1) lisätä opiskelijan ymmärrystä siitä, mitä kaikkea matematiikan avulla voidaan tehdä eli mihin opittua voidaan soveltaa ympäröivässä maailmassa, ja 2) innostaa opiskelijaa matematiikan opinnoissa sekä 3) tukea opiskelijaa lukion opetussuunnitelman yleisten ja matematiikan tavoitteiden, kuten ymmärtämisen, ongelmanratkaisun ja opitun soveltamisen toteutumisessa. Tutkielma on jaettu teoriaosioon ja Terve!-materiaaliin, jonka opiskelija- ja opettajaversiot löytyvät tutkielman liitteistä. Tutkielman teoriaosio koostuu kahdesta luvusta, Tilastot (luku 2) ja Todennäköisyyslaskenta (luku 3), joissa esitellään lukion Tilastot ja todennäköisyys -opintojakson määritelmät ja tulokset todistuksineen. Näiden tulosten ja määritelmien esitysjärjestys noudattaa lukion opintojakson sekä useiden kurssikirjojen etenemisjärjestystä. Lukujen 2 ja 3 teorian esitystavat eroavat toisistaan melko paljon tilastotieteen ja matematiikan tieteenalojen kirjallisen 2 ilmaisun erilaisuuden vuoksi: Todennäköisyyslaskenta –luvun esitysmuoto on matemaattinen, Tilastot –luvussa määritelmät ovat suurilta osin sanallisia ja niiden tukena käytetään esimerkkejä. Terve!-opiskelijamateriaali koostuu kahdestatoista terveysaiheisesta tehtävästä ja sanallisista vihjeistä niiden ratkaisemiseksi. Opettajan materiaali on opiskelijamateriaalin kaltainen, mutta siinä esitetään eräät malliratkaisut tehtäville. Kaikki materiaalin tehtävät liittyvät ajankohtaisiin arkiympäristön ja yhteiskunnan terveysilmiöihin, kuten treenaamiseen, ensiaputaitoihin, rokotteisiin, punkkien levittämiin tauteihin ja väestöryhmien välisiin terveyseroihin. Kunkin tehtävän yhteydessä kerrotaan myös hieman tehtävän aiheesta ja annetaan vinkkejä asiallisen lisätiedon löytämiseen. Tehtävien tavoitteena on, että opiskelija tutustuu erilaisten terveysilmiöiden syihin ja seurauksiin, ymmärtää ja kehittää niihin liittyvää matemaattista ajattelua sekä oppii analysoimaan saatujen tulosten mielekkyyttä ja luotettavuutta. Tarkoituksena on harjoitella pohtimaan saatujen tulosten merkitystä terveydelle yksilö-, yhteisö- ja yhteiskuntatasolla. Materiaalin tehtävät eivät mukaile opintojakson etenemisjärjestystä, vaan ne ovat tarkoituksellisesti sekalaisessa järjestyksessä. Näin opiskelija pääsee ratkaistavan ongelman määrittelystä ja sopivan matemaattisen ratkaisumenetelmän valinnasta alkaen kehittämään omaa ymmärrystä, kriittistä arviointia sekä ongelmanratkaisu- ja soveltamistaitoja. Terve!-materiaalista kerrotaan tarkemmin luvussa 4 ja materiaalin käyttöön liittyviä pedagogisia teemoja käsitellään luvussa 5. 3 2 Tilastot Tässä luvussa tutustutaan sellaisiin tilastotieteen peruskäsitteisiin ja tuloksiin, jotka kuuluvat lukion pitkän matematiikan Tilastot ja todennäköisyys -opintojakson sisältöihin. Luvun määritelmät ja tulokset perustuvat Henri Pesosen monisteeseen [5] ja Ilkka Mellinin esitykseen [6]. 2.1 Tilastotieteen peruskäsitteitä Määritelmä 2.1 Tilastotieteellisessä tutkimuksessa tarkasteltavaa tutkimuskohteiden eli tilastoyksiköiden konkreettista tai hypoteettista joukkoa kutsutaan perusjoukoksi eli populaatioksi. Tarkastelun kohteena ovat tilastoyksiköiden havaittavat tai mitattavat ominaisuudet, joita kutsutaan tilastollisiksi muuttujiksi tai tilastomuuttujiksi. Konkreettisessa populaatiossa jokainen yksilö voidaan tarvittaessa listata. Hypoteettisen populaation avulla pyritään ennustamaan tiettyjä populaation ominaisuuksia tulevaisuudessa. Tilastomuuttujia voidaan jaotella monella tapaa. Ne voidaan jakaa havaittujen arvojen perusteella mm. diskreetteihin ja jatkuviin muuttujiin sen mukaan, voiko muuttuja saada mitä tahansa lukuarvoja (jatkuva muuttuja) vai vain yksittäisiä arvoja joltakin väliltä (diskreetti muuttuja). Lisäksi tilastomuuttujat voidaan jaotella numeerisiin ja luokallisiin muuttujiin sen mukaan, minkälaisilla mittaustasoilla niiden arvoja havaitaan (Kuva 2.1). Mitta-asteikko Luokallinen Numeerinen Nominaalinen Ordinaalinen Intervalli Suhde Kuva 2.1 Tilastollisten muuttujien mitta-asteikkojen tyypit. Määritelmä 2.2 Jos tilastollista muuttujaa ei voi mitata diskreetillä tai jatkuvalla numeerisella asteikolla, ts. jos muuttujan havaittu arvo ei ole numeerinen luku, kyseessä on luokallinen muuttuja. Määritelmä 2.3 Jos tilastollisen muuttujan havaittu arvo on jokin lukuarvo, kyseessä on numeerinen muuttuja. Luokallisia muuttujia ovat mm. henkilön sukupuoli (luokat nainen, mies ja muu) ja syöpäkasvaimen levinneisyysaste (luokat 0, I, II, III ja IV). Luokalliset muuttujat voidaan jaotella edelleen kahteen aliluokkaan sen mukaisesti, voidaanko ne laittaa mitta-asteikkonsa perusteella luonnollisesti johonkin järjestykseen. Jos muuttujan arvoja ei voida laittaa luonnolliseen järjestykseen, niin 4 luokallisen muuttujan mitta-asteikko on laatuero- eli nominaaliasteikko. Esimerkiksi henkilön sukupuolen mitta-asteikko on nominaaliasteikollinen. Jos taas muuttujan arvoilla on luonnollinen järjestys, niin luokallisen muuttujan mitta-asteikko on järjestys- eli ordinaaliasteikollinen. Esimerkiksi syöpäkasvaimen levinneisyysluokat voidaan järjestellä paikallisesta, leviämättömästä kasvaimesta (0) laajalle etäpesäkkeisesti levinneisiin kasvaimiin (IV). Määritelmä 2.4 Nominaaliasteikolla mitattavat muuttujat voidaan jakaa ominaisuuksiensa perusteella ryhmiin sen perusteella, onko muuttujilla ominaisuutta vai ei. Määritelmä 2.5 Ordinaaliasteikolla mitattavat muuttujat voidaan järjestellä joidenkin ominaisuuksiensa perusteella ryhmiin, joilla on jokin luonnollinen järjestys. Myös numeerisia, jatkuvia tai diskreettejä lukuarvoja saavia muuttujia voidaan jaotella aliluokkiin. Jos numeerinen muuttuja voi saada negatiivisia arvoja ja nollakohta on sopimuksenvarainen, niin numeerisen muuttujan mitta-asteikko on välimatka- eli intervalliasteikko. Esimerkiksi kristillinen ajanlasku vuosilukuina ja lämpötila Celsius-asteikolla ovat intervalliasteikollisia muuttujia. Intervalliasteikolla voidaan verrata mitta-asteikon välien pituuksia toisiinsa eli voidaan esimerkiksi sanoa marraskuisen vuorokauden minimi- ja maksimilämpötiloja kuvatessa Mumbain vaihteluvälin [20,5 °C, 33,4 °C] olevan noin 2,5 kertaa Lontoon vaihteluväliä [10,9 °C, 16,1 °C] pidempi. Jos taas numeerisen muuttujan mitta-asteikolla on intervalliasteikon ominaisuuksien lisäksi absoluuttinen nollakohta, kuten henkilön pituudella senttimetreissä, niin numeerisen muuttujan mitta-asteikko on suhde(luku)asteikko. Tämän mitta-asteikon nimitys viittaa suuruussuhteiden laskettavuuden mielekkyyteen; voidaan esimerkiksi sanoa että 208 cm pitkä koripalloilija on kaksi kertaa niin pitkä kuin 104 cm pitkä lapsi. Määritelmä 2.6 Intervalliasteikolla mitattavien muuttujien havainnoista voidaan laskea erotus. Määritelmä 2.7 Suhdeasteikolla mitattavilla muuttujilla on yksikäsitteinen nollapiste. Määritelmä 2.8 Otos on jollain satunnaismenetelmällä suuremmasta perusjoukosta valittu tilastoyksiköiden joukko. Satunnaisotannassa jokaisella tilastoyksiköllä on tietty todennäköisyys tulla valituksi otokseen. Otos pyritään muodostamaan populaatiota mahdollisimman hyvin kuvaavaksi, mitä varten tilastotieteessä on kehitetty erilaisia otantamenetelmiä. Määritelmä 2.9 Muodostettu otos on edustava, jos sen ominaisuudet ovat samankaltaiset kuin populaation ominaisuudet. Jos taas otoksen ominaisuudet eivät vastaa populaation ominaisuuksia, on muodostettu otos harhainen. Edustava otos on siis ikään kuin pienoismalli populaatiosta. 5 Määritelmä 2.10 Kun tutkimuksen kohteena ovat kaikki populaation tilastoyksiköt, on kyse kokonaistutkimuksesta. Yleensä tutkimusaineistot ovat kuitenkin otospohjaisia eli ne koostuvat jollakin satunnaismenetelmällä valituista tilastoyksiköistä, jotka ovat vain pieni osa koko populaatiosta. Tällöin puhutaan otantatutkimuksesta. 2.2 Tilastoaineiston käsittely Empiirisessä tilastollisessa tutkimuksessa havaintoaineiston keräämisen jälkeen aloitetaan aineiston analyysi, joka voidaan jakaa kahteen osaan: kuvailevaan tilastotieteeseen ja tilastolliseen päättelyyn. Kuvailevan eli deskriptiivisen tilastotieteen menetelmin pyritään esittämään havaintoaineiston pääpiirteet tiivistetyssä, informatiivisessa muodossa. Menetelmillä ei siis pyritä yleispätevien, koko populaatiota koskevien päätelmien tekemiseen. Tilastollinen päättely taas on induktiivista loogista päättelyä, jolla pyritään tekemään otoksesta koko populaatiota koskevia päätelmiä. 2.2.1 Tilaston muodostaminen ja luokittelu Aluksi havaintoaineisto kootaan taulukoksi, johon listataan tilastoyksiköt riveille ja tilastomuuttujat sarakkeisiin. Jos havaintoaineisto koostuu n tilastoyksiköstä, joista jokaisesta on kerätty m tilastomuuttujasta havainnot, niin havainnot voidaan kirjoittaa taulukon muotoon , jossa rivillä i on i. tilastoyksikön havainto ja j sarakkeessa on j. tilastollisesta muuttujasta havaitut arvot 𝑥𝑖,𝑗 . Siis yksi rivi on yhden tilastoyksikön tiedot kaikista tilastomuuttujista ja yksi sarake on kaikkien tilastoyksiköiden tiedot yhdestä tilastomuuttujasta. Usein kerätyt havaintoaineistot ovat niin suuria, ettei havaintotaulukkoa suoraan tarkastelemalla näy aineiston pääpiirteitä. Luokittelussa on kysymys aineiston tiivistämisestä kohtuullisen kokoiseksi ja havainnollisempaan muotoon. Luokittelussa tilastomuuttujan arvot sijoitetaan eri luokkiin siten, että yhden tilastomuuttujan arvo voi kuulua vain yhteen luokkaan. Luokka ilmoitetaan yleensä luokkavälinä, kuten reaalilukuvälinä. Esimerkiksi henkilön ikä on tapana luokitella ikäjakauman kuvaamisessa 10-vuotisluokkiin (15-24, 25-34, ...), vaikka periaatteessa ikä voitaisiin ilmoittaa minuutinkin tarkkuudella. Luokkien lukumäärään vaikuttavat muun muassa tilastomuuttujan arvojen vaihteluväli ja havaintoaineiston laajuus. Luokittelussa pyritään siihen, että luokkien lukumäärä saadaan 6 tarvittaessa luokkia yhdistämällä kohtuulliseksi ja että luokat valitaan tasavälisesti eli siten, että kahden peräkkäisen luokan alarajojen erotus on vakio. Kun aineistoa luokitellaan, aineiston luettavuus paranee mutta toisaalta osa tiedoista menetetään eivätkä yksittäiset havaintoarvot ole enää tiedossa. Määritelmä 2.11 Luokkakeskus on luokan ala-ja ylärajan keskiarvo. Yksi yksinkertainen tapa tiivistää aineistoa on muodostaa siitä frekvenssijakauma. Tilastoyksiköiden tilastollisilla muuttujilla on tietty mahdollisten arvojen joukko ja näillä arvoilla on jokin jakauma populaatiossa. Tilastollisen muuttujan (frekvenssi)jakauma ilmaisee, kuinka yleisiä muuttujan eri arvot ovat. Absoluuttinen jakauma sisältää havaintoarvot ja niiden esiintymiskertojen lukumäärät eli frekvenssit f. Suhteellinen jakauma sisältää havaintoarvot ja niiden esiintymiskertojen suhteelliset osuudet havaintojen kokonaismäärästä eli suhteelliset frekvenssit 𝑓%. Määritelmä 2.12 Oletetaan, että tilastomuuttujan mahdolliset arvot voidaan jakaa äärelliseen määrään (k kpl) luokkia, joita merkitään 𝐸1, 𝐸2, … , 𝐸𝑘 . Etsitään aineistosta niiden havaintojen määrät, frekvenssit, jotka kuuluvat näihin luokkiin ja merkitään näitä 𝑓1, 𝑓2, … , 𝑓𝑘. Tilastomuuttujan frekvenssijakauma on (𝐸𝑖, 𝑓𝑖), 𝑖 = 1,… , 𝑘. Havaintojen määrää ilmaisevaa frekvenssiä f kutsutaan myös absoluuttisiksi frekvensseiksi. Frekvenssijakauma voidaan siis muodostaa tapauksissa, joissa tilastomuuttuja on joko luokallinen muuttuja tai diskreetti numeerinen muuttuja. Usein absoluuttisten frekvenssien sijaan on tarpeen selvittää eri luokkiin kuuluvien tilastomuuttujien suhteellinen osuus. Määritelmä 2.13 Suhteellinen frekvenssi 𝑓% kuvaa kunkin frekvenssin osuutta havaintoaineiston tilastoyksiköiden kokonaismäärästä n. Suhteellinen frekvenssijakauma on (𝐸𝑖 , 𝑓𝑖 𝑛 ), 𝑖 = 1,… , 𝑘. Suhteellinen frekvenssijakauma ilmaistaan usein prosentuaalisena frekvenssijakaumana (𝐸𝑖 , 𝑓𝑖 𝑛 ∙ 100%), 𝑖 = 1,… , 𝑘. Suhteellinen frekvenssijakauma ei ole riippuvainen otoskoosta n, minkä vuoksi jakaumien vertailu toisiinsa on helpompaa. Kun tilastomuuttujan mitta-asteikko on luokallinen tai diskreetti numeerinen, on luokkajaon tekeminen selkeää. Jos luokkia on todella suuri määrä ja jokaiseen luokkaan kuuluu vain pieni määrä havaintoja tai niiden käsittely muodostuu muutoin hankalaksi, voidaan luokkia yhdistää. Jos taas muuttujan mitta-asteikko on jatkuva numeerinen, ei frekvenssijakaumaa voida käyttää suoraan. Määritelmä 2.14 (Jatkuvan) numeerisen tilastomuuttujan mahdollisten arvojen joukko voidaan jakaa toisensa poissulkeviin väleihin (k kpl), jolloin jokainen tilastomuuttujan arvo kuuluu 7 täsmälleen yhteen luokkaan 𝐸𝑖 , 𝑖 = 1,… , 𝑘. Luokista muodostettua frekvenssijakaumaa kutsutaan luokitelluksi frekvenssijakaumaksi. Jos tilastomuuttuja on mitattu ordinaaliasteikolla, niin havaintoja voidaan kuvata myös summafrekvenssillä F. Määritelmä 2.15 Summafrekvenssi 𝐹𝑖 kuvaa, kuinka monta havaintoa kuuluu luokkaan 𝐸𝑖 ja sitä edeltäviin luokkiin. Summafrekvenssit saadaan laskettua frekvenssien avulla seuraavasti: 𝐹1 = 𝑓1 𝐹2 = 𝑓1 + 𝑓2 = 𝐹1 + 𝑓2 𝐹3 = 𝑓1 + 𝑓2 + 𝑓3 = 𝐹2 + 𝑓3 ⋮ 𝐹𝑘 = 𝑓1 + 𝑓2 +⋯+ 𝑓𝑘 = 𝐹𝑘−1 + 𝑓𝑘. Summafrekvenssijakauma on siis muotoa (𝐸𝑖 , 𝐹𝑖), 𝑖 = 1,… , 𝑘. Kuten aiemmin, määritellään myös suhteellinen summafrekvenssijakauma (𝐸𝑖 , 𝐹𝑖 𝑛 ), 𝑖 = 1,… , 𝑘 ja prosentuaalinen summafrekvenssijakauma (𝐸𝑖 , 𝐹𝑖 𝑛 ∙ 100%), 𝑖 = 1,… , 𝑘. 2.2.2 Tilaston graafinen esitys Graafiset menetelmät ovat tärkeä osa aineiston havainnollistamista, sillä kuvat helpottavat aineiston tulkitsemista ja usein myös antavat välitöntä palautetta, jos käytössä olevat tilastolliset mallit eivät ole riittäviä selittämään aineistoa. Kuviotyyppi valitaan sen mukaan, mikä aineistossa on huomionarvoista. Pylväskuvioita eli pylväsdiagrammeja (Kuva 2.2) käytetään aineiston havainnollistamiseen, kun havainnot ovat luokallisia tai diskreettejä numeerisia. Niissä pylvään korkeus ilmaisee määrää, muuttujan arvojen frekvenssejä. Erityisesti silloin, kun kuvataan jonkin asian muuttumista ajassa vaaka-akselilla vasemmalta oikealle tai kun mitta-asteikko on ordinaalinen ja järjestys kasvaa vasemmalta oikealle, käytetään pystypylväskuviota. Myös vaakapylväskuvioita käytetään yleisesti. Niissä pylväiden nimet saadaan selvemmin kirjoitettua kuvaan. Silloin, kun luokilla ei ole luonnollista järjestystä, on hyvä piirtää pylväät suuruusjärjestyksessä joko vasemmalta oikealle tai ylhäältä alas. Pylväsryhmäkuvioita ja summapylväskuvioita voidaan käyttää aineiston havainnollistamisessa, kun mielenkiinnon kohteena on useita tilastomuuttujia ja halutaan tarkastella jakaumien mahdollisia eroja ryhmien välillä. 8 Kuva 2.2 Esimerkki pylväsdiagrammista: pystypylväskuvio. Kun halutaan havainnollistaa kokonaisuuden jakautumista osiin, sopii ympyrädiagrammi (Kuva 2.3) hyvin graafiseksi menetelmäksi. Siinä havaintoaineisto piirretään ympyränä, joka jaetaan luokkien mukaan sektoreihin siten, että sektorin koko vastaa luokan suhteellista osuutta jakaumassa. Sektorit suositellaan piirtämään suuruusjärjestyksessä myötäpäivään kiertäen. Kuva 2.3 Esimerkki ympyrädiagrammista. Histogrammi (Kuva 2.4) on pylväskuvio luokitellulle (suhteelliselle) frekvenssijakaumalle, jossa pylvään ala kuvaa luokkien frekvenssiä. Histogrammissa pylväät piirretään kiinni toisiinsa havainnollistamaan mitta-asteikon jatkuvuutta ja niiden reunat ovat luokkien todellisten luokkarajojen kohdalla. Usein luokittelu on tasavälinen, jolloin pylväät ovat yhtä leveitä. Tällöin myös pylväiden korkeudet kuvaavat frekvenssejä. Luokittelun ollessa tasavälinen histogrammin päälle voidaan muodostaa frekvenssimonikulmio (Kuva 2.4) siten, että yhdistetään murtoviivalla 0 200 400 600 800 1000 1200 1400 1600 0-9 v. 10-19 v. 20-29 v. 30-39 v. 40-49 v. 50-59 v. 60-69 v. 70-79 v. yli 80 v. Tartunnan saaneet ikäryhmittäin Tartuntatapausten määrä Ruotsi; 86891 Tanska; 16905 Norja; 10395 Suomi; 7981 Islanti; 2077 Varmistetut tartuntatapaukset Pohjoismaissa 9 frekvenssiarvot kunkin luokan luokkakeskuksessa. Näin saadaan piirrettyä luokiteltu frekvenssijakauma, joka on eräänlainen approksimointi populaatiojakaumalle. Kuva 2.4 Esimerkki histogrammista ja frekvenssimonikulmiosta. Viivakaaviolla eli viivadiagrammilla (Kuva 2.5) havainnollistetaan erityisesti ajan suhteen muuttuvien suureiden vaihtelua ja kehityssuuntia. Vaaka-akselilla on yleensä tasavälisiä aikavälejä ja pystyakselilla jokin muuttujan määrää kuvaava lukuarvo. Kuva 2.5 Esimerkki viivadiagrammista. 0 200 400 600 800 1000 1200 1400 1600 0-9 v. 10-19 v. 20-29 v. 30-39 v. 40-49 v. 50-59 v. 60-69 v. 70-79 v. yli 80 v. Tartuntatapausten määrä 10 2.2.3 Tilastolliset tunnusluvut Toisinaan on tarpeen esittää havaintoaineiston informaatio frekvenssijakaumaakin tiiviimmin. Tällöin käytetään tilastollisia tunnuslukuja, joita ovat keski- eli paikkaluvut ja hajontaluvut. Keskilukuja käytetään silloin, kun halutaan kuvata tilastoyksiköiden yleisimpiä ominaisuuksia. Riippuu tilastoyksikön mitta-asteikosta, mitä keskilukuja aineistolle voidaan määrittää. Määritelmä 2.16 Tilastomuuttujan tyyppiarvo eli moodi, merkitään Mo, on havaintoaineistossa yleisimmin esiintyvä tilastomuuttujan arvo eli tilastomuuttujan arvo, jonka frekvenssi on suurin. Tyyppiarvon olemassaolo ei riipu tilastomuuttujan mitta-asteikosta vaan se voidaan aina määrittää. Tyyppiarvoja voi myös olla useita, jos useammalla tilastomuuttujan arvolla on sama frekvenssi. Tällöin tyyppiarvo ei ole yksikäsitteinen. Määritelmä 2.17 Mediaani, merkitään Md, on järjestetyn havaintoaineiston keskimmäinen alkio eli järjestykseen asetetuista havaintoarvoista keskimmäinen. Mediaani kuvaa siis tilastomuuttujan arvojen keskimääräistä suuruutta. Se voidaan määrittää, jos tilastomuuttujan arvot voidaan mielekkäällä tavalla järjestää eli tilastomuuttuja on järjestys-, suhde- tai intervalliasteikollinen muuttuja. Mediaani on yksikäsitteinen, jos havaintoja on pariton määrä. Jos taas havaintojen määrä on parillinen ja kahdella keskimmäisellä järjestykseen asetetuista havaintoarvoista on eri arvo, mediaani on kumpikin näistä. Tilastomuuttujan mediaanin määrittämisessä voidaan käyttää apuna suhteellista summafrekvenssiä F. Mediaani on se arvo, jonka kohdalla suhteellinen summafrekvenssi saavuttaa arvon 50 % tai myös sitä seuraava arvo, jos suhteellinen summafrekvenssi on tasan 50 %. Keskiluvuista yleisimmin käytetty on havaintoaineistosta intervalli- tai suhdeasteikollisille muuttujille laskettu aritmeettinen keskiarvo 𝜇. Aritmeettista keskiarvoa kutsutaan otoskeskiarvoksi ?̅? silloin, kun tarkastellaan otosta jostain populaatiosta. Tilastomuuttujan keskiarvo saadaan laskemalla yhteen muuttujan arvot ja jakamalla summa havaintojen (tilastoyksiköiden) lukumäärällä. Määritelmä 2.18 (Keskiarvo) 𝜇 = 1 𝑛 ∑𝑥𝑖 𝑛 𝑖=1 , jossa n on havaintojen lukumäärä ja 𝑥1, 𝑥2, … , 𝑥𝑛 ovat tilastomuuttujan saamat arvot. Jos numeerinen havaintoaineisto on luokiteltu k luokkaan, voidaan frekvenssijakauman frekvensseistä 𝑓𝑖 ja luokkien 𝐸𝑖 luokkakeskipisteistä 𝑥𝑖 laskea aritmeettinen keskiarvo eli 11 frekvenssijakauman otoskeskiarvo siten, että kerrotaan kukin luokkakeskipisteen arvo sen frekvenssillä ja jaetaan näiden tulojen summa havaintojen (tilastoyksiköiden) lukumäärällä. Määritelmä 2.19 (Frekvenssijakauman keskiarvo) 𝜇 = 1 𝑛 ∑𝑓𝑖𝑥𝑖 , 𝑘 𝑖=1 jossa n on havaintojen lukumäärä ja 𝑓 𝑖 muuttujan arvon 𝑥𝑖 frekvenssi (𝑖 = 1, 2, … , 𝑘). Jakauman hajonta on tärkeä jakaumien peruspiirre. Hajontaa mittaavat tunnusluvut ilmentävät havaintojen vaihtelun suuruutta havaintoaineistossa: sitä, kuinka laveasti tai tiiviisti mahdolliset arvot ovat jakautuneet. Mitä lähempänä hajonnan tunnusluvut ovat nollaa, sitä vähemmän arvot vaihtelevat. Määritelmä 2.20 Vaihteluvälin pituus on suurimman ja pienimmän havaintoarvon erotus. Vaihteluvälin pituus kuvaa, kuinka suurelta väliltä kaikki aineiston arvot löytyvät. Se riippuu ainoastaan suurimmasta ja pienimmästä havainnosta eikä kerro mitään muiden havaintojen jakautumisesta tälle välille, minkä vuoksi se on tunnuslukuna käyttökelpoinen vain hyvin pienille, alle viiden havainnon havaintoaineistoille. Tilastomuuttujan varianssi 𝜎2 on muuttujan arvojen keskiarvoista laskettujen poikkeamien neliöiden keskiarvo. Määritelmä 2.21 (Varianssi) 𝜎2 = 1 𝑛 ∑(𝑥𝑖 − 𝜇) 2, 𝑛 𝑖=1 jossa n on havaintojen lukumäärä, 𝑥1, 𝑥2, … , 𝑥𝑛 tilastomuuttujan saamat arvot ja μ havaintoarvojen 𝑥𝑖 (𝑖 = 1, 2, … , 𝑘) keskiarvo. Jos numeerinen havaintoaineisto on luokiteltu k luokkaan ja luokan 𝐸𝑖 luokkakeskipisteen arvon 𝑥𝑖 frekvenssi on 𝑓𝑖 , voidaan varianssi laskea myös frekvenssien avulla, sillä jokainen termi (𝑥𝑖 − 𝜇) 2 toistuu summassa 𝑓𝑖 kertaa. Määritelmä 2.22 (Frekvenssijakauman varianssi) 𝜎2 = 1 𝑛 ∑𝑓𝑖(𝑥𝑖 − 𝜇) 2, 𝑘 𝑖=1 12 jossa n on havaintojen lukumäärä, 𝑓𝑖 muuttujan arvon 𝑥𝑖 frekvenssi (𝑖 = 1, 2, … , 𝑘) ja μ havaintoarvojen 𝑥𝑖 keskiarvo. Varianssista voidaan laskea tilastomuuttujan keskihajonta 𝜎, joka on varianssin neliöjuuri eli 𝜎 = √𝜎2. Keskihajonta kuvaa, kuinka paljon havaintoaineiston arvot poikkeavat keskiarvosta. Määritelmä 2.23 (Keskihajonta) Havaintoarvojen 𝑥𝑖, 𝑖 = 1, 2, … , 𝑛, keskihajonta 𝜎 on 𝜎 = √ 1 𝑛 ∑(𝑥𝑖 − 𝜇)2 , 𝑛 𝑖=1 jossa n on havaintojen lukumäärä ja μ havaintoarvojen 𝑥𝑖 keskiarvo. Keskihajonta voidaan laskea myös frekvenssien avulla. Määritelmä 2.24 (Frekvenssijakauman keskihajonta) 𝜎 = √ 1 𝑛 ∑𝑓𝑖(𝑥𝑖 − 𝜇)2 , 𝑛 𝑖=1 jossa n on havaintojen lukumäärä, 𝑓𝑖 muuttujan arvon 𝑥𝑖 frekvenssi (𝑖 = 1, 2, … , 𝑛) ja μ havaintoarvojen 𝑥𝑖 keskiarvo. Jos halutaan vertailla useasta aineistosta poimittuja havaintoarvoja, niin havaintoarvot tehdään ensin vertailukelpoisiksi normittamalla ne. Havaintoarvoa vastaava normitettu arvo on havaintoarvon poikkeama keskiarvosta jaettuna keskihajonnalla. Normitettu arvo siis kertoo, kuinka monen keskihajonnan päässä keskiarvosta tilastomuuttujan arvo on. Määritelmä 2.25 Tilastomuuttujan arvoa x vastaava normitettu arvo z on 𝑧 = 𝑥 − 𝜇 𝜎 , jossa μ on keskiarvo ja σ keskihajonta. Normitetun arvon avulla voidaan siis verrata, kumpi kahdesta eri aineistoihin kuuluvasta muuttujan arvosta on poikkeavampi. 13 2.2.4 Tilastollinen riippuvuus ja korrelaatio Tyypillisesti tieteellisten tutkimusten mielenkiintoisimmat ja tärkeimmät kysymykset liittyvät tutkittavaa ilmiötä kuvaavien muuttujien välisiin riippuvuuksiin [6]. Terveysaiheisissa tutkimuksissa voidaan tarkastella esimerkiksi sitä, miten alkoholin kulutus riippuu alkoholijuomien hintatasosta, kuluttajan tulotasosta tai alkoholin saatavuudesta, tai sitä, miten todennäköisyys sairastua keuhkosyöpään riippuu tupakoinnin määrästä ja kestosta. Kahden muuttujan välinen riippuvuus on eksaktia, jos toisen arvot voidaan ennustaa tarkasti toisen saamien arvojen perusteella. Jos muuttujien välillä ei ole eksaktia riippuvuutta, mutta toisen muuttujan arvoja voidaan käyttää apuna toisen muuttujan arvojen ennustamisessa, puhutaan tilastollisesta riippuvuudesta. Määritelmä 2.26 Jos toinen muuttuja riippuu toisesta lineaarisesti, puhutaan lineaarisesta riippuvuudesta eli lineaarisesta regressiosta. Tätä lineaarista tilastollista riippuvuutta kutsutaan myös korrelaatioksi. Riippuvuutta kuvaavaa suoraa sanotaan regressiosuoraksi. Jos regressiosuora on kasvava, eli toisen muuttujan arvon kasvaessa toisenkin muuttujan arvo kasvaa, niin sanotaan muuttujien välillä olevan positiivinen korrelaatio. Kun regressiosuora on vähenevä, niin muuttujien välinen korrelaatio on negatiivinen. Huomattavaa on, että kaksi muuttujaa voivat olla toisistaan riippuvia, vaikka niiden välillä ei olisi korrelaatiota (ei-lineaarinen riippuvuus). Toisaalta kahden muuttujan välinen voimakas korrelaatio ei välttämättä todista muuttujien välistä syy-seuraussuhdetta. Seuraavaksi määritellään Pearsonin korrelaatiokerroin. Sen määritelmässä tulee tuntea myöhemmin luvussa 3 esiteltävä odotusarvon käsite (Määritelmät 3.23, 3.24 ja 3.29). Korrelaatiokertoimen määrittäminen matemaattisesti ohitetaan lukiomatematiikassa ja se selvitetään laskinohjelmistojen avulla. Määritelmä 2.27 Korrelaatiokerroin (r) on tilastollinen tunnusluku, joka kuvaa lineaarisen tilastollisen riippuvuuden voimakkuutta. Pearsonin korrelaatiokerroin satunnaismuuttujien X ja Y väliselle lineaariselle riippuvuudelle on 𝜌𝑋,𝑌 = 𝐸((𝑋 − 𝜇𝑋)(𝑌 − 𝜇𝑌)) 𝜎𝑋𝜎𝑌 , missä 𝜇𝑋 ja 𝜇𝑌 ovat satunnaismuuttujien X ja Y odotusarvot sekä 𝜎𝑋 ja 𝜎𝑌 ovat satunnaismuuttujien keskihajonnat . Korrelaatiokerroin on määritelty vain, kun keskihajonnat 𝜎𝑋 ja 𝜎𝑌 ovat äärellisiä ja nollasta eroavia. 14 Korrelaatiokerroin kuuluu välille [−1,1]. Mitä lähempänä se on välin päätepisteitä, sitä lähempänä havainnot ovat suoraa 𝑦 = 𝑘𝑥 + 𝑏, jossa kulmakertoimen k etumerkki määrää korrelaatiokertoimen etumerkin. Määritelmä 2.28 Korrelaatiokertoimen toista potenssia 𝑟2 kutsutaan selitysasteeksi. Se ilmaisee, kuinka suuren osuuden muuttujat selittävät toistensa arvojen vaihtelusta. Korrelaatiot muodostavat perustan muuttujien välisten riippuvuuksien ymmärtämiselle, mutta tavallisesti näitä riippuvuuksia halutaan analysoida myös tarkemmin. Regressioanalyysi on tilastollinen menetelmä, jossa yhden muuttujan (nk. selitettävän muuttujan) tilastollista riippuvuutta muista muuttujista (ns. selittävistä muuttujista) pyritään mallintamaan ja ennustamaan regressiomalliksi kutsutulla tilastollisella mallilla. 15 3 Todennäköisyyslaskenta Tässä luvussa esitellään sellaiset todennäköisyyslaskennan käsitteet ja tulokset, jotka ovat lukion pitkän matematiikan Tilastot ja todennäköisyys -opintojakson ydinainesta ja joita tarvitaan oppimateriaalissa esiteltävien tehtävien ratkaisemiseksi. Määritelmät ja tulokset perustuvat Heikki Ruskeepään [7], Jyrki Lahtosen [8] ja Iiro Honkalan monisteisiin [9]. Ensiksi tutustutaan todennäköisyyden perusominaisuuksiin: todennäköisyyskäsitteeseen, joukko-opin perusmerkintöihin ja niiden todennäköisyystulkintoihin sekä todennäköisyydeltä vaadittaviin ominaisuuksiin. Tämän jälkeen tutustutaan muutamiin kombinatoriikan tuloksiin, jotka helpottavat tapausten lukumäärän tutkimista ja laskemista. Sitten syvennytään todennäköisyyden laskusääntöihin sekä huomioihin niiden käytettävyyden taustalla. Lopuksi käsitellään diskreettejä ja jatkuvia satunnaismuuttujia sekä yleisimpiä todennäköisyysjakaumia tunnuslukuineen. 3.1 Todennäköisyyden perusominaisuuksia 3.1.1 Todennäköisyys Todennäköisyyslaskenta tutkii ja mallintaa matemaattisesti stokastisia ilmiöitä eli satunnaisilmiöitä. Satunnaisilmiöt ovat sellaisia ilmiöitä, joiden lopputuloksen määrää sattuma ja joiden tulosta ei näin ollen pystytä tarkasti ennustamaan. Satunnaiskokeen mallintamista varten tarvitaan kuitenkin tieto mahdollisista lopputulosvaihtoehdoista. Määritelmä 3.1 Kokeen erilaisia tuloksia kutsutaan alkeistapauksiksi. Mikä tahansa alkeistapausten joukko on tapaus (tapahtuma), mutta kaikkien alkeistapausten joukkoa kutsutaan perusjoukoksi eli otosavaruudeksi . Tapaus sattuu, kun kokeen tulokseksi saadaan alkeistapaus, joka kuuluu tapaukseen. Klassisesta todennäköisyydestä puhutaan, kun alkeistapauksia on äärellinen määrä ja ne ovat kaikki yhtä todennäköisiä. Yksinkertainen oppikirjaesimerkki tällaisesta satunnaiskokeesta on nopan heitto, jonka yhtä todennäköiset alkeistapaukset ovat nopan silmäluvut 1, 2, 3, 4, 5 ja 6. Määritelmä 3.2 (Todennäköisyyden klassinen määritelmä) Merkitään tapauksen A todennäköisyyttä P(A). Olkoon |A| tapauksen A alkeistapausten lukumäärä ja || otosavaruuden alkeistapausten lukumäärä. Tällöin, jos kokeen kaikki alkeistapaukset ovat yhtä todennäköisiä, tapauksen A todennäköisyys on 𝑃(𝐴) = |𝐴| || . Tapauksen A alkeistapauksia sanotaan myös suotuisiksi alkeistapauksiksi. Todennäköisyyden klassinen määritelmä voidaan täten kirjoittaa myös seuraavasti: 16 𝑃(𝐴) = suotuisien alkeistapauksien lukuma a ra kaikkien alkeistapauksien lukuma a ra . Todennäköisyyksiä voidaan laskea myös kokeellisten havaintojen pohjalta. Esimerkiksi nopan heiton tuloksia voitaisiin tilastoida ja laskea kunkin silmäluvun tilastollinen todennäköisyys. Havaintoaineistosta laskettavan tapauksen todennäköisyys on vastaavan tilastomuuttujan arvon suhteellinen frekvenssi. Määritelmä 3.3 (Tilastollinen todennäköisyys) Jos kaikkien havaintojen lukumäärä on n ja tapaukselle A suotuisten tapahtumien lukumäärä on k, niin tapauksen A todennäköisyys on 𝑃(𝐴) = suotuisien havaintojen lukuma a ra kaikkien havaintojen lukuma a ra = 𝑘 𝑛 . Kun alkeistapauksia on ylinumeroituva määrä, niin todennäköisyyttä ei voida määrittää lukumääriä vertaamalla. Joskus alkeistapausten joukkoa voidaan silti kuvata geometristen mittojen, kuten pituuden, pinta-alan, tilavuuden ja kulman suuruuden avulla ja tällöin todennäköisyyksiä voidaan laskea mittojen suhteina. Esimerkiksi tikanheitossa, olettaen kaikkien taulun pisteiden olevan yhtä todennäköisiä ja heiton aina osuvan tauluun, saataisiin napakymppiheiton todennäköisyys keskiympyrän ja tikkataulun pinta-alojen suhteena. Määritelmä 3.4 (Geometrinen todennäköisyys) Tapahtuman A todennäköisyys 𝑃(𝐴) = suotuisien osien geometrinen mitta koko kuvion geometrinen mitta . 3.1.2 Joukko-oppia Monet todennäköisyyslaskennan käsitteistä ja tuloksista perustuvat joukko-oppiin, minkä vuoksi joukko-opin peruskäsitteet ja -merkinnät sekä niiden todennäköisyystulkinnat ovat perusteltuja esitellä ennen siirtymistä todennäköisyyden ominaisuuksiin ja laskusääntöihin. Joukko-opin peruskäsitteitä ovat joukko ja alkio. Jos alkio a on joukon A alkio (eli alkio a kuuluu joukkoon A), merkitään a ∈ A. Vastaavasti jos alkio a ei kuulu joukkoon A, merkitään a ∉ A. Silloin, kun joukon alkioiden lukumäärä voidaan laskea, joukko on äärellinen. Muulloin joukko on ääretön. Määritelmä 3.5 Joukko A on sama joukko kuin joukko B, merkitään A = B, jos joukot A ja B muodostuvat tarkalleen samoista alkioista. Muussa tapauksessa merkitään A ≠ B. Jos jokainen joukon A alkio kuuluu myös joukkoon B, joukko A on joukon B osajoukko, merkitään A ⊆ B. Jos lisäksi A ≠ B, niin joukko A on joukon B aito osajoukko, merkitään A ⊂ B. Huomautus 3.1 Todennäköisyyslaskennassa perusjoukkoa nimitetään usein otosavaruudeksi, joukoista puhutaan tapahtumina tai tapauksina ja joukon alkioita nimitetään alkeistapauksiksi. 17 Määritelmä 3.6 Joukkojen A ja B leikkaus A ∩ B sisältää ne alkeistapaukset, jotka ovat sekä joukossa A että joukossa B. Tapaus A ∩ B siis sattuu, jos molemmat tapauksista A ja B sattuvat. Määritelmä 3.7 Joukkojen A ja B unioni (yhdiste) A ∪ B sisältää ne alkeistapaukset, jotka ovat ainakin toisessa joukoista A ja B. Tapaus A ∪ B siis sattuu, jos ainakin toinen tapauksista A ja B sattuu. Tyhjään joukkoon, merkitään ∅, ei kuulu yhtään alkiota. Tapauksena tyhjä joukko ∅ ei koskaan satu ja sitä sanotaan mahdottomaksi tapaukseksi. Usein joukkoja tarkastellaan jonkin yhteisen laajemman joukon osajoukkoina. Tällaista joukkoa sanotaan perusjoukoksi . Koko perusjoukko on varma tapaus eli se sattuu aina. Nyt joukon A komplementti on joukko 𝐴𝐶 =  − 𝐴. Määritelmä 3.8 Tapaus 𝐴𝐶 on tapauksen A komplementtitapaus (vastatapahtuma) eli se sisältää ne alkeistapaukset, jotka eivät sisälly tapaukseen A. Tapaus 𝐴𝐶 siis sattuu, jos tapaus A ei satu. Määritelmä 3.9 Joukkojen A ja B erotus A - B = A ∩ 𝐵𝐶 sisältää ne joukon A alkeistapaukset, jotka eivät kuulu joukkoon B. Tapaus A - B siis sattuu, jos tapaus A sattuu ja tapaus B ei satu. Seuraava määritelmä on todennäköisyyslaskennassa erittäin tärkeä. Määritelmä 3.10 Tapaukset A ja B ovat toisensa poissulkevat eli erilliset tapahtumat, jos 𝐴 ∩ 𝐵 = ∅. Toisin sanoen, jos A ja B ovat toisensa poissulkevia tapauksia, niin tapahtuman A tapahtuessa tapahtuma B ei voi tapahtua ja toisaalta tapahtuman B tapahtuessa tapahtuma A ei voi tapahtua. Yleisemmin tapaukset 𝐴𝑖 ovat toisensa poissulkevat, jos 𝐴𝑖 ∩ 𝐴𝑗 = ∅ kaikilla 𝑖 ≠ 𝑗. Tapauksia (joukkoja) havainnollistetaan usein nk. Venn-diagrammeina (Kuva 3.1a ja Kuva 3.1b). Venn-diagrammiin voidaan myös merkitä tapaukseen kuuluvien alkeistapauksien lukumäärä tai tapauksen todennäköisyys. Kuva 3.1a Venn-diagrammi Kuva 3.1b Venn-diagrammi, johon merkitty tapausten todennäköisyydet. 18 Seuraavia, unionille ja leikkaukselle päteviä distributiivilakeja sekä komplementille päteviä de Morganin lakeja ei esitellä lukion todennäköisyyslaskennan opintojaksolla. Ne ovat kuitenkin välttämättömiä tuntea useiden todennäköisyyslaskennan lauseiden ja niiden todistusten ymmärtämiseksi, minkä vuoksi opettajan on hyvä tietää nämä joukkojen algebran laskusäännöt. Lause 3.1 (Distributiivilait) a) 𝐴 ∪ (𝐵 ∩ 𝐶) = (𝐴 ∪ 𝐵) ∩ (𝐴 ∪ 𝐶), 𝐴 ∪ (⋂ 𝐵𝑖 𝑛 𝑖=1 ) = ⋂ (𝐴 ∪ 𝐵𝑖) 𝑛 𝑖=1 b) 𝐴 ∩ (𝐵 ∪ 𝐶) = (𝐴 ∩ 𝐵) ∪ (𝐴 ∩ 𝐶). 𝐴 ∩ (⋃ 𝐵𝑖 𝑛 𝑖=1 ) = ⋃ (𝐴 ∩ 𝐵𝑖) 𝑛 𝑖=1 Todistus. a) 𝑥 ∈ 𝐴 ∪ (𝐵 ∩ 𝐶) ⇔ 𝑥 ∈ 𝐴 𝑡𝑎𝑖 𝑥 ∈ 𝐵 ∩ 𝐶 ⇔ 𝑥 ∈ 𝐴 𝑡𝑎𝑖 (𝑥 ∈ 𝐵 𝑗𝑎 𝑥 ∈ 𝐶) ⇔ (𝑥 ∈ 𝐴 𝑡𝑎𝑖 𝑥 ∈ 𝐵) 𝑗𝑎 (𝑥 ∈ 𝐴 𝑡𝑎𝑖 𝑥 ∈ 𝐶) ⇔ 𝑥 ∈ 𝐴 ∪ 𝐵 𝑗𝑎 𝑥 ∈ 𝐴 ∪ 𝐶 ⇔ 𝑥 ∈ (𝐴 ∪ 𝐵) ∩ (𝐴 ∪ 𝐶). Yleinen tapaus todistettaisiin vastaavasti induktiolla. b) 𝑥 ∈ 𝐴 ∩ (𝐵 ∪ 𝐶) ⇔ 𝑥 ∈ 𝐴 𝑗𝑎 𝑥 ∈ 𝐵 ∪ 𝐶 ⇔ 𝑥 ∈ 𝐴 𝑗𝑎 (𝑥 ∈ 𝐵 𝑡𝑎𝑖 𝑥 ∈ 𝐶) ⇔ (𝑥 ∈ 𝐴 𝑗𝑎 𝑥 ∈ 𝐵) 𝑡𝑎𝑖 (𝑥 ∈ 𝐴 𝑗𝑎 𝑥 ∈ 𝐶) ⇔ 𝑥 ∈ 𝐴 ∩ 𝐵 𝑡𝑎𝑖 𝑥 ∈ 𝐴 ∩ 𝐶 ⇔ 𝑥 ∈ (𝐴 ∩ 𝐵) ∪ (𝐴 ∩ 𝐶). Yleinen tapaus todistettaisiin vastaavasti induktiolla. ∎ Lause 3.2 (de Morganin lait) a) (𝐴 ∪ 𝐵)𝐶 = 𝐴𝐶 ∩ 𝐵𝐶 , (⋃ 𝐴𝑖 𝑛 𝑖=1 ) 𝐶 = ⋂ 𝐴𝑖 𝐶𝑛 𝑖=1 b) (𝐴 ∩ 𝐵)𝐶 = 𝐴𝐶 ∪ 𝐵𝐶 . (⋂ 𝐴𝑖 𝑛 𝑖=1 ) 𝐶 = ⋃ 𝐴𝑖 𝐶𝑛 𝑖=1 Todistus. a) 𝑥 ∈ (𝐴𝐶 ∩ 𝐵𝐶)𝐶 ⇔ 𝑥 ∉ 𝐴𝐶 ∩ 𝐵𝐶 ⇔ 19 𝑥 ∉ 𝐴𝐶 𝑗𝑎 𝑥 ∉ 𝐵𝐶 ⇔ 𝑥 ∈ 𝐴 𝑡𝑎𝑖 𝑥 ∈ 𝐵 ⇔ 𝑥 ∈ 𝐴 ∪ 𝐵. Yleinen tapaus todistettaisiin vastaavasti induktiolla. b) 𝑥 ∈ (𝐴𝐶 ∪ 𝐵𝐶)𝐶 ⇔ 𝑥 ∉ 𝐴𝐶 ∪ 𝐵𝐶 ⇔ 𝑥 ∉ 𝐴𝐶 𝑡𝑎𝑖 𝑥 ∉ 𝐵𝐶 ⇔ 𝑥 ∈ 𝐴 𝑗𝑎 𝑥 ∈ 𝐵 ⇔ 𝑥 ∈ 𝐴 ∩ 𝐵. Yleinen tapaus todistettaisiin vastaavasti induktiolla. ∎ De Morganin lakien mukaan siis unioni voidaan määritellä leikkauksen ja komplementin avulla ja joukkojen leikkaus unionin ja komplementin avulla. 3.1.3 Todennäköisyyden aksioomat ja ominaisuudet Seuraavaksi esitetään todennäköisyydeltä vaadittavia, perustavanlaatuisia ominaisuuksia eli aksioomia, joista saadaan myöhemmin johdettua todennäköisyyden laskusääntöjä. Todennäköisyyden aksioomat A1. Todennäköisyys 𝑃(𝐴) ≥ 0 kaikille tapauksille 𝐴. A2. 𝑃() = 1. A3. Jos tapaukset 𝐴𝑖 , jossa 𝑖 = 1,2, … , ovat toisensa poissulkevat, 𝑃(⋃ 𝐴𝑖 ∞ 𝑖=1 ) = ∑ 𝑃(𝐴𝑖) ∞ 𝑖=1 . On luontevaa olettaa aksiooman A1 tapaan todennäköisyyden olevan ei-negatiivinen. Aksiooma A2 normeeraa todennäköisyydet siten, että suurin mahdollinen todennäköisyys on 1. Aksioomassa A3 yhtälön vasemmalla puolella esiintyvä tapaus ⋃ 𝐴𝑖 ∞ 𝑖=1 sattuu, jos ainakin jokin tapauksista 𝐴𝑖 sattuu. Kuitenkin, tapausten 𝐴𝑖 ollessa toisensa poissulkevia, tapaus ⋃ 𝐴𝑖 ∞ 𝑖=1 sattuu vain, jos tarkalleen yksi tapauksista 𝐴𝑖 sattuu. Täten on luontevaa, että tapauksien 𝐴𝑖 todennäköisyydet lasketaan yhteen eli 𝑃(⋃ 𝐴𝑖 ∞ 𝑖=1 ) = ∑ 𝑃(𝐴𝑖) ∞ 𝑖=1 . Näiden kolmen aksiooman avulla voidaan todistaa seuraavassa lauseessa esiteltävät todennäköisyyden ominaisuudet. 20 Lause 3.3 Todennäköisyydellä on seuraavat ominaisuudet: a) 𝑃(∅) = 0. b) Jos 𝐴 ∩ 𝐵 = ∅, niin 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵). c) 𝑃(𝐴) = 1 − 𝑃(𝐴𝐶) (𝑘𝑜𝑚𝑝𝑙𝑒𝑚𝑒𝑛𝑡𝑡𝑖𝑘𝑎𝑎𝑣𝑎). d) Jos 𝐴 sisältyy tapaukseen 𝐵, niin 𝑃(𝐴) ≤ 𝑃(𝐵). e) 0 ≤ 𝑃(𝐴) ≤ 1. f) 𝑃(𝐴 − 𝐵) = 𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵). Todistus. a) Valitaan aksioomassa 𝐴3, että 𝐴𝑖 = ∅. Tällöin 𝑃(⋃ ∅∞𝑖=1 ) = ∑ 𝑃(∅) ∞ 𝑖=1 , eli 𝑃(∅) = ∑ 𝑃(∅)∞𝑖=1 , josta seuraa välttämättä, että 𝑃(∅) = 0. b) Valitaan aksioomassa A3, että 𝐴1 = 𝐴, 𝐴2 = 𝐵 ja 𝐴𝑖 = ∅, kun 𝑖 ≥ 3. 𝑃(𝐴 ∪ 𝐵 ∪ ∅ ∪ …) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(∅) + ⋯, josta a-kohdan nojalla saadaan 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵). c) Koska  = 𝐴 ∪ 𝐴𝐶 , niin 𝑃() = 𝑃(𝐴 ∪ 𝐴𝐶). Aksiooman A2 mukaan 𝑃() = 1, joten 𝑃(𝐴 ∪ 𝐴𝐶) = 1. Tiedetään myös, että 𝐴 ∪ 𝐴𝐶 = ∅, josta b-kohdan nojalla saadaan 𝑃(𝐴 ∪ 𝐴𝐶) = 𝑃(𝐴) + 𝑃(𝐴𝐶). Näin ollen 1 = 𝑃(𝐴) + 𝑃(𝐴𝐶). d) Jos A sisältyy tapaukseen 𝐵, niin 𝐵 = 𝐴 ∪ (𝐵 − 𝐴), joten 𝑃(𝐵) = 𝑃[𝐴 ∪ (𝐵 − 𝐴)] Koska 𝐴 ∩ (𝐵 − 𝐴) = ∅, niin b-kohdan mukaan 𝑃[𝐴 ∪ (𝐵 − 𝐴)] = 𝑃(𝐴) + 𝑃(𝐵 − 𝐴). Aksiooman A1 nojalla 𝑃(𝐵 − 𝐴) ≥ 0, joten 𝑃(𝐴) + 𝑃(𝐵 − 𝐴) ≥ 𝑃(𝐴). Siis 𝑃(𝐵) ≥ 𝑃(𝐴). e) Aksiooman A1 mukaan 𝑃(𝐴) ≥ 0. Koska tapaus 𝐴 sisältyy otosavaruuteen , niin d-kohdan mukaan 𝑃(𝐴) ≤ 𝑃(). Aksiooma A2 normittaa otosavaruuden todennäköisyyden 𝑃() = 1, joten on oltava 𝑃(𝐴) ≤ 1. f) Koska 𝐴 = (𝐴 ∩ 𝐵) ∪ (𝐴 − 𝐵),missä (𝐴 ∩ 𝐵) ∩ (𝐴 − 𝐵) = ∅, niin b-kohdan mukaan 𝑃(𝐴) = 𝑃(𝐴 ∩ 𝐵) + 𝑃(𝐴 − 𝐵). ∎ 21 Huomautus 3.1 a) Tapaus ∅ on mahdoton tapaus ja sen todennäköisyys 𝑃(∅) = 0 aina. On kuitenkin hyvä huomata, että vaikka joillekin tapauksille A olisi 𝑃(𝐴) = 0, niin siitä ei automaattisesti seuraa, että 𝐴 = ∅. On olemassa ei-tyhjiä tapauksia, joiden todennäköisyys on nolla. Jos siis 𝑃(𝐴) = 0, niin sanotaan tapauksen A olevan melkein mahdoton tapaus. b) Tapaus  on varma tapaus ja 𝑃() = 1. Kuten edeltävässä tapauksessa, on myös tässä huomattava, että jos jollekin tapaukselle pätee 𝑃(𝐴) = 1, niin siitä ei välttämättä seuraa, että 𝐴 = . Sanotaan, että 𝑃(𝐴) = 1 on melkein varma tapaus. Seuraavan lauseen a-kohta yleistää Lauseen 3.3 b-kohdan useamman tapauksen unionille. Lause 3.4 Oletetaan, että tapaukset 𝐴𝑖 , jossa i = 1, …, n, ovat toisensa poissulkevat. a) 𝑃(⋃ 𝐴𝑖 𝑛 𝑖=1 ) = ∑ 𝑃(𝐴𝑖) 𝑛 𝑖=1 (summakaava). b) Jos lisäksi ⋃ 𝐴𝑖 𝑛 𝑖=1 =  , niin∑ 𝑃(𝐴𝑖) = 1. 𝑛 𝑖=1 Todistus. a) Valitaan aksioomassa A3 𝐴𝑖 = ∅, kun 𝑖 ≥ 𝑛 + 1. Tällöin 𝑃(⋃ 𝐴𝑖 𝑛 𝑖=1 ) = 𝑃[(⋃ 𝐴𝑖 𝑛 𝑖=1 ) ∪ (⋃ ∅ ∞ 𝑖=𝑛+1 )] (josta A3: n nojalla saadaan) . = ∑ 𝑃(𝐴𝑖) + ∑ 𝑃(∅) ∞ 𝑖=𝑛+1 𝑛 𝑖=1 = ∑ 𝑃(𝐴𝑖) 𝑛 𝑖=1 . b) Aluksi a-kohdan nojalla saadaan ∑ 𝑃(𝐴𝑖) 𝑛 𝑖=1 = 𝑃(⋃ 𝐴𝑖 𝑛 𝑖=1 ) (jolloin oletuksesta seuraa) = 𝑃() (josta A2: n nojalla saadaan) = 1.∎ On huomionarvoista, että Lauseen 3.4 b-kohdan antamaa tulosta voidaan käyttää tarkastuskeinona silloin, kun kaikkien tapausten todennäköisyydet on laskettu. Tämän vuoksi on usein hyödyllistä laskea kaikkien tapauksien todennäköisyydet, vaikka tarvittaisiin vain tietyn tapauksen todennäköisyys. Jos tapausavaruus voidaan jakaa toistensa poissulkevien tapausten unioniksi ja kaikkien tapauksien todennäköisyyksien summa on erisuuri kuin 1, on laskuissa varmasti jokin virhe. Kyseistä tulosta voidaan käyttää myös yhden todennäköisyyden 𝑃(𝐴𝑖) ratkaisemiseksi yhtälöstä ∑ 𝑃(𝐴𝑖) = 1 𝑛 𝑖=1 , kun muiden tapausten todennäköisyydet tunnetaan. Tämän käyttötavan varjopuolena on hyvän tarkistuskeinon menettäminen. 22 Myös Lauseen 3.3 e-kohta on erittäin tärkeä todennäköisyyksien tarkistamisessa, sillä jos laskujen tuloksena saatu todennäköisyys on negatiivinen tai suurempi kuin 1, on laskuvirhe varma tapaus. 3.2 Kombinatoriikkaa Käytettäessä klassisen todennäköisyyden kaavaa 𝑃(𝐴) = |𝐴| || joudutaan selvittämään tapauksen A ja otosavaruuden  alkeistapauksien lukumäärät. Välillä lukumäärät saadaan selville helposti yksinkertaisen päättelyn avulla tai luettelemalla eri mahdollisuudet, mutta usein on sujuvampaa käyttää kombinatoriikan tuloksia. Määritelmä 3.11 Joukosta voidaan ottaa alkioita, eli suorittaa otanta, kahdella tavalla. Otanta tehdään palauttamatta, jos joukosta otetaan pois yksi alkio kerrallaan. Otanta tehdään palauttaen, jos jokaisen alkion poisoton jälkeen alkio palautetaan joukkoon. Määritelmä 3.12 Joukko on järjestämätön, jos sen alkioiden järjestyksellä ei ole väliä. Joukko on järjestetty, jos alkioiden järjestyksen muuttuessa myös joukko muuttuu. Kun joukosta valitaan alkioita kiinnittämättä huomiota niiden järjestykseen, saadaan osajoukkoja eli kombinaatioita. Kun taas joukosta valitut alkiot järjestetään jonoon, jossa alkioiden keskinäinen järjestys on merkitsevä, puhutaan permutaatioista. Määritelmä 3.13 Joukon alkioiden k-kombinaatio muodostetaan ottamalla joukosta k:n alkion otos (palauttamatta tai palauttaen) ja muodostamalla siitä järjestämätön joukko. Joukon alkioiden k- permutaatio muodostetaan ottamalla joukosta k:n alkion otos (palauttamatta tai palauttaen) ja muodostamalla siitä järjestetty joukko. Toisin sanoen k-kombinaatio on järjestämätön k-alkioinen joukko ja k-permutaatio on järjestetty k-alkioinen joukko. Jos kahdessa k-alkioisessa joukossa on täsmälleen samat alkiot, pidetään näitä joukkoja samoina. Esimerkiksi Lotto-arvonnan tulos on yksi joukon {1, 2, … , 39} 7-kombinaatioista palauttamatta ja Jokeri-arvonnan tulos on yksi joukon {1, 2, … , 9} 7-permutaatioista palauttaen. Lause 3.5 (Tuloperiaate) Jos operaatio 𝐴𝑖 voidaan tehdä 𝑛𝑖:llä eri tavalla, 𝑖 = 1,… , 𝑘, niin jono (operaatio 𝐴1, … , operaatio 𝐴𝑘) voidaan tehdä 𝑛1 ∙ 𝑛2 ∙ … ∙ 𝑛𝑘 eri tavalla. Lauseessa 3.5 oletetaan siis, että kokonaisuuden valitsemisessa on k peräkkäistä vaihetta. Tällöin, jos ensimmäisessä vaiheessa on 𝑛1 vaihtoehtoa joista valita, toisessa vaiheessa on 𝑛2 vaihtoehtoa joista valita ja niin edelleen kunnes k. vaiheessa on 𝑛𝑘 vaihtoehtoa joista valita, niin kokonaisuus voidaan valita 𝑛1 ∙ 𝑛2 ∙ … ∙ 𝑛𝑘 eri tavalla. 23 Lause 3.6 (Järjestetty otanta palauttamatta) a) Joukosta, jossa on n erilaista alkiota, voidaan ottaa k:n alkion järjestetty otos palauttamatta 𝑛(𝑛 − 1)(𝑛 − 2) ∙∙∙ (𝑛 − 𝑘 + 1) eli 𝑛! (𝑛−𝑘)! eri tavalla. Tästä k-permutaatioiden lukumäärästä käytetään merkintää 𝑃(𝑛, 𝑘). b) Jos joukossa on n erilaista alkiota, niin alkiot voidaan järjestää jonoon 𝑛! eri tavalla. Todistus. a) Otoksen ensimmäinen alkio voidaan valita n eri tavalla, toinen alkio 𝑛 − 1 eri tavalla, kolmas alkio 𝑛 − 2 eri tavalla ja niin edelleen kunnes k. alkio voidaan valita 𝑛 − (𝑘 − 1) eri tavalla. Täten tuloperiaatteen (Lause 3.5) nojalla k:n alkion otos voidaan valita 𝑛(𝑛 − 1)(𝑛 − 2) ∙∙∙ (𝑛 − 𝑘 + 1) eri tavalla. b) Jonon ensimmäinen alkio voidaan valita n:llä eri tavalla, toinen 𝑛 − 1 eri tavalla, kolmas 𝑛 − 2 eri tavalla ja niin edelleen kunnes jonon toiseksi viimeinen alkio voidaan valita kahdella eri tavalla ja viimeinen vain yhdellä tapaa. Näin ollen tuloperiaatteen nojalla n alkiota voidaan järjestää jonoon 𝑛(𝑛 − 1)(𝑛 − 2) ∙∙∙ 2 ∙ 1 = 𝑛! eri tavalla.∎ Lause 3.7 (Järjestetty otanta palauttaen) Joukosta, jossa on n erilaista alkiota, voidaan ottaa k:n alkion järjestetty otos palauttaen 𝑛𝑘 eri tavalla. Todistus. Otoksen ensimmäinen alkio voidaan valita n eri tavalla, toinen alkio 𝑛 eri tavalla, kolmas alkio 𝑛 eri tavalla ja niin edelleen kunnes k. alkio voidaan valita 𝑛 eri tavalla. Täten tuloperiaatteen (Lause 3.5) nojalla k:n alkion otos voidaan valita 𝑛𝑘 eri tavalla. ∎ Lause 3.8 (Järjestämätön otanta palauttamatta, binomikertoimen otantatulkinta) Joukosta, jossa on n erilaista alkiota, voidaan ottaa järjestämätön otos palauttamatta 𝑛! 𝑘!(𝑛−𝑘)! eri tavalla. Tästä k- kombinaatioiden lukumäärästä käytetään merkintöjä (𝑛𝑘) ja 𝐶(𝑛, 𝑘). Todistus. Joukon k-permutaatioita on 𝑛! (𝑛−𝑘)! kappaletta (Lause 3.6 a). Merkitään k-kombinaatioiden lukumäärää muuttujalla x. Tällöin k-permutaatioita on 𝑘! 𝑥 kappaletta. Siis 𝑘! 𝑥 = 𝑛! (𝑛−𝑘)! jos ja vain jos 𝑥 = 𝑛! 𝑘!(𝑛−𝑘)! . 24 Huomautus 3.1 Binomikertoimella (𝑛𝑘) on Lauseen 3.8 otantatukinnan lisäksi seuraavat hyödylliset tulkinnat: a) (Binomikertoimen järjestystulkinta) (𝑛𝑘) on niiden tapojen lukumäärä, joilla k kappaletta tyypin 1 ja 𝑛 − 𝑘 kappaletta tyypin 2 alkioita voidaan järjestää jonoon. b) (Binomikertoimen lokerotulkinta) (𝑛𝑘) on niiden tapojen lukumäärä, joilla n erilaista alkiota voidaan jakaa kahteen lokeroon siten, että lokeroihin tulee k ja 𝑛 − 𝑘 alkiota. 3.3 Todennäköisyyden laskusääntöjä Seuraavaksi tutustutaan tarkemmin lukion todennäköisyyslaskennan opintojaksolla esiteltäviin laskusääntöihin, joita ovat komplementtisääntö (Lause 3.3 c), yhteenlaskusääntö, kertolaskusääntö sekä toistokokeeseen liittyvän binomitodennäköisyyden laskukaava. Näiden laskusääntöjen oikea käyttö vaatii ehdollisen todennäköisyyden ja riippumattomuuden käsitteiden ymmärtämisen. 3.3.1 Yhteenlaskusääntö Kun tapahtumat A ja B eivät ole erillisiä, tapahtuma A ∪ B eli "A tai B" tarkoittaa, että ainakin toinen tapauksista A tai B sattuu. Kun lasketaan todennäköisyys 𝑃(𝐴 ∪ 𝐵) on summasta 𝑃(𝐴) + 𝑃(𝐵) vähennettävä tapahtuman 𝐴 ∩ 𝐵 eli "A ja B" todennäköisyys, jottei tapahtumille A ja B yhteiset alkeistapaukset tule mukaan kahteen kertaan. Usein lukion pitkän matematiikan opintojaksolla esitellään seuraavasta lauseesta vain ensimmäinen tulos (a-kohta) tai kaksi ensimmäistä tulosta (a- ja b-kohdat). Lause 3.9 (Mukaanlukemis-poissulkemis-periaate, yleinen yhteenlaskusääntö) a) 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) b) 𝑃(𝐴 ∪ 𝐵 ∪ 𝐶) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) − 𝑃(𝐴 ∩ 𝐵) − 𝑃(𝐴 ∩ 𝐶) − 𝑃(𝐵 ∩ 𝐶) + 𝑃(𝐴 ∩ 𝐵 ∩ 𝐶) c) 𝑃(𝐴 ∪ 𝐵 ∪ 𝐶 ∪ 𝐷) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) + 𝑃(𝐷) −𝑃(𝐴 ∩ 𝐵) − 𝑃(𝐴 ∩ 𝐶) − 𝑃(𝐴 ∩ 𝐷) − 𝑃(𝐵 ∩ 𝐶) − 𝑃(𝐵 ∩ 𝐷) − 𝑃(𝐶 ∩ 𝐷) +𝑃(𝐴 ∩ 𝐵 ∩ 𝐶) + 𝑃(𝐴 ∩ 𝐵 ∩ 𝐷) + 𝑃(𝐴 ∩ 𝐶 ∩ 𝐷) + 𝑃(𝐵 ∩ 𝐶 ∩ 𝐷) −𝑃(𝐴 ∩ 𝐵 ∩ 𝐶 ∩ 𝐷) d) 𝑃(⋃ 𝐴𝑖 𝑛 𝑖=1 ) = ∑ 𝑃(𝐴𝑖) 𝑛 𝑖=1 − ∑ ∑ 𝑃(𝐴𝑖 ∩ 𝐴𝑗) 𝑛 𝑗=𝑖+1 𝑛−1 𝑖=1 + ∑ ∑ ∑ 𝑃(𝐴𝑖 ∩ 𝐴𝑗 ∩ 𝑛 𝑘=𝑗+1 𝑛−1 𝑗=𝑖+1 𝑛−2 𝑖=1 𝐴𝑘) − +⋯+ (−1) 𝑛−1 𝑃(⋂ 𝐴𝑖 𝑛 𝑖=1 ) 25 Todistus. a) Koska 𝐴 ∪ 𝐵 = (𝐴 − 𝐵) ∪ 𝐵, missä (𝐴 − 𝐵) ∩ 𝐵 = ∅, niin Lauseen 3.3 b-kohdan mukaan 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴 − 𝐵) + 𝑃(𝐵), josta Lauseen 3.3 f-kohdan mukaan saadaan 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵) + 𝑃(𝐵). b) 𝑃(𝐴 ∪ 𝐵 ∪ 𝐶) = 𝑃[𝐴 ∪ (𝐵 ∪ 𝐶)], =⏞ 𝑎−𝑘𝑜ℎ𝑡𝑎 𝑃(𝐴) + 𝑃(𝐵 ∪ 𝐶) − 𝑃[𝐴 ∩ (𝐵 ∪ 𝐶)] =⏞ 𝑎−𝑘𝑜ℎ𝑡𝑎 𝑃(𝐴) + [𝑃(𝐵) + 𝑃(𝐶) − 𝑃(𝐵 ∩ 𝐶)] − 𝑃[𝐴 ∩ (𝐵 ∪ 𝐶)] =⏞ 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑡𝑖𝑖𝑣𝑖𝑠𝑢𝑢𝑠 (𝐿𝑎𝑢𝑠𝑒 3.1) 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) − 𝑃(𝐵 ∩ 𝐶) − 𝑃[(𝐴 ∩ 𝐵) ∪ (𝐴 ∩ 𝐶)] =⏞ 𝑎) 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) − 𝑃(𝐵 ∩ 𝐶) − 𝑃(𝐴 ∩ 𝐵) − 𝑃(𝐴 ∩ 𝐶) + 𝑃(𝐴 ∪ 𝐵 ∪ 𝐶). c) b-kohdan todistuksen tavoin. d) yleinen tapaus todistettaisiin vastaavasti induktiolla.∎ Kun tapaukset A ja B ovat erilliset eli toisensa poissulkevat, Lauseen 3.9 d-kohta yksinkertaistuu muotoon 𝑃(⋃ 𝐴𝑖 𝑛 𝑖=1 ) = ∑ 𝑃(𝐴𝑖) 𝑛 𝑖=1 , joka on itse asiassa Lauseen 3.4 a-kohdan tulos eli toisensa poissulkevien tapausten yhteenlaskusääntö eli nk. summakaava. 3.3.2 Ehdollinen todennäköisyys ja kertolaskusääntö Ehdolliseen todennäköisyyteen liittyvästä ongelmasta on kyse silloin, kun halutaan laskea jonkin tapauksen A todennäköisyys silloin, kun tapaus B on jo sattunut. Ehdollista todennäköisyyttä merkitään P(A|B), jonka voi lukea esimerkiksi seuraavasti: "todennäköisyys, että A tapahtuu, kun B on tapahtunut". Ehdollinen todennäköisyys P(A|B) voidaan määritellä kahdella tavalla; joko A:n todennäköisyytenä supistetussa otosavaruudessa B tai alkuperäisen otosavaruuden  todennäköisyyksien avulla. Määritelmä 3.14a Jos P(B) > 0, niin ehdollinen todennäköisyys P(A|B) on tapauksen A todennäköisyys otosavaruudessa B. Määritelmä 3.14b Jos P(B) > 0, niin ehdollinen todennäköisyys P(A|B) on 𝑃(𝐴|𝐵) = 𝑃(𝐴 ∩ 𝐵) 𝑃(𝐵) . Jälkimmäisen määrittelytavan avulla voidaan johtaa seuraavaksi esiteltävät ehdolliseen todennäköisyyteen liittyvät tulokset. 26 Lause 3.10 (Kertolaskusääntö) Tapausten A ja B leikkauksen todennäköisyys toteuttaa kaavat 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴|𝐵)𝑃(𝐵) ja 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵|𝐴)𝑃(𝐴). Todistus. Leikkauksen todennäköisyys saadaan ratkaisemalla ehdollisen todennäköisyyden P(A|B) kaavasta leikkauksen P(A∩B) todennäköisyys. Vastaavasti leikkauksen P(A∩B) todennäköisyys saadaan myös ratkaistua ehdollisen todennäköisyyden P(B|A) kaavasta seuraavasti 𝑃(𝐵|𝐴) = 𝑃(𝐴 ∩ 𝐵) 𝑃(𝐴) , jos 𝑃(𝐴) > 0 jolloin 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵|𝐴)𝑃(𝐴). ∎ Seuraavaksi esiteltävät Määritelmä 3.15, Lause 3.11 ja Lause 3.12 eivät yleensä kuulu lukion pitkän matematiikan Tilastot ja todennäköisyys -opintojakson sisältöön. Ne ovat kuitenkin ehdollisen todennäköisyyden yleistyksiä, joiden tunteminen lisää aihepiirin soveltamisen mahdollisuuksia opetusta ylöspäin eriyttäessä. Lauseiden tuntemista tarvitaan myös yhdessä opiskelijamateriaalin harjoituksessa, minkä vuoksi niihin tutustuminen on tässä yhteydessä oleellista. Määritelmä 3.15 Tapaukset 𝐴1, … , 𝐴𝑛 muodostavat otosavaruuden  osituksen, jos tapaukset ovat  toisensa poissulkevat   = ⋃ 𝐴𝑖 𝑛 𝑖=1 ja  𝑃(𝐴𝑖) > 0 𝑘𝑎𝑖𝑘𝑖𝑙𝑙𝑎 𝑖. Lause 3.11 (Kokonaistodennäköisyyslause) Jos tapaukset 𝐴1, … , 𝐴𝑛 muodostavat otosavaruuden osituksen, niin 𝑃(𝐵) =∑𝑃(𝐵|𝐴𝑖) 𝑃(𝐴𝑖) 𝑛 𝑖=1 . 27 Todistus. Osituksen määritelmää (Määritelmä 3.15) ja summakaavaa (Lause 3.4 a) apuna käyttäen saadaan: 𝑃(𝐵) = 𝑃(𝐵 ∩) = P(𝐵 ∩ (⋃ 𝐴𝑖 𝑛 𝑖=1 )) = 𝑃(⋃ (𝐵 ∩𝑛𝑖=1 𝐴𝑖)) = ∑ 𝑃(𝐵 ∩ 𝐴𝑖) 𝑛 𝑖=1 = ∑ 𝑃(𝐵|𝐴𝑖) 𝑃(𝐴𝑖) 𝑛 𝑖=1 . ∎ Lauseen 2.11 kokonaistodennäköisyyskaavalla kokonaistodennäköisyys P(B) saadaan koottua ehdollisista todennäköisyyksistä painottamalla kutakin itse ehdon todennäköisyydellä. Keksijänsä mukaan nimetty, 1700-luvulla eläneen matemaatikon Thomas Bayesin keksimä kaava on usein hyödyllinen ehdollisia todennäköisyyksiä laskettaessa. Lause 3.12 (Bayesin lause) Jos tapaukset 𝐴1, … , 𝐴𝑛 muodostavat otosavaruuden osituksen ja 𝑃(𝐵) > 0 𝑃(𝐴|𝐵) = 𝑃(𝐵|𝐴𝑘) 𝑃(𝐴𝑘) 𝑃(𝐵) = 𝑃(𝐵|𝐴𝑘) 𝑃(𝐴𝑘) ∑ 𝑃(𝐵|𝐴𝑖) 𝑃(𝐴𝑖) 𝑛 𝑖=1 , 𝑘 = 1,… , 𝑛. Todistus. Ehdollisen todennäköisyyden määritelmästä (Määritelmä 3.14 b) ja Lauseesta 3.10 seuraa 𝑃(𝐴|𝐵) = 𝑃(𝐵 ∩ 𝐴𝑘) 𝑃(𝐵) = 𝑃(𝐵|𝐴𝑘) 𝑃(𝐴𝑘) 𝑃(𝐵) . Koska tapaukset muodostavat otosavaruuden osituksen, niin kokonaistodennäköisyyslauseen (Lause 3.11) mukaan P(B) voidaan koota ehdollisista todennäköisyyksistä P(B |𝐴𝑖) painottamalla kutakin ehdollista todennäköisyyttä ehdon todennäköisyydellä P(𝐴𝑖). Siis 𝑃(𝐴|𝐵) = 𝑃(𝐵|𝐴𝑘) 𝑃(𝐴𝑘) 𝑃(𝐵) = 𝑃(𝐵|𝐴𝑘) 𝑃(𝐴𝑘) ∑ 𝑃(𝐵|𝐴𝑖) 𝑃(𝐴𝑖) 𝑛 𝑖=1 . ∎ Monessa todennäköisyyslaskennan tehtävän ratkaisussa voidaan käyttää luontevasti apuna ns. puukaavioita (Kuva 3.2), joilla havainnollistetaan satunnaisilmiön vaihtoehtoisia tapahtumajonoja. 28 Puu koostuu oksista ja niiden haarautumiskohdista eli pisteistä. Puun piste kuvaa tapausta 𝐴𝑖 , 𝑖 = 1, 2, … , 𝑘, 𝑘 ∈ Z+ ja siitä lähtevät oksat tapahtumavaihtoehtoja, jotka ovat mahdollisia aiemmin tapahtuneen tapauksen jälkeen. Oksan viereen kirjataan myös kyseisen tapahtumavaihtoehdon todennäköisyys 𝑝𝑖 , 𝑖 = 1, 2, … , 𝑘, 𝑘 ∈ Z+. Mistä tahansa puun pisteestä lähtevien oksien todennäköisyyksien summa on 1. Tavallisesti puu piirretään ylösalaisin (alkupiste ylhäällä, loppupisteet alhaalla) tai horisontaalisesti (alkupiste vasemmalla, loppupisteet oikealla). Mielivaltaisen puun pisteen todennäköisyys saadaan laskemalla alkupisteestä kyseiseen pisteeseen vievän reitin todennäköisyys. Reitti on tapahtumajono, joka sattuu, jos jokainen jonon tapahtumista sattuu, joten reitin todennäköisyys saadaan tulosääntöä (Lause 3.5) puun oksiin soveltamalla. Koska puun eri pisteisiin vievät reitit ovat toisensa poissulkevia, niin useista puun pisteistä yhdistetyn tapahtuman todennäköisyys saadaan yhteenlaskusääntöä (Lause 3.4 a) käyttäen. Kuva 3.2. Puukaavio. 3.3.3 Riippumattomuus Yleisesti ehdollinen todennäköisyys P(A|B) riippuu tapauksesta B, jolloin P(A|B) on eri kuin P(A). Toisinaan kuitenkin P(A|B)=P(A), jolloin sanotaan tapauksen A olevan riippumaton tapauksesta B. Jos P(A|B)=P(A), niin tällöin myös P(B|A)=P(B) eli tapaus B on myös riippumaton tapauksesta A, sillä jos 𝑃(𝐴|𝐵) = 𝑃(𝐴), niin 𝑃(𝐵|𝐴) = 𝑃(𝐴 ∩ 𝐵) 𝑃(𝐴) = 𝑃(𝐴|𝐵)𝑃(𝐵) 𝑃(𝐴) = 𝑃(𝐴)𝑃(𝐵) 𝑃(𝐴) = 𝑃(𝐵). Sanotaan siis, että jos P(A|B)=P(A), niin tapaukset A ja B ovat riippumattomat. Kaava P(A|B)=P(A) voitaisiin ottaa riippumattomuuden määritelmäksi, mutta yleisesti käytetään määritelmää 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵), joka on aiemmin mainitun kanssa ekvivalentti, sillä jos 𝑃(𝐴|𝐵) = 𝑃(𝐴), niin 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴|𝐵)𝑃(𝐵) = 𝑃(𝐴)𝑃(𝐵), ja jos 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵), niin 29 𝑃(𝐴|𝐵) = 𝑃(𝐴 ∩ 𝐵) 𝑃(𝐵) = 𝑃(𝐴)𝑃(𝐵) 𝑃(𝐵) = 𝑃(𝐴). Määritelmä 3.16 Tapaukset A ja B ovat riippumattomat, jos 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵). Jos tapaukset eivät ole riippumattomat, ne ovat riippuvat. Tapausten A ja B riippumattomuutta voidaan merkitä 𝐴 𝐵. Lause 3.13 Jos tapaukset A ja B ovat riippumattomat, niin riippumattomia ovat myös tapaukset A ja 𝐵𝐶 , 𝐴𝐶 ja 𝐵 sekä 𝐴𝐶 ja 𝐵𝐶 . 𝑇𝑜𝑑𝑖𝑠𝑡𝑢𝑠. i. Koska 𝐴 = (𝐴 ∩ 𝐵𝐶) ∪ (𝐴 ∩ 𝐵), niin Lauseen 3.3 b-kohdan nojalla 𝑃(𝐴) = 𝑃(𝐴 ∩ 𝐵𝐶) + 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴 ∩ 𝐵𝐶) + 𝑃(𝐴)𝑃(𝐵). Täten 𝑃(𝐴 ∩ 𝐵𝐶) = 𝑃(𝐴)(1 − 𝑃(𝐵)) = 𝑃(𝐴) ∙ 𝑃(𝐵𝐶) eli tapaukset A ja BC ovat riippumattomat. ii. Vastaavasti, koska 𝐵 = (𝐵 ∩ 𝐴𝐶) ∪ (𝐵 ∩ 𝐴), niin Lauseen 3.3 b-kohdan nojalla 𝑃(𝐵) = 𝑃(𝐵 ∩ 𝐴𝐶) + 𝑃(𝐵 ∩ 𝐴) = 𝑃(𝐵 ∩ 𝐴𝐶) + 𝑃(𝐵)𝑃(𝐴). Nyt 𝑃(𝐵 ∩ 𝐴𝐶) = 𝑃(𝐵)(1 − 𝑃(𝐴)) = 𝑃(𝐵) ∙ 𝑃(𝐴𝐶) eli tapaukset AC ja B ovat myös riippumattomat. iii. Samalla lailla, koska 𝐴𝐶 = (𝐴𝐶 ∩ 𝐵) ∪ (𝐴𝐶 ∩ 𝐵𝐶), niin Lauseen 3.3 b-kohdan nojalla 𝑃(𝐴𝐶) = 𝑃(𝐴𝐶 ∩ 𝐵) + 𝑃(𝐴𝐶 ∩ 𝐵𝐶) ja koska ii-kohdan nojalla 𝐴𝐶 𝐵, niin = 𝑃(𝐴𝐶)𝑃(𝐵) + 𝑃(𝐴𝐶 ∩ 𝐵𝐶). Siis 𝑃(𝐴𝐶 ∩ 𝐵𝐶) = 𝑃(𝐴𝐶)(1 − 𝑃(𝐵)) = 𝑃(𝐴𝐶) ∙ 𝑃(𝐵𝐶) eli tapaukset 𝐴𝐶 ja BC ovat riippumattomat.∎ Kahden tapauksen riippumattomuus voidaan yleistää myös usean tapauksen riippumattomuudeksi. Määritelmä 3.17 Tapaukset 𝐴𝑖 , 𝑖 = 1,… , 𝑛, ovat riippumattomat, jos seuraavat ehdot toteutuvat: 𝑃(𝐴𝑖 ∩ 𝐴𝑗) = 𝑃(𝐴𝑖)𝑃(𝐴𝑗) kaikilla 𝑖 ≠ 𝑗, 𝑃(𝐴𝑖 ∩ 𝐴𝑗 ∩ 𝐴𝑘) = 𝑃(𝐴𝑖)𝑃(𝐴𝑗)𝑃(𝐴𝑘) kaikilla erisuurilla i, j ja k. 30 ⋮ 𝑃(𝐴𝑖 ∩ 𝐴𝑗 ∩…∩ 𝐴𝑛) = 𝑃(𝐴𝑖)𝑃(𝐴𝑗)⋯𝑃(𝐴𝑛). Huomautus 3.2 Kertolaskusääntö (Lause 3.9) yksinkertaistuu siis riippumattomille tapauksille muotoon 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵), mikä on myös riippumattomuuden määritelmä. Kaavasta 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵) käytetään usein nimityksiä riippumattomien tapahtumien kertolaskusääntö, kertolaskukaava ja (kahden tapauksen) tulokaava. Tätä kaavaa sekä useamman tapauksen riippumattomuuden kaavoja voidaan käyttää leikkausten todennäköisyyksien laskemiseen, jos tiedetään satunnaiskokeen tapahtumien olevan toisistaan riippumattomia. Riippumattomuuden määritelmien (Määritelmät 3.16 ja 3.17) avulla voidaan myös testata, ovatko annetut tapaukset riippumattomat. Lause 3.14 (Tulokaava l. yleinen riippumattomien tapausten kertolaskusääntö) Jos tapaukset 𝐴𝑖 , 𝑖 = 1,… , 𝑛, ovat riippumattomat, niin a) 𝑃(⋂ 𝐴𝑖 𝑛 𝑖=1 ) = ∏ 𝑃(𝐴𝑖) 𝑛 𝑖=1 . b) 𝑃(⋃ 𝐴𝑖 𝑛 𝑖=1 ) = 1 − ∏ 𝑃(𝐴𝑖 𝐶)𝑛𝑖=1 . Todistus. a) Saadaan suoraan usean tapauksen riippumattomuuden määritelmästä. b) Oletetaan, että tapaukset 𝐴𝑖 , 𝑖 = 1,… , 𝑛, ovat riippumattomat. Tällöin 𝑃(⋃ 𝐴𝑖 𝑛 𝑖=1 ) = 1 − 𝑃[(⋃ 𝐴𝑖 𝑛 𝑖=1 ) 𝐶] = 1 − 𝑃(⋂ 𝐴𝑖 𝐶𝑛 𝑖=1 ) =⏞ 𝐿𝑎𝑢𝑠𝑒 3.13 1 − ∏ 𝑃(𝐴𝑖 𝐶)𝑛𝑖=1 . ∎ 3.3.4 Toistokoe Yhdistettyä satunnaiskoetta, jossa täsmälleen samaa koetta toistetaan n kertaa ja seurataan onnistuneiden kokeiden lukumäärää, kutsutaan toistokokeeksi. Toistokokeessa tuloksen X esiintymistodennäköisyys p on jokaisella toistolla sama ja riippumaton aiempien kierrosten tuloksista. Tarkastellaan seuraavaksi toistokokeen todennäköisyyttä (binomitodennäköisyyttä) eli sitä, millä todennäköisyydellä n-vaiheisessa toistokokeessa tapahtuma X toteutuu tasan k kertaa. 31 Lause 3.15 (Binomitodennäköisyys) Koe toistetaan riippumattomasti n kertaa. Kukin koe onnistuu todennäköisyydellä p; merkitään epäonnistumisen todennäköisyyttä 𝑞 = 1 − 𝑝. Olkoon X onnistuneiden kokeiden lukumäärä. Tällöin k onnistumista saadaan todennäköisyydellä 𝑃(𝑋 = 𝑘) = ( 𝑛 𝑘 )𝑝𝑘𝑞𝑛−𝑘, 𝑘 = 0, 1, 2, … , 𝑛. Todistus. Merkitään onnistunutta koetta kirjaimella O ja epäonnistunutta koetta kirjaimella E. Yksi sellainen koesarja, jossa on 𝑘 onnistunutta ja 𝑛 − 𝑘 epäonnistunutta koetta on (𝑂, 𝑂,… , 𝑂, 𝐸, 𝐸,… , 𝐸), missä onnistuneita kokeita O on k kappaletta ja epäonnistuneita kokeita E 𝑛 − 𝑘 kappaletta. Koska kokeet ovat toisistaan riippumattomia, niin kyseisen koesarjan todennäköisyys on 𝑝𝑘𝑞𝑛−𝑘. Binomikertoimen järjestystulkinnan (Huomautus 3.1 a) mukaan symbolit O ja E voidaan järjestää jonoon (𝑛𝑘) eri tavalla. Koska kunkin koesarjan todennäköisyys on 𝑝𝑘𝑞𝑛−𝑘 ja koesarjat ovat toisensa poissulkevat, niin 𝑃(𝑋 = 𝑘) = (𝑛𝑘)𝑝 𝑘𝑞𝑛−𝑘. ∎ 3.4 Todennäköisyysjakauma Luvussa 2 kerrottiin tilastoyksikköön liitetyistä ominaisuuksista ja tilastojakaumien tunnusluvuista. Tässä alaluvussa tutustutaan vastaavasti todennäköisyyslaskennassa tutkittavien satunnaismuuttujien ominaisuuksiin ja tutkitaan todennäköisyyden jakautumista tapahtuman eri vaihtoehtojen kesken sekä esitellään todennäköisyysjakaumia kuvaavia tunnuslukuja. 3.4.1 Satunnaismuuttuja Satunnaismuuttuja on funktio, jonka arvot määrää jokin satunnaisilmiö. Funktion määrittelyjoukko on satunnaisilmiön alkeistapausten joukko ja sen arvot ovat reaalilukuja. Määritelmä 3.18 Satunnaismuuttuja X otosavaruudessa  on funktio 𝑋:  → . Satunnaismuuttuja-funktio siis liittää jokaiseen satunnaisilmiön alkeistapaukseen jonkin reaaliluvun, satunnaismuuttujan arvon. Määritelmä 3.19 Satunnaismuuttuja X on diskreetti, jos se voi saada vain äärellisen tai numeroituvasti äärettömän määrän arvoja. Diskreetin satunnaismuuttujan saamat arvot 𝑥1, 𝑥2, … ovat siis erillisiä ja ne voidaan täten luetella. Esimerkiksi 'COVID19-tartuntatapausten lukumäärä Suomessa' on diskreetti satunnaismuuttuja, joka saa yksittäisen (kokonaisluku)arvon joka kuukausi. Moni suure, kuten 'potilaan jonotusaika 32 päivystyksessä', voi kuitenkin saada periaatteessa minkä tahansa arvon tietyltä reaalilukuväliltä. Näiden suureiden mallintamisessa käytetään jatkuvia satunnaismuuttujia. Määritelmä 3.20 Satunnaismuuttuja X on jatkuva, jos se voi saada ylinumeroituvan määrän arvoja: tyypillisesti minkä tahansa arvon joltain reaalilukuväliltä. Määritelmä 3.20 on lukion opintojaksolla riittävän tarkka määritelmä jatkuvalle satunnaismuuttujalle. Luvussa 3.4.3 esitellään myös matemaattisempi määrittely (Määritelmä 3.28) jatkuvalle satunnaismuuttujalle niin kutsutun tiheysfunktion avulla. Satunnaismuuttujan (todennäköisyys)jakauma sisältää satunnaismuuttujan arvot ja niiden todennäköisyydet. Kuten tilastoyksiköiden tilastollisilla muuttujilla, myös satunnaismuuttujilla jakauma ilmaisee, kuinka yleisiä satunnaismuuttujan eri arvot ovat. Diskreetin satunnaismuuttujan jakauma voidaan usein esittää taulukkomuodossa. Eri arvojen todennäköisyydet muodostavat kyseisen muuttujan todennäköisyysjakauman, jota voidaan havainnollistaa esimerkiksi pylväsdiagrammilla. Jatkuvan satunnaismuuttujan X arvot muodostavat jonkin reaaliakselin välin, joka sisältää äärettömän määrän lukuja. Tämän vuoksi jatkuvan satunnaismuuttujan jakauman esittäminen taulukossa ei ole luontevaa, vaan jakauma esitetään yleensä satunnaismuuttujan tiheysfunktion avulla. Tähän palataan luvussa 3.4.5. 3.4.2 Diskreetin satunnaismuuttujan todennäköisyys- ja jakaumafunktio Merkitään diskreetin satunnaismuuttujan saamien arvojen joukkoa kirjaimella K. Diskreeteillä satunnaismuuttujilla muotoa 𝑃(𝑋 = 𝑘), 𝑘 ∈ 𝐾, olevat todennäköisyydet ovat tärkeimpiä ja näille todennäköisyyksille määritelään oma funktionsa: Määritelmä 3.21 Diskreetin satunnaismuuttujan X todennäköisyysfunktio on 𝑝(𝑘) = 𝑃(𝑋 = 𝑘), 𝑘 ∈ 𝐾. Todennäköisyysfunktiosta käytetään yleisesti myös nimityksiä pistetodennäköisyysfunktio ja tiheysfunktio. Todennäköisyyden ominaisuuksien mukaisesti todennäköisyysfunktiolle 𝑝(𝑘) 0 ≤ 𝑝(𝑘) ≤ 1, 𝑘 ∈ 𝐾 (Lause 3.3 e) ja koska diskreetin satunnaismuuttujan X saamat arvot k ovat toisensa poissulkevia tapauksia, niin ∑ 𝑝(𝑘) = 1𝑘∈𝐾 (Lause 3.4 b). Todennäköisyyslaskennassa ollaan usein kiinnostuneita todennäköisyyksistä, jotka ovat muotoa 𝑃(𝑋 ≤ 𝑎), 𝑃(𝑋 > 𝑎) ja 𝑃(𝑎 < 𝑋 ≤ 𝑏). Muotoa 𝑃(𝑋 ≤ 𝑎) olevat todennäköisyydet ovat keskeisiä, sillä kaikki muut muodot voidaan ilmaista muotoa 𝑃(𝑋 ≤ 𝑎) olevien todennäköisyyksien avulla seuraavasti: 𝑃(𝑋 > 𝑎) = 1 − 𝑃(𝑋 ≤ 𝑎) ja 33 jos 𝑎 < 𝑏, niin 𝑃(𝑋 ≤ 𝑏) = 𝑃(𝑋 ≤ 𝑎) + 𝑃(𝑎 < 𝑋 ≤ 𝑏), joten 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑋 ≤ 𝑏) − 𝑃(𝑋 ≤ 𝑎). Todennäköisyyden 𝑃(𝑋 ≤ 𝑎) keskeisyyden vuoksi sille on määritelty oma funktio, joka kertoo millä todennäköisyydellä satunaismuuttujan X arvo on pienempi tai yhtä suuri kuin jokin reaaliluku x. Määritelmä 3.22 Satunnaismuuttujan X jakaumafunktio on 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥), 𝑥 ∈ . Jakaumafunktiosta käytetään myös nimityksiä kumulatiivinen jakaumafunktio ja kertymäfunktio. Sekä diskreetin että jatkuvan satunnaismuuttujan jakaumafunktio on ei-negatiivinen ja kasvava funktio, jonka arvojoukko on suljettu väli [0,1] eli 0 ≤ 𝐹(𝑥) ≤ 1, 𝑥 ∈ . Lisäksi diskreetin satunnaismuuttujan jakaumafunktiolla F(x) on seuraavat ominaisuudet:  𝐹(𝑥) on oikealta jatkuva porrasfunktio,  lim 𝑥→∞ 𝐹(𝑥) = 1,  lim 𝑥→−∞ 𝐹(𝑥) = 0. Todennäköisyysfunktiosta saadaan jakaumafunktio ja jakaumafunktiosta todennäköisyysfunktio seuraavasti: 𝐹(𝑥) = ∑ 𝑝(𝑘),𝑘≤𝑥 𝑝(𝑘) = 𝐹(𝑘) − 𝐹(𝑘 − 1). Huomautus 3.3 Todennäköisyysfunktio 𝑝(𝑘) määritellään vain pisteissä 𝑘 ∈ 𝐾, kun taas jakaumafunktio 𝐹(𝑥) kaikilla 𝑥 ∈ . 3.4.3 Diskreetin jakauman tunnusluvut Tilastomuuttujan jakauman informaation tiivistämisessä käytettiin tilastollisia tunnuslukuja, kuten moodia ja aritmeettista keskiarvoa. Vastaavasti satunnaismuuttujan jakauman tietoa tiivistetään tunnusluvuin, joista keskeisimpiä ovat odotusarvo, keskihajonta ja varianssi. Jos lasketaan sellainen satunnaiskokeen tulosten painotettu keskiarvo, jossa kunkin tuloksen painona on vastaavan tapauksen todennäköisyys, niin saatua arvoa sanotaan koetuloksen odotusarvoksi E(X). Merkinnän E(X) käyttö juontaa juurensa englannin kielen sanoihin "odotus" expectation ja "odotusarvo" expected value. 34 Määritelmä 3.23 Diskreetin satunnaismuuttujan X odotusarvo on 𝐸(𝑋) = ∑ 𝑘 𝑝(𝑘)𝑘∈𝐾 , jos ∑ |𝑘|𝑝(𝑘) < ∞.𝑘∈𝐾 Odotusarvon määritelmässä siis vaaditaan summan ∑ |𝑘|𝑝(𝑘)𝑘∈𝐾 suppenemista itseisesti, jotta summan termit voidaan laskea yhteen missä järjestyksessä tahansa samaan tulokseen päätyen. Jos nimittäin summa ∑ |𝑘|𝑝(𝑘)𝑘∈𝐾 ei suppenisi itseisesti, se voisi saada erilaisia arvoja riippuen siitä, missä järjestyksessä termit lasketaan yhteen. Näin ollen, jotta odotusarvo olisi hyvin määritelty, vaaditaan että summa suppenee itseisesti. Jos näin ei toisaalta ole, niin sanotaan, että odotusarvoa ei ole olemassa. Jos diskreetin satunnaismuuttujan X arvojoukko K on äärellinen, niin myös odotusarvo E(X) on äärellinen, kun taas arvojoukon ollessa numeroituvasti ääretön, voi odotusarvon määritelmä antaa äärettömän tuloksen. Lukion opintojaksolla esitellään Määritelmän 3.23 sijaan seuraava diskreetin satunnaismuuttujan X odotusarvolle yksinkertaisempi määritelmä: Määritelmä 3.24 Olkoot diskreetin satunnaismuuttujan X saamat arvot 𝑥1, 𝑥2, … , 𝑥𝑘 ja näiden pistetodennäköisyydet 𝑝𝑖 = 𝑃(𝑋 = 𝑥𝑖), 𝑖 = 1,… , 𝑛. Tällöin satunnaismuuttujan X odotusarvo on 𝐸(𝑋) = 𝑝1𝑥1 + 𝑝2𝑥2 +⋯+ 𝑝𝑘𝑥𝑘 =∑𝑝𝑖𝑥𝑖 𝑘 𝑖=1 . Odotusarvolle käytetään usein myös merkintää 𝜇, jota käytettiin myös tilastoaineiston keskiarvosta. Itse asiassa satunnaismuuttujan odotusarvon kaava (Määritelmä 3.24) on sama kuin frekvenssijakauman keskiarvon kaava (Määritelmä 2.19), nimittäin: 𝜇 =∑𝑝𝑖𝑥𝑖 𝑘 𝑖=1 =∑ 𝑓𝑖 𝑛 𝑥𝑖 𝑘 𝑖=1 = 1 𝑛 ∑𝑓𝑖𝑥𝑖 . 𝑘 𝑖=1 Jos satunnaiskoetta toistetaan useita kertoja, niin koetulosten keskiarvo on lähellä odotusarvoa. Satunnaismuuttujan odotusarvo siis kuvaa sen arvojen keskiarvoa, kun koetta toistetaan useita kertoja. Kun halutaan puolestaan kuvata satunnaismuuttujan arvojen vaihtelua, tutkitaan todennäköisyysjakauman varianssia 𝐷2(𝑋) ja keskihajontaa 𝐷(𝑋). Mitä lähempänä nollaa keskihajonta ja varianssi ovat, sitä todennäköisempää on, että satunnaismuuttujan arvo on lähellä odotusarvoa. Merkintöjen 𝐷(𝑋) ja 𝐷2(𝑋) taustalla on englannin kielen sana deviation, joka 35 tarkoittaa poikkeamaa, hajontaa. Satunnaismuuttujan X varianssista käytetään yleisesti myös merkintöjä Var(X) ja 𝜎2, ja keskihajonnasta merkintää 𝜎. Määritelmä 3.25 (Varianssi ja keskihajonta) Olkoot diskreetin satunnaismuuttujan X saamat arvot 𝑥1, 𝑥2, … , 𝑥𝑘 ja näiden pistetodennäköisyydet 𝑝𝑖 = 𝑃(𝑋 = 𝑥𝑖), 𝑖 = 1,… , 𝑛. Tällöin satunnaismuuttujan X varianssi on 𝐷2(𝑋) = 𝑝1(𝑥1 − 𝜇) 2 +⋯+ 𝑝𝑘(𝑥𝑘 − 𝜇) 2 =∑𝑝𝑖(𝑥𝑖 − 𝜇) 2 = 𝐸[(𝑋 − 𝜇)2]. 𝑘 𝑖=1 Josta saadaan ratkaistua satunnaismuuttujan X keskihajonta: 𝐷(𝑋) = √Var(𝑋). Määritelmän kaavaa ei itse asiassa todennäköisyyslaskennassa juuri koskaan käytetä, sillä varianssi saadaan mukavammin laskettua kaavoista 𝐷2(𝑋) = 𝐸(𝑋2) − 𝜇2 ja 𝐷2(𝑋) = 𝐸[𝑋(𝑋 − 1)] + 𝜇 − 𝜇2. Näiden kaavojen ymmärrys vaatisi kuitenkin satunnaismuuttujan X funktion g(X) odotusarvon 𝐸[𝑔(𝑋)] sekä sen muunnosten 𝐸[𝑔(𝑋)] ja 𝐸[𝑔(𝑋)] johtamisen, minkä vuoksi lukion opintojaksolla määritelmän 3.25 kaavan tuntemus riittää. 3.4.4 Joitakin diskreettejä jakaumia Luvussa 3.3.4 kerrottiin toistokokeesta ja siihen liittyvästä binomitodennäköisyydestä (Lause 3.15). Yksi tärkeimmistä diskreeteistä jakaumista on juuri toistokokeeseen liittyvä binomijakauma. Määritelmä 3.26 Merkitään yksittäisen kokeen onnistumistodennäköisyyttä kirjaimella p, epäonnistumisen todennäköisyyttä kirjaimella 𝑞 = 1 − 𝑝 ja kokeen toistojen määrää kirjaimella n. Jos satunnaismuuttujan X pistetodennäköisyydet ovat 𝑃(𝑋 = 𝑘) = (𝑛𝑘)𝑝 𝑘𝑞𝑛−𝑘, jossa 𝑘 = 0, 1, 2,… , 𝑛, niin sanotaan satunnaismuuttujan X noudattavan binomijakaumaa parametreilla n ja p: merkitään 𝑋 ~ Bin(𝑛, 𝑝). Kuva 3.3 Eräiden binomijakaumien pistetodennäköisyydet koordinaatistossa. 36 Lause 3.16 (Binomijakauman odotusarvo) Oletetaan, että 𝑋 ~ Bin(𝑛, 𝑝). Tällöin satunnaismuuttujan X odotusarvo on 𝐸(𝑋) = 𝑛 𝑝. Todistus. Lasketaan odotusarvo määritelmän 3.24 mukaisesti: 𝐸(𝑋) = ∑ 𝑘(𝑛𝑘)𝑝 𝑘𝑞𝑛−𝑘𝑛𝑘=0 = ∑ 𝑘 𝑛! 𝑘!(𝑛−𝑘)! 𝑝𝑘𝑞𝑛−𝑘𝑛𝑘=1 = 𝑛 𝑝 ∑ (𝑛−1)! (𝑘−1)!(𝑛−𝑘)! 𝑝𝑘−1𝑞𝑛−𝑘𝑛𝑘=1 = 𝑛 𝑝∑ (𝑛−1𝑘−1)𝑝 𝑘−1𝑞𝑛−𝑘𝑛𝑘=1 = 𝑛 𝑝 ∑ (𝑛−1𝑘 )𝑝 𝑘𝑞(𝑛−1)−𝑘𝑛−1𝑘=0 =⏞ 𝐵𝑖𝑛𝑜𝑚𝑖𝑘𝑎𝑎𝑣𝑎 𝑛 𝑝(𝑝 + 𝑞)𝑛−1. ∎ Lause 3.17 (Binomijakauman varianssi ja keskihajonta) Oletetaan, että 𝑋 ~ Bin(𝑛, 𝑝). Tällöin satunnaismuuttujan X varianssi on 𝐷2(𝑋) = 𝑛 𝑝 𝑞, josta saadaan satunnaismuuttujan X keskihajonta: 𝐷(𝑋) = √𝑛 𝑝 𝑞. Todistus. Satunnaismuuttujan X varianssi voidaan laskea kaavalla 𝐷2(𝑋) = 𝐸[𝑋(𝑋 − 1)] + 𝜇 − 𝜇2 eli 𝐷2(𝑋) = ∑ 𝑘(𝑘 − 1)𝑝(𝑘) + 𝜇 − 𝜇2𝑘∈𝐾 , jota ei tässä yhteydessä todisteta. Lasketaan odotusarvo: 𝐸[𝑋(𝑋 − 1)] = ∑ 𝑘(𝑘 − 1)(𝑛𝑘)𝑝 𝑘𝑞𝑛−𝑘𝑛𝑘=0 = ∑ 𝑘(𝑘 − 1) 𝑛! 𝑘!(𝑛−𝑘)! 𝑝𝑘𝑞𝑛−𝑘𝑛𝑘=2 = 𝑛(𝑛 − 1)𝑝2∑ (𝑛−2)! (𝑘−2)!(𝑛−𝑘)! 𝑝𝑘−2𝑞𝑛−𝑘𝑛𝑘=2 37 = 𝑛(𝑛 − 1)𝑝2∑ (𝑛−2𝑘−2)𝑝 𝑘−2𝑞𝑛−𝑘𝑛𝑘=2 = 𝑛(𝑛 − 1)𝑝2∑ (𝑛−2𝑘 )𝑝 𝑘𝑞(𝑛−2)−𝑘𝑛−2𝑘=0 = 𝑛(𝑛 − 1)𝑝2(𝑝 + 𝑞)𝑛−2 = 𝑛(𝑛 − 1)𝑝2. Näin ollen 𝐷2(𝑋) = 𝐸[𝑋(𝑋 − 1)] + 𝜇 − 𝜇2 =⏞ 𝐿𝑎𝑢𝑠𝑒 3.15 𝑛(𝑛 − 1)𝑝2 + 𝑛 𝑝 − (𝑛 𝑝)2 = 𝑛 𝑝 − 𝑛 𝑝2 = 𝑛 𝑝(1 − 𝑝) = 𝑛 𝑝 𝑞. Tästä saadaan satunnaismuuttujan X keskihajonnaksi 𝐷(𝑋) = √Var(𝑋) = √𝑛 𝑝 𝑞.∎ Diskreetti satunnaismuuttuja X voi saada myös äärettömän monta arvoa. Näin on esimerkiksi seuraavaksi esiteltävän Poissonin jakauman tapauksessa. Sanotaan että havaintojen lukumäärä tietyssä ajassa on Poisson-jakautunut parametrilla 𝜆, jos jokin ilmiö havaitaan keskimäärin 𝜆 kertaa kyseisessä ajassa ja havainnot ovat toisistaan riippumattomia. Poisson-jakauma (kuva 3.3) on binomijakauman ohella yksi sovelletuimmista diskreetin satunnaismuuttujan todennäköisyysjakaumista, mutta siitä huolimatta sitä ei kaikissa lukion todennäköisyyslaskennan oppikirjasarjoissa esitellä. Määritelmä 3.27 Jos satunnaismuuttujan X pistetodennäköisyydet ovat 𝑃(𝑋 = 𝑘) = 𝑒−𝜆 𝜆𝑘 𝑘! , jossa 𝑘 = 0, 1, 2, …, niin satunnaismuuttuja X noudattaa Poisson-jakaumaa parametrilla 𝜆; merkitään 𝑋 ~ Po(𝜆). Huomautus 3.4 Satunnaismuuttujan X todennäköisyysfunktio 𝑃(𝑋 = 𝑘) = 𝑒−𝜆 𝜆𝑘 𝑘! on todella todennäköisyysfunktio, sillä ∑ 𝑃(𝑋 = 𝑘)∞𝑘=0 = 𝑒 −𝜆∑ 𝜆𝑘 𝑘! =∞𝑘=0 𝑒 −𝜆𝑒𝜆 = 1. 38 Kuva 3.4 Poisson-jakauman pistetodennäköisyyksiä ja jakaumafunktio. Lause 3.18 (Poisson-jakauman odotusarvo, varianssi ja keskihajonta) Oletetaan, että 𝑋 ~ Po(𝜆). Tällöin 𝐸(𝑋) = 𝜆, 𝐷2(𝑋) = 𝜆 ja 𝐷(𝑋) = √𝜆. Todistus. Lasketaan odotusarvo 𝐸(𝑋): 𝐸(𝑋) = ∑ 𝑘𝑒−𝜆 𝜆𝑘 𝑘! = 𝜆∞𝑘=0 𝑒 −𝜆∑ 𝜆𝑘−1 (𝑘−1)! = 𝜆𝑒−𝜆∑ 𝜆𝑘 𝑘! = 𝜆∞𝑘=0 𝑒 −𝜆𝑒𝜆∞𝑘=1 = 𝜆. Jotta saadaan ratkaistua satunnaismuuttujan varianssi, lasketaan ensin odotusarvo 𝐸[𝑋(𝑋 − 1)]: 𝐸[𝑋(𝑋 − 1)] = ∑𝑘(𝑘 − 1)𝑒−𝜆 𝜆𝑘 𝑘! = 𝜆2 ∞ 𝑘=0 𝑒−𝜆∑ 𝜆𝑘−2 (𝑘 − 2)! ∞ 𝑘=2 = 𝜆2𝑒−𝜆∑ 𝜆𝑘 𝑘! = 𝜆2𝑒−𝜆𝑒𝜆 ∞ 𝑘=0 = 𝜆2. Lasketaan sitten satunnaismuuttujan X varianssi kaavalla 𝐷2(𝑋) = 𝐸[𝑋(𝑋 − 1)] + 𝜇 − 𝜇2: 𝐷2(𝑋) = 𝜆2 + 𝜆 − 𝜆2 = 𝜆. Tästä saadaan satunnaismuuttujan X keskihajonnaksi 𝐷(𝑋) = √Var(𝑋) = √𝜆.∎ 39 3.4.5 Jatkuvan satunnaismuuttujan jakauma- ja tiheysfunktio sekä todennäköisyyksien laskeminen Jatkuvan satunnaismuuttuja voi saada ylinumeroituvan määrän arvoja ja on nimensä mukaisesti jatkuvasti jakautunut eli sen jakaumafunktio 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥), 𝑥 ∈ , on jatkuva (vrt. diskreetin satunnaismuuttujan jakaumafunktio on porrasfunktio-tyyppinen, siis epäjatkuva; ks. kuva 3.5). Kuva 3.5 Vasemmalla diskreetin satunnaismuuttujan jakaumafunktio 𝐹(𝑥) ja oikealla jatkuvan satunnaismuuttujan jakaumafunktio 𝐹(𝑥), 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥), 𝑥 ∈ . Jatkuva satunnaismuuttuja määritellään kuitenkin ns. tiheysfunktion avulla: Määritelmä 3.28 Satunnaismuuttuja X on jatkuva, jos on olemassa sellainen ei-negatiivinen funktio f(x), että kaikille reaalilukujoukoille A on 𝑃(𝑋 ∈ 𝐴) = ∫ 𝑓(𝑥)𝑑𝑥 𝐴 . Funktio 𝑓 on satunnaismuuttujan X tiheysfunktio. Jatkuvan satunnaismuuttujan arvojen jakautumista ei voida kuvata pistetodennäköisyyksin p(k), kuten voitiin tehdä diskreetin satunaismuuttujan tapauksessa, sillä jatkuvasti jakautuneen satunnaismuuttujan yksittäisen arvon todennäköisyys on nolla; nimittäin 𝑃(𝑋 = 𝑥) = 0, sillä 𝑃(𝑥 ≤ 𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡 = 0 𝑥 𝑥 . Tämän vuoksi jatkuvan satunnaismuuttujan arvojen jakautumisen kuvaamisessa käytetään tiheysfunktiota. Jokainen tiheysfunktio on ei-negatiivinen (𝑓(𝑥) ≥ 0, 𝑥 ∈ ,) ja tiheysfunktion kuvaajan ja x- akselin väliin jäävän alueen pinta-ala on 1 (∫ 𝑓(𝑥)𝑑𝑥 = 1 ∞ −∞ ). Itse asiassa voidaan myös osoittaa, että jos jokin funktio 𝑓 toteuttaa kyseiset ehdot, niin on olemassa satunnaismuuttuja, jonka tiheysfunktio on 𝑓. Näin ollen nämä ehdot ovat välttämättömät ja riittävät ehdot sille, että funktio 𝑓 on tiheysfunktio. On hyvä huomata, että jatkuvan satunnaismuuttujan tiheysfunktio voi hyvin saada ykköstä suurempia arvoja ja että 𝑓(𝑥) ei ole sama kuin 𝑃(𝑋 = 𝑥). Vain tiheysfunktion määrätyillä integraaleilla on todennäköisyystulkinnat. 40 Lause 3.19 Jatkuvan satunnaismuuttujan jakauma- ja tiheysfunktioilla on seuraavat ominaisuudet: a) ∫ 𝑓(𝑥)𝑑𝑥 = 1. ∞ −∞ b) 𝐹(𝑥) = ∫ 𝑓(𝑡)𝑑𝑡. 𝑥 −∞ c) 𝑓(𝑥) = 𝐹′(𝑥) pisteissä x, joissa f(x) on jatkuva. Todistus. a) 𝑃[𝑋 ∈ (−∞,∞)] = 1 = ∫ 𝑓(𝑥)𝑑𝑥. ∞ −∞ b) 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡. 𝑥 −∞ c) Koska 𝐹(𝑥) = ∫ 𝑓(𝑡)𝑑𝑡 𝑥 −∞ , niin differentiaali- ja integraalilaskennan peruslauseen mukaan siitä seuraa, että 𝐹′(𝑥) = 𝑓(𝑥).∎ Jos siis tiheysfunktio on annettu, saadaan jakaumafunktio lauseen b-kohdan avulla. Tätä on havainnollistaa kuva 3.6. Jos taas jakaumafunktio on annettu, niin tiheysfunktio saadaan lauseen c-kohdan avulla; pisteissä, joissa 𝐹′(𝑥) ei ole olemassa, voidaan määritellä 𝑓(𝑥) = 0. Koska 𝑓(𝑥) = 𝐹′(𝑥), niin 𝑓(𝑥) ilmoittaa, kuinka voimakkaasti 𝐹(𝑥) kasvaa pisteessä x. Mitä voimakkaampi kasvu, sitä nopeammin todennäköisyyttä kertyy funktioon 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥), kun x kasvaa. Kuva 3.6 Todennäköisyyden laskeminen tiheysfunktion avulla; 𝐹(𝑥) = ∫ 𝑓(𝑡)𝑑𝑡. 𝑥 −∞ Lauseen 3.19 b-kohdasta nähdään, että jatkuvan satunnaismuuttujan jakaumafunktiolla on seuraavat ominaisuudet:  0 ≤ 𝐹(𝑥) ≤ 1, 𝑥 ∈ ,  𝐹(𝑥) on jatkuva, 41  𝐹(𝑥) on kasvava,  lim 𝑥→∞ 𝐹(𝑥) = 1 ja  lim 𝑥→−∞ 𝐹(𝑥) = 0. Sekä diskreetin että jatkuvan satunnaismuuttujan jakaumafunktion ominaisuudet ovat siis jatkuvuutta lukuun ottamatta samat. Jatkuvan satunnaismuuttujan todennäköisyyksiä voidaan laskea sekä jakauma- että tiheysfunktion avulla seuraavasti: Todennäköisyys F(x):n avulla f(x):n avulla 𝑃(𝑋 ≤ 𝑎) 𝐹(𝑎) ∫ 𝑓(𝑡)𝑑 𝑎 −∞ 𝑡. 𝑃(𝑋 > 𝑎) 1 − 𝐹(𝑎) ∫ 𝑓(𝑡)𝑑 ∞ 𝑎 𝑡. 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) 𝐹(𝑏) − 𝐹(𝑎) ∫ 𝑓(𝑡)𝑑 𝑏 𝑎 𝑡. Jos jakaumafunktio on käytettävissä, niin sitä kannattaa käyttää, sillä tällöin vältytään integroinnilta. Jos todennäköisyys lasketaan tiheysfunktion avulla, niin silloin tulee itse asiassa lasketuksi tiheysfunktion f ja tarkasteltavan x-akselin osan välisen alueen pinta-ala (ks. kuva 3.6). Kaavasta 𝑃(𝑋 = 𝑎) = 0 seuraa, että laskettaessa välien todennäköisyyksiä jatkuvalle satunnaismuuttujalle ei ole merkitystä, ovatko välin päätepisteet mukana vai eivät. Esimerkiksi 𝑃(𝑎 < 𝑋 < 𝑏) = 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏). 3.4.6 Jatkuvan jakauman tunnusluvut Diskreetin satunnaismuuttujan tapaan myös jatkuvalle satunnaismuuttujalle määritellään jakaumasta saatavaa tietoa tiivistäviä tunnuslukuja, joita ovat muun muassa seuraavaksi esiteltävät odotusarvo, keskihajonta ja varianssi. On hyvä huomata, että jatkuvan jakauman tunnusluvut ovat lukion todennäköisyyslaskennan opintojaksolla syventävää tietoa, joita kaikki oppikirjat eivät käsittele ollenkaan. Määritelmä 3.29 (Odotusarvo) Jatkuvan satunnaismuuttujan X odotusarvo on 𝐸(𝑋) = ∫ 𝑥 𝑓(𝑥)𝑑𝑥 ∞ −∞ , jos ∫ |𝑥| 𝑓(𝑥)𝑑𝑥 ∞ −∞ < ∞. 42 Diskreeteille satunnaismuuttujille esitetyt varianssin ja keskihajonnan määritelmät pätevät myös jatkuville satunnaismuuttujille: Määritelmä 3.30 (Varianssi ja keskihajonta) Jatkuvan satunnaismuuttujan X varianssi on 𝐷2(𝑋) = 𝐸[(𝑋 − 𝜇)2] = ∫ (𝑥 − 𝜇)2 𝑓(𝑥)𝑑𝑥 ∞ −∞ , josta saadaan ratkaistua satunnaismuuttujan X keskihajonta: 𝐷(𝑋) = √Var(𝑋) = √∫ (𝑥 − 𝜇)2 𝑓(𝑥)𝑑𝑥 ∞ −∞ . Odotusarvon määritys edellyttää siis tiheysfunktion 𝑓 tuntemista. Varianssin ja keskihajonnan määritys taas edellyttää, että sekä tiheysfunktio 𝑓 että odotusarvo 𝐸(𝑋) ovat tiedossa. Odotusarvo 𝐸(𝑋) = 𝜇 on kaikkein käytetyin satunnaismuuttujan sijaintia ilmaiseva tunnusluku, mutta sijaintia voidaan mitata muillakin tunnusluvuilla. Muistetaan Tilastot-luvusta, että tilastomuuttujille moodi on havaintoaineiston yleisin arvo eli arvo, jonka frekvenssi on suurin. Vastaavasti satunnaismuuttujille moodi on satunnaismuuttujan todennäköisin arvo. Toki jatkuvan satunnaismuuttujan yksittäisen arvon todennäköisyys on nolla, mutta tällöinkin moodin ympärillä on eniten ns. todennäköisyysmassaa. Määritelmä 3.31 (Moodi) Diskreetin satunnaismuuttujan moodi on se muuttujan k arvo (tai ne arvot), jossa (tai joissa) todennäköisyysfunktio 𝑝(𝑘) saa maksimiarvon. Jatkuvan satunnaismuuttujan moodi on se muuttujan x arvo (tai ne arvot), jossa (tai joissa) tiheysfunktio 𝑓 saa maksimiarvon. Tilastomuuttujilla arvojen keskimääräistä suuruutta kuvaa mediaani. Vastaavasti satunnaismuuttujilla mediaani jakaa populaation kahteen yhtä suureen osaan siten, että se ala- ja yläpuolella on yhtä paljon todennäköisyysmassaa. Määritelmä 3.32 (Mediaani) Diskreetin satunnaismuuttujan mediaani on se muuttujan k arvo (tai ne arvot), jossa (tai joissa) jakaumafunktio 𝐹 toteuttaa ehdon 𝐹(𝑘 − 1) ≤ 1 2 ≤ 𝐹(𝑘). Jatkuvan satunnaismuuttujan mediaani on se muuttujan x arvo (tai ne arvot), jossa (tai joissa) jakaumafunktio 𝐹 toteuttaa ehdon 𝐹(𝑥) = 1 2 . 3.4.7 Normaalijakauma ja tasainen jakauma Normaalijakauma on käytetyin ja sovelletuin jatkuva jakauma ja keskeinen osa lukion nykymuotoisen todennäköisyyslaskennan opintojakson ydinainesta. Esimerkiksi monet ilmiöt ja 43 niihin liittyvät satunnaismuuttujat luonnossa riippuvat useista satunnaistekijöistä ja noudattavat normaalijakaumaa. Normaalijakauma tunnetaan myös nimillä Gaussin jakauma ja Gaussin kellokäyrä, jotka ovat saaneet nimensä 1800-luvun alussa saksalaisen matemaatikko Karl Fridrich Gaussin mukaan ja joista jälkimmäinen kuvaa normaalisti jakautuneen satunnaismuuttujan tiheysfunktion kuvaajan symmetrisen kellomaista muotoa (Kuva 3.7). Normaalijakauma-nimen käyttö vakiintui, kun huomattiin monien havaintoaineistojen noudattavan Gaussin jakaumaa ja alettiin ajatella tämän olevan ikään kuin "normaali" havaintojen jakauma. Normaalijakaumaa käytetään kuvamaan ilmiöitä, joissa nk. todennäköisyysmassa keskittyy ilmiön keskialueen arvoihin ja määrittelyalueen ääripäiden arvot ovat harvinaisia. Lause 3.20 (Standardoitu normaalijakauma) Jos satunnaismuuttujan X tiheysfunktio on 𝜑(𝑥) = 1 √2𝜋 𝑒− 1 2𝑥 2 , −∞ < 𝑥 < ∞, niin sanotaan, että satunnaismuuttujalla X on standardoitu normaalijakauma; merkitään 𝑋~𝑁(0,1). Tällöin odotusarvo 𝐸(𝑋) = 0 ja varianssi 𝐷2(𝑋) = 1. Jakaumafunktiota merkitään Φ(𝑥) = 1 √2𝜋 ∫ 𝑒− 1 2𝑡 2 𝑑𝑡 𝑥 −∞ , −∞ < 𝑥 < ∞. On voimassa Φ(−𝑥) = 1 − Φ(𝑥). Todistus. Funktio 𝜑(𝑥) on todella tiheysfunktio sillä ∫ 𝜑(𝑥) ∞ −∞ 𝑑𝑥 = 1. Odotusarvoksi saadaan: 𝐸(𝑋) = 1 √2𝜋 ∫ 𝑥𝑒− 1 2𝑥 2 𝑑𝑥 ∞ −∞ = − 1 √2𝜋 /−∞ ∞ 𝑒− 1 2𝑥 2 = 0. Varianssiksi saadaan: 𝐷2(𝑋) = 𝐸(𝑋2) − 𝜇2 = 𝐸(𝑋2) = 1 √2𝜋 ∫ 𝑥2𝑒 − 1 2 𝑥2𝑑𝑥 ∞ −∞ , jossa 𝑢 = 𝑥, 𝑢′ = 1, 𝑣′ = 𝑥𝑒− 1 2 𝑥2 , 𝑣 = −𝑒− 1 2 𝑥2 = 1 √2𝜋 ∫ 𝑥𝑒− 1 2𝑥 2 ∞ −∞ 𝑑𝑥 ⏟ =0,koska 𝐸(𝑋)=0. + 1 √2𝜋 ∫ 𝑒− 1 2𝑥 2 𝑑𝑥 ∞ −∞⏟ =1,koska ∫ 𝜑(𝑥) ∞ −∞ 𝑑𝑥=1. = 1. 44 Todennäköisyys 𝑃(𝑋 ≤ −𝑥) = Φ(−𝑥) = 1 √2𝜋 ∫ 𝑒− 1 2𝑡 2 𝑑𝑡 −𝑥 −∞ , merkitään 𝑠 = −𝑡 = −1 √2𝜋 ∫ 𝑒− 1 2𝑠 2 𝑑𝑠 𝑥 ∞ = 1 √2𝜋 ∫ 𝑒− 1 2𝑠 2 𝑑𝑠 ∞ 𝑥 = 1 √2𝜋 ∫ 𝑒− 1 2𝑠 2 𝑑𝑠 − ∞ −∞ 1 √2𝜋 ∫ 𝑒− 1 2𝑠 2 𝑑𝑠 𝑥 −∞ = 1 −Φ(𝑥).∎ Standardoidun normaalijakauman eli standardinormaalijakauman jakaumafunktiota ei voida ilmaista alkeisfunktioiden avulla, minkä vuoksi jakaumafunktion (Kuva 3.7) arvoja on taulukoitu. Taulukoista saadaan yleensä todennäköisyyksiä Φ(𝑥) = 𝑃(𝑋 ≤ 𝑥), kun x on positiivinen. Negatiivisilla muuttujan x arvoilla voidaan käyttää lauseen 3.20 kaavaa Φ(−𝑥) = 1 − Φ(𝑥). Kuva 3.7 Standardoidun normaalijakauman tiheysfunktio f(x) (vas.) ja jakaumafunktio F(x). Seuraavaksi esitellään standardoidun normaalijakauman lineaarinen muunnos, yleinen normaalijakauma. Lause 3.21 (Yleinen normaalijakauma) Jos 𝑌~𝑁(0,1), niin sanotaan, että satunnaismuuttujalla 𝑋 = 𝜇 + 𝜎𝑌, missä 𝜎 > 0, on normaalijakauma, 𝑋~𝑁(𝜇, 𝜎2). Tällöin 𝐹(𝑥) = Φ( 𝑥 − 𝜇 𝜎 ) , 𝑓(𝑥) = 1 𝜎√2𝜋 𝑒− 1 2( 𝑥−𝜇 𝜎 ) 2 , −∞ < 𝑥 < ∞. 𝐸(𝑋) = 𝜇, 𝐷2(𝑋) = 𝜎2. 45 Jos 𝑋~𝑁(𝜇, 𝜎2) ja 𝑍~𝑎 + 𝑏𝑋, niin myös satunnaismuuttujalla Z on normaalijakauma; 𝑍~𝑁(𝑎 + 𝑏𝜇, 𝑏2𝜎2). Todistus. Tarkastellaan ensin jakaumafunktiota 𝐹(𝑥): 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = 𝑃(𝜇 + 𝜎𝑌 ≤ 𝑥) = 𝑃 (𝑌 ≤ 𝑥 − 𝜇 𝜎 ) = 𝛷 (𝑌 ≤ 𝑥 − 𝜇 𝜎 ). Tiheysfunktiolle saadaan: 𝑓(𝑥) = 𝐹′(𝑥) = 1 𝜎 𝛷 ( 𝑥 − 𝜇 𝜎 ) = 1 𝜎√2𝜋 𝑒− 1 2( 𝑥−𝜇 𝜎 ) 2 . Odotusarvoksi 𝐸(𝑋)saadaan: 𝐸(𝑋) = 𝐸(𝜇 + 𝜎𝑌) = 𝜇 + 𝜎𝐸(𝑌) = 𝜇. Varianssiksi 𝐷2(𝑋) saadaan: 𝐷2(𝑋) = 𝐷2(𝜇 + 𝜎𝑌) = 𝜎2𝐷2(𝑌) = 𝜎2. ∎ Lukion MAOL-taulukoissa normaalijakauman 𝑁(𝜇, 𝜎2) toinen parametri on hajonta 𝜎 lauseessa 3.21 käytetyn varianssin 𝜎2 sijaan. Yleisen normaalijakauman tiheysfunktion ja jakaumafunktion tarkan muodon määräävät satunnaismuuttujan X odotusarvo ja varianssi (Kuva 3.8). Kun satunnaismuuttujasta X vähennetään sen odotusarvo 𝜇, tiheysfunktion kuvaaja siirtyy vaakasuunnassa 𝜇:n verran. Saadun satunnaismuuttujan 𝑋 − 𝜇 odotusarvoksi tulee 0. Kun satunnaismuuttuja 𝑋 − 𝜇 jaetaan luvulla 𝜎, saadaan satunnaismuuttuja 𝑋−𝜇 𝜎 , jonka odotusarvo on myös 0 ja varianssi 1 eli 𝑋−𝜇 𝜎 ~𝑁(0,1). Tällaisen muunnoksen tekemistä kutsutaan normittamiseksi. 46 Kuva 3.8 Normaalijakauman 𝑁(0, 𝜎2) tiheysfunktio (vas.) ja jakaumafunktio, kun 𝜎 = 1 4 , 1 2 , 1,2 ja 4. Useille jakaumille voidaan johtaa normaalijakauma-approksimaatiot (keskeisen raja-arvolauseen avulla). Koska lukion opintojaksolla binomijakauman arvioiminen normaalijakaumalla on syventävää sisältöä, tyydytään tässä yhteydessä vain toteamaan hieman epätäsmällisesti:  Jos 𝑋~𝐵𝑖𝑛(𝑛, 𝑝), niin 𝑋~𝑁(𝑛𝑝, 𝑛𝑝𝑞), jos n on suuri,  Jos 𝑋~𝑃𝑜(𝜆), niin 𝑋~𝑁(𝜆, 𝜆), jos λ on suuri. Normaalijakauma-approksimaatio on yleensä riittävän tarkka binomijakaumalle, kun 𝑛𝑝𝑞 > 10, ja Poisson-jakaumalle, kun 𝜆 > 15. Normaalijakaumassa kaikki reaalilukuarvot ovat mahdollisia. Kuitenkin monesti reaalimaailman ilmiöitä tarkasteltaessa, kuten henkilön painoa suuressa ihmispopulaatiossa tutkittaessa, osa reaalilukuarvoista on käytännössä mahdottomia. Näin ollen normaalijakauman käyttäminen aiheuttaa malliin näiden arvojen kohdalle virheen. Virhe on kuitenkin merkityksettömän pieni tulosten luotettavuuden kannalta todennäköisyysmassan keskittyessä jakauman realististen arvojen alueelle. Jos todennäköisyys on jakautunut tasaisesti jollekin välille [𝑎, 𝑏] eli tiheysfunktio on vakio kyseisellä välillä, niin kyseessä on tasaisesti jakautunut satunnaismuuttuja ja puhutaan tasaisesta jakaumasta (Kuva 3.9). Lause 3.22 (Tasainen jakauma) Jos satunnaismuuttujan X tiheysfunktio on 𝑓(𝑥) = { 0, kun 𝑥 ≤ 𝑎, 1 𝑏 − 𝑎 , kun 𝑎 < 𝑥 < 𝑏 0, kun 𝑥 ≥ 𝑏, , 47 missä 𝑎 < 𝑏, niin sanotaan, että satunnaismuuttujalla X on tasainen jakauma välillä [𝑎, 𝑏]; merkitään 𝑋~𝑈(𝑎, 𝑏). Tällöin 𝐹(𝑥) = { 0, kun 𝑥 ≤ 𝑎, 𝑥 − 𝑎 𝑏 − 𝑎 , kun 𝑎 < 𝑥 < 𝑏 0, kun 𝑥 ≥ 𝑏, , 𝐸(𝑋) = 𝑎 + 𝑏 2 , 𝐷2(𝑋) = (𝑏 − 𝑎)2 12 . Todistus sivuutetaan. Kuva 3.9 Tasaisen jakauman tiheysfunktio f(x) (vas.) ja jakaumafunktio F(x). 48 4 Terve! Terveysaiheinen tehtäväpaketti opiskelijalle -materiaali Terve! Terveysaiheinen tehtäväpaketti opiskelijalle – oppimateriaali koostuu lukion matematiikan pitkän oppimäärän todennäköisyyslaskennan opintojaksolle tarkoitetuista tehtävistä, tehtävien aiheisiin liittyvästä asiatiedosta, sanallisista ratkaisuvihjeistä (vain opiskelijan materiaalissa) sekä tehtävien eräistä malliratkaisuista (vain opettajan materiaalissa). Kaikki tehtävät ovat terveysaiheisia, osa hyvin spesifiin jakson aiheeseen liittyviä perustehtäviä ja osa laajojen kokonaisuuksien hallintaa vaativia, soveltavia tehtäviä. Tehtävien järjestys on materiaalissa satunnainen eikä tehtävänanto kaikissa tehtävissä anna opiskelijalle ilmeistä vihjettä siitä, mitä laskennallisia keinoja hänen tulisi tehtävän ratkaisussa käyttää. Materiaalin kaksi viimeistä tehtävää ovat todennäköisyyslaskennan opintojakson tietoja syventäviä tehtäviä, joiden ratkaisemiseksi opiskelijan on tutustuttava kokonaistodennäköisyyslauseeseen ja Bayesin lauseeseen, jotka eivät kuulu lukion oppimäärään, mutta ovat esiteltyjä opiskelijan materiaalissa. Sekä opiskelijamateriaali (Liite1) että malliratkaisut sisältävä opettajan materiaali (Liite 2) on käytettävyyden ja selkeyden vuoksi sijoitettu tutkielman liitteisiin. Opettaja voi käyttää materiaalia todennäköisyyslaskennan opintojakson opetuksessa monella tavalla: sen voi jakaa opiskelijoille itsenäiseksi kurssityöksi opintojakson alussa, sitä voi käyttää opintojakson kertauksessa tai yksittäisiä tehtäviä voi esittää elävöittävinä esimerkkeinä oppitunneilla. Koska tehtäviin on saatavilla malliratkaisut, niitä on helppo käyttää koetehtävinä tai opintojakson aikaisen formatiivisen arvioinnin tukena - esimerkiksi vertaisarvioitavina kotitehtävinä. 49 5 Pohdinta Terve! Terveysaiheinen tehtäväpaketti opiskelijalle –materiaalin tehtävissä havainnollistetaan useita terveyteen liittyviä ilmiöitä todennäköisyyslaskennan keinoin. Terveysilmiöiden tutkiminen matemaattisesti luo opiskelijalle mahdollisuuden oivaltaa uutta tehtävän terveysaiheesta sekä matemaattisen ratkaisun rakentamisesta. Opiskelija saattaa oppia esimerkiksi Rokotteen rooli taudin leviämisen ehkäisyssä – tehtävästä (Tehtävä 11), että tehokaskaan rokote ei riitä suojaamaan rokottamattomia, jos rokotettuja ei ole tarpeeksi. Jotta tauti ei pääse leviämään populaatiossa eksponentiaalisesti, yksi sairastunut ei saa tartuttaa kahta tai useampaa ei-immuunia henkilöä. Näin kuitenkin pääsee tapahtumaan, jos rokotekattavuus ei ole riittävän suuri. Kansallisilla rokotusohjelmilla on siis terveydellisten, inhimillisten ja yhteiskunnallisten syiden lisäksi myös matemaattiset perusteet. Tautien ehkäisyn lisäksi Terve! -materiaalissa tutkitaan muun muassa taudin havaitsemista tautitestillä (Tehtävä 12). Intuitiivisesti luotettavalta vaikuttava HIV-testi, joka kertoo 95% varmuudella tartunnan saaneelle oikean tuloksen, on osoittautunut ehdollisia todennäköisyyksiä laskemalla yllättäen huonoksi tavaksi seuloa tartuntoja. Kun terveitä testin tekijöitä on paljon, syntyy suuri määrä virheellisiä positiivisia tuloksia. Monesti todennäköisyyslaskennassa onkin niin, että intuitiivinen kuvitelma tilanteesta ei vastaa todellisuutta. Ongelman ratkominen ohjaa sekä suhtautumaan kriittisen uteliaasti "liian hyvin" markkinoitujen testien luotettavuuteen että oivaltamaan todennäköisyyslaskennan jekuttavan perusluonteen. Useimpia Terve! –materiaalin aiheita, kuten terveystottumuksia, kestävyysharjoittelua ja kansantauteja, käsitellään lukiossa terveystiedon oppiaineessa. Siinä terveyteen liittyviä ilmiöitä tarkastellaan terveysosaamisen osa-alueiden eli terveyteen liittyvien tietojen, taitojen, itsetuntemuksen, kriittisen ajattelun ja eettisen vastuullisuuden kautta [3, s. 328]. Terve! - materiaalin tehtävien aiheiden tarkastelu matemaattisesti voi auttaa opiskelijaa kehittämään omaa terveysosaamistaan. Toisaalta ajankohtaisen, reaalimaailman ongelman ratkominen elävöittää matematiikan opiskelua ja mielenkiintoinen tehtävä voi herättää opiskelijan kiinnostuksen matemaattiseen ongelmanratkaisuun. Opiskelijat pitävät kiinnostavina sekä ympäröivään maailmaan liittyviä että siihen liittymättömiä matematiikan tehtäviä [10]. Pelkät tehtävät eivät yksinään riitä innostamaan opiskelijaa matematiikan opiskeluun, vaan ne elävöityvät ja saavat merkityksen oppimisympäristön vuorovaikutussuhteissa [11]. Tehtävien innostavuuteen vaikuttavat mm. opettajan pedagogiset ratkaisut: tutkitaanko tehtäviä oppitunneilla vai kotona, yksin vai ryhmissä, osissa vai kokonaisuuksina, visualisoidaanko niitä tai käsitelläänkö niiden erilaisia ratkaisuvaihtoehtoja. Schukajlowin ja Krugin tutkimusten [12] mukaan opiskelijoiden rohkaisuun erilaisten ratkaisutapojen esiin tuomiseksi tulisi kiinnittää nykyistä enemmän huomiota erityisesti soveltavia tehtäviä tarkastettaessa. Tämä voi tarkoittaa opettajalle 50 opiskelijoiden kanssa yhteistä keskustelua tai heidän ohjaamistaan keskustelemaan pienryhmissä tehtävien erilaisista ratkaisutavoista. Terve!-oppimateriaalin malliratkaisuissa esitellään useimmiten vain yksi tapa ratkaista kukin tehtävä. On toivottavaa, että opiskelijoille kerrotaan valmiin ratkaisun olevan yksi monista mahdollisista vaihtoehdoista lähestyä tehtävää ja että muiden ratkaisutapojen tutkimiselle varataan aikaa. Säännöllinen erilaisten ratkaisuvaihtoehtojen tutkiminen vahvistaa opiskelijan kokemusta omasta matemaattisesta kyvykkyydestään, mikä mahdollistaa kiinnostuksen kehittymisen matematiikkaa kohtaan. Terve!-materiaalin malliratkaisut on rakennettu hyvän matemaattisen vastauksen piirteiden ja käytänteiden mukaisesti. Todennäköisyyden laskukaavojen käyttö perustellaan tarkasti ja laskujen välivaiheita on näkyvissä runsaasti. Vastauksen etenemistä kuvataan materiaalissa yksityiskohtaisesti, jotta ratkaisua olisi helppo lukea myös silloin, kun tehtävän ratkaisemisesta on kulunut paljon aikaa tai kun opiskelija on itse ratkaissut tehtävän eri tavalla ja haluaa ymmärtää vaihtoehtoisen laskutavan. Tehtävänannon tilannetta on useissa malliratkaisuissa pyritty visualisoimaan esimerkiksi Venn-diagrammin, taulukon, piirroksen tai sanallisen kuvailun avulla. Selvitettävän ongelman visualisointi on tutkimusten [13,14] mukaan avainasemassa matemaattisessa päättelyssä, ongelmanratkaisussa ja jopa todistamisessa. Kansallisen koulutuksen arviointikeskuksen raportin [15] mukaan hyvin ja heikosti matematiikassa menestyneiden peruskoulun 9. luokkalaisten oppilaiden matematiikan osaamisessa on useiden vuosien taitotasollinen ero. Laskeva trendi matematiikan osaamisen tasossa yhdeksäsluokkalaisilla on jatkunut vuodesta 2000, mutta tulos on silti aiempiin vuosiin verrattuna poikkeava: osaaminen on polarisoitunut. Parhaat oppilaat pystyvät ratkaisemaan ylioppilaskokeen lyhyen oppimäärän tehtäviä, heikoimmilla oppilailla on vaikeuksia jopa alakoululuokkien tehtävissä. Syyt osaamisen eriytymisen taustalla saattavat liittyä koronapandemian aikaiseen pahoinvointiin perheissä, etäopetukseen sekä aiempaa suurempiin eroihin oppilaiden vastausteknisissä taidoissa [15]. Matematiikan osaamisen eriytyminen ja suuret koulujen väliset erot asettavat opiskelijat eriarvoiseen asemaan toisen asteen opintoihin hakeuduttaessa sekä opintojen aikana. Erilaiset lähtökohdat haastavat myös lukion matematiikan opettajia opetuksen suunnittelussa ja toteutuksessa. Opiskelijoiden osaamisen hajonta oli 2021 julkaistun raportin [15] mukaan suurinta juuri tilastollisten tunnuslukujen ja todennäköisyyden sisältöalueella sekä tavoitteiden toteutumisessa todennäköisyys- ja prosenttilaskennassa. Eniten huolestuttavaa laskua kahdenkymmenen vuoden aikana on tapahtunut matematiikan ajattelun taidoissa ja menetelmissä. Minäpystyvyys, eli kokemus itsestä matematiikan osaajana sekä luottamus omiin kykyihin suoriutua erilaisissa tilanteissa ja tehtävissä, on heikentynyt erityisesti hyvin menestyneillä oppilailla [15]. Opettajan merkitys rohkaisijana ja kannustajana on ilmeinen opiskelijan minäpystyvyyden ja matemaattisen 51 itseluottamuksen vahvistumiselle. Myönteinen käsitys omista matematiikan taidoista näkyy opiskelijan uskona pärjätä matematiikan tehtävissä myös tulevaisuudessa [16, s. 11]. Lukinin tutkimuksen [17, s. vi] mukaan opiskelijan menestymistä matematiikassa selittävätkin eniten vahva minäpystyvyys ja oppimisorientaatio. Lisäksi menestystä matematiikassa selittää opiskelijan ja opettajan kohtaaminen ilman ulkoiseen motivaatioon nojaavan suoritusorientaatioon liittyviä viestejä opettajalta opiskelijalle [17]. Opiskelijan sitoutuminen matematiikan opiskeluun pitkäjänteisesti tapahtuu matematiikan merkitykselliseksi kokemisen kautta, eikä suoritusorientaatio tue tätä kehityskulkua. 2020-luku on ollut tähän asti tartuntatautien uutta kulta-aikaa. Terveyteen ja sairauteen liittyvän asiatiedon määrä lisääntyy jatkuvasti - se on yhä helpommin ja yhä useamman saavutettavissa. Tästä huolimatta misinformaatio, huhut ja salaliittoteoriat tuntuvat leviävän oikeaa tietoa ja apinarokkoakin nopeammin. Ymmärrys terveysilmiöiden matematiikasta parantaa opiskelijan mahdollisuuksia navigoida turvallisesti ja lähdekriittisesti näillä haastavilla informaatiokentillä. Terve!-oppimateriaalin tehtävien ratkaisutapojen tutkiminen ja vastausten luotettavuuden, merkityksen ja seurausten pohdinta yhdessä vertaisten ja kannustavan opettajan kanssa vahvistavat opiskelijan matemaattista itseluottamusta ja oppimissuuntautunutta orientaatiota. 52 6 Lähteet [1] Lehtinen, Matti. Todennäköisyyslaskenta: ajanvietteestä tiedettä. Matematiikan historia. Matematiikkalehti Solmu 3/2000-2001. https://matematiikkalehtisolmu.fi/2000/mathist/pdf/tnlask.pdf - Luettu 30.5.2022 [2] Lee, Peter M. Materials for the History of Statistics. University of York. Otteita Pascalin ja Fermat’n kirjeenvaihdosta. https://www.york.ac.uk/depts/maths/histstat/pascal.pdf - Luettu 30.5.2022 [3] Opetushallitus. Lukio-opetuksen opetussuunnitelman perusteet 2019. Määräykset ja ohjeet 2019:2a.16-20, 45, 58-65, 221-222 & 227. [4] Beyranevand, Matthew L. 4 Ways to Increase Student Interest in Mathematics. TenMarks Education. 2016. https://tenmarks.typepad.com/tenmarks/2016/04/4-ways-to-increase- student-interest-in-mathematics.html [5] Pesonen, Henri. Tilastollisen päättelyn peruskurssi. 2018. Turun yliopisto. 5-34. [6] Mellin, Ilkka. Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. 2007. 3-11. https://math.tkk.fi/opetus/sovtoda/luennot/TILRI100.pdf [7] Ruskeepää, Heikki. Todennäköisyyslaskenta I. 2011. Turun yliopisto. 3-22. [8] Lahtonen, Jyrki. Analyysi I. 2010. Turun yliopisto. 10-11. [9] Honkala, Iiro. Kombinatoriikka. 2009. Turun yliopisto. 3-4. [10] Rellensmann, Johanna & Schukajlow, Stanislaw. Does students’ interest in a mathematical problem depend on the problem’s connection to reality? An analysis of students’ interest and pre-service teachers’ judgments of students’ interest in problems with and without a connection to reality. ZDM Mathematics Education. 2017, 49. 367–378. [11] Chapman, Olive. Mathematical-task knowledge for teaching. Journal of Mathematics Teacher Education. 2013, 16. 1–6. [12] Schukajlow, Stanislaw & Krug, André. Do Multiple Solutions Matter? Prompting Multiple Solutions, Interest, Competence, and Autonomy. Journal for Research in Mathematics Education 2014, Vol. 45, No. 4. 497–533. [13] Arcavi, Abraham. THE ROLE OF VISUAL REPRESENTATIONS IN THE LEARNING OF MATHEMATICS. Educational Studies in Mathematics. 2003, 52: 215–241. 235-236. 53 [14] Presmeg, Norma. Visualization and Learning in Mathematics Education. Teoksessa Lerman, S. (toim.) Encyclopedia of Mathematics Education. Springer, Cham. 2020. 900-904. [15] Metsämuuronen, Jari & Nousiainen Saara. MATEMATIIKKAA COVID-19-PANDEMIAN VARJOSSA - Matematiikan osaaminen 9. luokan lopussa keväällä 2021. Kansallinen koulutuksen arviointikeskus. Julkaisut 27: 2021. 3-5, 61, 81 & 105-107. [16] Samela-Aro, Katariina. Motivaatio ja oppiminen kulkevat käsi kädessä. PS-Kustannus. 2018. 9- 22. [17] Lukin, Tuija. Motivaatio matematiikan opiskelussa – seurantatutkimus motivaatiotekijöistä ja niiden välisistä yhteyksistä yläkoulun aikana. Itä-Suomen yliopisto. 2012. v-vi, 20-21 & 89. Liitteet Liite 1 Materiaali opiskelijalle Liite 2 Materiaali opettajalle Lukion matematiikan pitkä oppimäärä Tilastot ja todennäköisyys TERVE! Terveysaiheinen tehtäväpaketti opiskelijalle Annina Ruokonen Sisällys Käyttäjälle 2 Tehtävät 3 Vihjeet ja vinkit 22 2 Käyttäjälle Todennäköisyyslaskenta on suhteellisen nuori, noin 400-vuotias, matematiikan osa-alue, joka on perinteisesti keskittynyt erilaisten rahapelien voiton todennäköisyyden laskemiseen. Lukion todennäköisyyslaskennan opintojaksolla huomataankin todennäköisyyslaskennan olevan kätevä väline muun muassa useiden kortti- ja noppapelien mallinnuksessa, mutta laskennan keinot taipuvat oivallisesti myös useiden arjen, luonnon ja yhteiskunnan ilmiöiden ja tapahtumien mallintamiseen. Tämän materiaalin tehtävät liittyvät ajankohtaisiin arkiympäristön ja yhteiskunnan terveysilmiöihin, kuten treenaamiseen, ensiaputaitoihin, rokotteisiin, punkkien levittämiin tauteihin ja väestöryhmien välisiin terveyseroihin. Kunkin tehtävän yhteydessä kerrotaan hieman tehtävän aiheesta ja annetaan vinkkejä asiallisen lisätiedon löytämiseen. Tehtävissä on tarkoitus tutustua erilaisten terveysilmiöiden syihin ja seurauksiin, ymmärtää ja kehittää niihin liittyvää matemaattista ajattelua sekä oppia analysoimaan saatujen tulosten mielekkyyttä ja luotettavuutta. Tavoitteena on harjoitella pohtimaan saatujen tulosten merkitystä terveydelle yksilö-, yhteisö- ja yhteiskuntatasolla. Tehtävissä on käytetty seuraavia symboleja, joiden merkitys on tässä selitetty: Tökkääkö ratkaiseminen? Vihjeitä on saatavilla. Laskinohjelmistoja saa käyttää tehtävän ratkaisemiseksi. Laskinohjelmistoja ei saa käyttää tehtävän ratkaisemiseksi. Funktiolaskin, kuten SpeedCrunch, KCalc ja Gnome, ovat käytössä. Vihjeet tehtävien ratkaisemiseksi löytyvät materiaalin takaosasta. Malliratkaisut saat opettajaltasi. Innostavia hetkiä tehtävien ratkaisemiseen toivoo! Annina Ruokonen Tekijä 3 Tehtävät JOHDANTOTEHTÄVÄ: Terveyteen liittyvien ilmiöiden riippumattomuus Todennäköisyyslaskennassa kahden tapahtuman riippumattomuus tarkoittaa, että jonkin tapahtuman todennäköisyys ei riipu toisen tapahtuman toteutumisesta ja toisin päin. Toisinaan tapahtumien riippumattomuus on ilmeistä tai asiayhteydestä helposti ymmärrettävissä. Näin on esimerkiksi silloin, kun heitetään kahta noppaa: toisen nopan silmäluku ei riipu siitä, mitä ensimmäisellä nopalla saatiin silmäluvuksi. Terveyteen liittyvät tapahtumat ovat kuitenkin usein monisyisiä, minkä vuoksi tapahtumien riippumattomuuden tarkastelu on tärkeää ja tehtävissä on syytä mainita, voidaanko tapahtumat olettaa riippumattomiksi vai ei. Pohdi itsenäisesti tai keskustele parin kanssa, millä tavoin seuraavat asiat voivat liittyä toisiinsa ja ovatko ilmiöt toisistaan riippumattomia:  ilmastonmuutos ja tartuntatautien leviäminen  sosioekonominen asema ja terveydentila  lapsityövoima ja tupakkatuotteet  rokotteet ja kuolleisuus  liikunta ja stressi  ylipaino ja tyypin 2 diabetes  ravitsemus ja uni  mieliala ja ystävyyssuhteet  tupakointi ja masennus  aktiivisuusmittari ja unen laatu  ilmaston lämpeneminen ja lonkkamurtumat  pyöräilykypärän käyttäminen ja turvavyön käyttäminen 4 Tehtävä 1: Lukiolaisen terveystottumuksia Vuonna 2019 turkulaisista 1. ja 2. vuosikurssin lukio-opiskelijoista 33,8 % ei syönyt koululounasta päivittäin ja 85,4 % liikkui päivässä alle tunnin (Kouluterveyskysely 2019). Oletetaan, että neljäsosa opiskelijoista sekä jätti koululounaan väliin että liikkui alle tunnin päivän aikana. Millä todennäköisyydellä sattumanvaraisesti valittu turkulaisopiskelija syö koululounaan ja liikkuu vähintään tunnin joka päivä? Lisää aiheesta: Kouluruokailun merkityksestä, Opetushallitus. Lasten ja nuorten liikkumissuositus, UKK-instituutti. Terveelliset välipalat voivat edistää jaksamista, Valtioneuvoston selvitys- ja tutkimustoimikunta. PSST! Kouluruokailu on niin opiskelijoiden kuin muun koulun henkilökunnan terveyttä ja hyvinvointia tukeva tekijä. Koululounas on suunniteltu monipuoliseksi ateriaksi, joka kokonaisuudessaan nautittuna on ravitsemuksellisesti täysipainoinen ja terveellinen. Kylläisenä ihminen jaksaa keskittyä paremmin opiskeluun ja sietää arjen kiireisyyttä. Kouluruokailu myös lisää yhteisiä ruokailuhetkiä ja ruoan arvostusta. Ruokailu antaa mahdollisuuden pieneen hengähdyshetkeen hektisen koulupäivän keskellä ja sillä on samalla sosiaalinen merkityksensä koulun arjessa. Sosiaali- ja terveysministeriön asiantuntijakeskus UKK-instituutin laatimien, laajaan tutkimustietoon perustuvien liikkumissuositusten tarkoituksena on tiivistää terveyden kannalta tarvittavan viikoittaisen liikkumisen määrä sekä antaa esimerkkejä eri liikkumisen muodoista kaikenikäisille kansalaisille. Instituutin suosituksen mukaan 7-17-vuotiaiden lasten ja nuorten tulisi liikkua reippaasti ja rasittavasti tunti päivässä. Tunti voi kertyä useista liikuntahetkistä päivän aikana ja tärkeää olisi välttää pitkäkestoista paikallaanoloa, kuten istumista. 5 Tehtävä 2: Verenluovutus Veriryhmät ovat tapa ryhmitellä verityyppejä ominaisuuksineen. Erilaisia veriryhmäluokitteluja on maailmassa yli 30, mutta yleisimmin käytössä ovat ABO- ja reesusveriryhmäjärjestelmät. Ihmisellä veri kuuluu yhteen neljästä ABO-veriryhmästä (A, B, AB ja O) ja on luokiteltavissa edelleen reesusnegatiivisiin ja reesuspositiivisiin: A-, A+, B-, B+, AB-, AB+, O- tai O+. Verenluovutuksessa potilaalle annetaan hänen veriryhmänsä kanssa yhteensopivaa verta alla olevan taulukon (Veripalvelu, SPR) mukaisesti. Verentarve noudattaa keskimäärin suomalaisten veriryhmäjakaumaa. Epäsopivan veren saaminen voi johtaa potilaan omien punasolujen rikkoutumiseen, millä voi olla vakavia seurauksia. a) Kuinka suuri ryhmän suomalaisia tulee olla, jotta todennäköisyys, että ainakin yksi heistä kuuluu veriryhmään B+, ylittää 995 ‰? b) Kuinka suuri satunnaisesti valituista henkilöistä koostuvan ryhmän tulee olla, jotta veriryhmään AB- kuuluvalle henkilölle löytyy sopiva luovuttaja yli 950 ‰:n todennäköisyydellä? Lisää aiheesta: Veriryhmät, niiden periytyvyys ja verenluovutus, Veripalvelu (Suomen Punainen Risti, SPR). Mitä verenluovutuksessa tapahtuu? Veripalvelu. Voittoa tavoittelematon verenluovutus Euroopassa, EBA. PSST! Tiesitkö, että verenluovutus on helppo tapa auttaa? Se vie vain noin 10 minuuttia. Luovutetusta verestä tehtyjä verivalmisteita tarvitaan muun muassa leikkauspotilaiden, onnettomuusuhrien, syöpää sairastavien ja keskoslasten hoidossa. Suomessa verenluovutustoiminta on perustunut aina vapaaehtoisuuteen ja maksuttomuuteen. Luovuttaja auttaa potilasta ilman korvausta, mikä on tärkeä asia verivalmisteen turvallisuuden kannalta. Joissain maissa verenluovutuksesta maksetaan korvaus, mikä voi aiheuttaa vakavia, jopa kuolemaan johtavia terveys- ja turvallisuusriskejä luovuttajan tavoitellessa palkkiota. 6 Tehtävä 3: Tartuntalähteet Yle Uutisten 5.11.2020 mukaan Covid-19-viruksen tartunnan jäljittäminen on aiempaan verrattuna helpottunut ja noin 60 % tartuntalähteistä selviää. Terveyden ja hyvinvoinnin laitoksen (THL) tietojen mukaan selvinneiden tartuntojen lähteet ovat seuraavat: Tarkastellaan viittä satunnaisesti valittua tartunnan saanutta henkilöä. Millä todennäköisyydellä a) heillä kaikilla on eri tartuntalähde? b) he kaikki ovat saaneet tartunnan perhepiiristä? c) kaksi henkilöä on saanut tartunnan perhepiiristä ja kolme muualta? Lisää aiheesta: Koronavirus, Terveyden ja hyvinvoinnin laitos (THL). Ajankohtaista tietoa Covid-19-taudista, THL. PSST! Covid-19-taudin, kansanomaisesti koronan, aiheuttaja on koronaviruksiin kuuluva SARS-CoV-2-virus. Virus todettiin ensimmäisen kerran Kiinassa joulukuussa 2019 ja se levisi maailmanlaajuisesti alkukeväällä 2020. Maailman terveysjärjestö WHO julisti 11.3.2020 taudin levinneen pandemiaksi. Koronaviruksia tunnetaan useita kymmeniä erilaisia, mutta vain pienehkö osa niistä voi tarttua ihmiseen ja aiheuttaa vakavia, jopa kuolemaan johtavia infektioita. Tällaisia ovat aiheuttaneet SARS-CoV-2-koronaviruksen lisäksi vain kaksi: SARS-CoV- ja MERS-CoV-koronavirukset, jotka levisivät kumpainenkin vakaviksi epidemiaksi asti. SARS vuonna 2003 ja MERS vuonna 2012. Tavallisesti koronavirukset aiheuttavat lieviä hengitystieinfektioita erityisesti syys- ja talvikaudella. Yleensä oireina on jonkinlainen yhdistelmä yskää, nuhaa sekä muita flunssan oireita. Covid-19, kuten moni virus- ja bakteeritauti, leviää hengitystie-eritteiden kautta pisaratartuntana suun, nenän ja silmien limakalvoilta. Koska Covid-19-tauti on erityisen herkästi tarttuva ja riskiryhmille jopa hengenvaarallinen, on suojatoimeksi pandemia-aikana vakiintunut tavanomaisen suojautumisen, kuten käsienpesun ja hyvän yskimishygienian lisäksi kasvomaskien käyttö julkisilla paikoilla. 7 Tehtävä 4: Seksuaalivähemmistöt Vuoden 2017 kouluterveyskyselyn mukaan toisen asteen opiskelijoista noin 11 % (15 % tyttöoletetuista, 7 % poikaoletetuista) kokee kuuluvansa seksuaalivähemmistöihin. Suomalaisten lukiolaisten keskuudesta arvotaan 30 henkilön otos. Millä todennäköisyydellä näistä henkilöistä johonkin seksuaalivähemmistöön kuuluu: a) puolet b) ainakin 28 c) enintään yksi d) ainakin yksi? Lisää aiheesta: Seksuaalinen suuntautuminen, Seta ry. Itsemäärittelyoikeus ja normit, Seta ry. Ensimmäinen HLBTIQ-henkilöiden tasa-arvoa koskeva EU:n strategia, Euroopan komissio. Sukupuoli- ja seksuaalivähemmistöihin kuuluvien nuorten hyvinvointi, THL. PSST! HLBTIQ on seksuaali- ja sukupuolivähemmistöistä käytetty lyhenne, joka tulee sanoista homo, lesbo, bi, trans, inter ja queer. Seksuaalinen suuntautuminen on ominaisuus, joka kertoo siitä, kehen ihminen ihastuu, rakastuu tai tuntee vetoa tunnetasolla tai eroottisessa mielessä. Monesti seksuaalinen suuntautuminen määritellään oman sukupuolen ja tunteiden kohteen sukupuolen perusteella, mikä on toisinaan ongelmallinen määrittelytapa niin seksuaalisen suuntautumisen kuin sukupuolien moninaisuuden kannalta. Puhuttiin sitten sukupuolesta tai seksuaalisesta suuntautumisesta, jokaisella ihmisellä on oikeus määritellä, kuka on ja kuinka haluaa tulla nähdyksi. Jokaisella on myös täysi oikeus olla tietämättä. Itsensä saa määritellä, olla määrittelemättä ja muuttaa mielensä määritelmien suhteen. Kouluterveyskyselyssä kartoitetaan myös sukupuoli- ja seksuaalivähemmistöön kuuluvien nuorten hyvinvointia ja yhdenvertaisuuden toteutumista. Vuoden 2019 kyselyn tulokset osoittavat, että näihin vähemmistöihin kuuluvilla nuorilla oli muihin ikätovereihinsa verrattuna huomattavasti enemmän terveyteen ja hyvinvointiin sekä koulunkäyntiin ja kouluyhteisössä elämiseen liittyviä haasteita, kuten yksinäisyyden, kiusaamisen ja uupumuksen kokemuksia. Erityisen ongelmallista on sateenkaarinuorten kohtaaman väkivallan ja mielenterveyden ongelmien yleisyys sekä tarvitun avun ulkopuolelle jäämisen kokemukset muita nuoria useammin. Seksuaalivähemmistöjen syrjintäsuoja ja yhdenvertaisuuden edistämisvelvoite viranomaisille on kirjattu yhdenvertaisuuslakiin, mutta siitä huolimatta jokaisella meistä on myös yksilönä vastuu yhdenvertaisuuden toteutumisessa. Terveyden ja hyvinvoinnin laitoksen joka toinen vuosi teettämä Kouluterveyskysely on perusopetuksen 4.-5. ja 8.-9. vuosiluokkalaisille, lukion 1.-2. vuoden opiskelijoille sekä ammatillisten oppilaitosten 1.-2. vuoden opiskelijoille suunnattu kysely. Siinä kartoitetaan eri- ikäisten lasten ja nuorten hyvinvointiin, terveyteen, koulunkäyntiin, osallisuuteen sekä avun ja tuen saamiseen liittyviä kokemuksia, tapoja ja tottumuksia sekä paikallisesti että maakuntatasolla. Kouluterveyskyselystä saatuja tietoja voidaan hyödyntää hyvinvoinnin edistämistyössä niin oppilaitoksissa, hyvinvointialueilla ja valtakunnallisesti. 8 Tehtävä 5: Kansantaudit Syöpäsairaudet ja diabetes ovat Suomessa kansantauteja. Yksilöllisten ja inhimillisten haittojen lisäksi kansantaudit vaikuttavat väestötasolla terveydentilaan, kuolleisuuteen ja työkykyyn sekä kuormittavat rajusti terveydenhuoltoa vaikuttaen samalla myös kansantalouteen. Syöpäjärjestöjen tiedon mukaan joka kolmas suomalainen sairastuu jossakin elämänsä vaiheessa syöpään. Lähes kaksi kolmesta kuitenkin paranee. FinTerveys 2017-tutkimuksen mukaan tyypin 2 diabetekseen sairastuu elämänsä aikana n. 13% väestöstä (10 % naisista ja 15 % miehistä). Hiljattain todetusta diabeteksesta on mahdollista parantua täysin ja pitkään sairastanutkin voi saada sairauden remissiotilaan eli piiloon elämäntaparemontilla (terveellinen ravinto ja liikunnan lisääminen: eroon ylipainosta). Dataa remissioon päässeistä suomalaisista diabeetikoista ei ole kerätty, mutta brittitutkimuksessa* kahden vuoden seurannan jälkeen ilman painonhallintaohjelmaa remissioon pääsi 3 %, kun taas painonhallintaohjelman saaneista 36 % pääsi remissioon. Voidaan olettaa, että elintapaohjauksella on sama vaikutus myös suomalaisiin diabeetikoihin ja että sairaudesta parantuminen ei riipu sairastumisesta, vaan muista asioista (esim. hoidon onnistuminen ja yleiskunto). Lääketieteellisissä tutkimuksissa** on havaittu voimakas yhteys syöpien ja tyypin 2 diabeteksen sairastavuuden välillä. Tämä johtuu erityisesti siitä, että molemmilla sairauksilla on yhteisiä riskitekijöitä. Tarkkaa arviota siitä, kuinka suuri osa potilaista sairastaa molempia samanaikaisesti, ei ole. Oletetaan tässä tehtävässä, että itse sairastumistapahtumat ovat toisistaan riippumattomia. Laske, kuinka suurella todennäköisyydellä satunnainen suomalainen elämässään: a) sairastuu sekä syöpäsairauteen että 2-tyypin diabetekseen b) ei sairastu kumpaankaan c) sairastuu ainakin toiseen d) sairastuu enintään toiseen e) sairastuu vain toiseen f) sairastuu syöpään ja paranee siitä g) sairastuu diabetekseen ja pääsee remissioon, kun hän on saanut painonhallintaohjelman. * https://www.thelancet.com/journals/landia/article/PIIS2213-8587(19)30068-3/fulltext ** https://pubmed-ncbi-nlm-nih-gov.ezproxy.utu.fi/27219686/ Lisää aiheesta Syöpä, Kaikki syövästä (Syöpäjärjestöt). Diabeteksen ilmenemismuodot, Suomen Diabetesliitto ry. Huonosti hoidettuna diabetes kuormittaa munuaisia diabetes ja munuaiset & munuaisten tehtävät, Diabetesliitto ja Munuais- ja maksaliitto. Samanaikaissairastavuus eli komorbiditeetti tarkoittaa kahden tai useamman sairauden tai niin sanotun häiriön samanaikaista esiintymistä. Ilmiö on yleisempi sellaisilla sairauksilla, joilla on yhteisiä riskitekijöitä. Esimerkiksi ylipaino, tupakointi, korkea verenpaine ja veren korkea kolesterolipitoisuus ovat yhteisiä riskitekijöitä useille suomalaisille kansantaudeille, kuten syöville, diabetekselle sekä sydän- ja verisuonisairauksille. Myös erilaiset oppimisvaikeudet esim. hahmotusvaikeudet, lukivaikeus ja tarkkaavaisuuden vaikeudet esiintyvät usein päällekkäin. 9 Tehtävä 6: Puutiaisaivotulehdukset Saaristomeren alueella Arviolta noin 500 000:ta suomalaista puree vuosittain punkki. Puutiaisaivokuumetta aiheuttavaa virusta kantaa noin 1-2 % riskialueiden* punkeista. Puutiaisaivotulehdus (TBE) on punkin kaikkien kehitysmuotojen (toukka, nymfi ja aikuinen) välityksellä tarttuva virustauti, jolle ei ole olemassa lääkehoitoa. Siihen on kuitenkin olemassa rokote, joka suojaa taudilta. Virus tarttuu punkista ihmiseen minuuteissa, minkä vuoksi ihon tarkastaminen punkkien varalta ei auta. Lähivuosina Suomessa on raportoitu vuosittain keskimäärin 60–80 puutiaisaivotulehdustapausta, mutta esimerkiksi vuonna 2020 diagnosoitiin 91 tapausta, mikä on enemmän kuin koskaan aikaisemmin. Määritä alla olevasta puutiaisaivotulehduksen esiintyvyys –taulukosta** a) tapausaineiston moodi sekä b) tapausten lukumäärien keskiarvo ja otoskeskihajonta vuonna 2020 taulukossa nimetyillä paikkakunnilla. Selitä, kuinka hyvin keskiarvo mielestäsi kuvaa aineistoa ja mitä keskihajonnan arvo tarkoittaa tässä tilastossa. Lisää aiheesta: Tietoa TBE-viruksesta: puutiaisaivotulehdus ja TBE:n esiintyvyys kartalla, THL Tietoa borrelia-viruksesta ja oireista: borrelioosi, THL Punkkien levinneisyys ja seuranta: punkkilive, Turun yliopisto Punkkien levinneisyyttä kartoitetaan kansalaistutkimuksen avulla: mediatiedote, Turun yliopisto PSST! Puutiaiset, tuttavallisemmin punkit, ovat levinneet yhä laajemmalle alueelle Suomessa ja samalla punkkien välittämät borrelioosi- ja puutiaisaivotulehdustartuntojen määrät ovat kasvaneet. Yhtenä syynä siihen, että punkkeja tavataan yhä pohjoisemmilla leveysasteilla sekä yhä varhaisemmin keväällä ja myöhemmin syksyllä, pidetään ilmaston lämpenemistä. Uusia punkkiriskialueita on syntynyt jopa aivan kaupunkien puisto- ja viheralueille. Tämän vuoksi on hyödyllistä tietää, millä alueilla punkkeja on havaittu ja kuinka niiltä voidaan suojautua. * Eteläinen Suomi saaristoineen sekä Ahvenanmaan saaristo. **Taulukko supistettu Varsinais-Suomeen ja Ahvenanmaahan Puutiaisaivokuumeen esiintyvyys ja rokotussuositukset tartuntapaikkakunnittain –taulukosta (THL, 2021). THL ylläpitää valtakunnallista tartuntatautirekisteriä (tilastotietokanta) tartuntatautilakiin ja -asetukseen perustuen. Tartuntatautirekisteriin ilmoitetaan vuosittain noin 100 000 tartuntatautitapausta. Tietoja on kerätty vuodesta 1995 alkaen. Tartuntatautirekisteriin voivat tehdä ilmoituksia lääkärit ja laboratoriot. Rekisterin lukuja tarkastellessa on hyvä pitää mielessä, että niihin vaikuttaa se, kuinka suuri osa tautiin sairastuneista hakeutuu terveydenhuoltoon sekä kuinka suurelle osalle tehdään mikrobiologisia tutkimuksia aiheuttajan toteamiseksi. Lisäksi lukuihin vaikuttavat muutokset diagnostisissa käytännöissä ja menetelmissä. Kunta tai kaupunki Tapausten lkm vuonna 2020 Parainen 7 Ahvenanmaa 15 Kustavi 0 Naantali 0 Uusikaupunki 2 Kaarina 2 Turku 1 10 Tehtävä 7: Kestävyystreeni Matalatehoisessa aerobisessa harjoittelussa liikutaan sykkeellä, joka on noin 60-70% maksimisykkeestä. Eräässä tutkimuksessa todettiin, että matalatehoisessa aerobisessa harjoittelussa koehenkilöiden sykkeen keskiarvo oli 130 bpm (beats per minute) ja keskihajonta 8 bpm. Syke on kutakuinkin normaalisti jakautunut. a) Kuinka monella prosentilla koehenkilöistä syke oli alle 120 lyöntiä minuutissa? b) Millä todennäköisyydellä satunnaisesti valitun koehenkilön syke oli välillä 120-140 lyöntiä minuutissa? c) Millä sykevälillä syke oli 95,0 %:lla koehenkilöistä? Lisää aiheesta Syke-käsitteistö kuntoilijalle, Polar. Matalatehoinen peruskestävyysharjoittelu rakentaa kuntopohjaa ja auttaa palautumaan arjesta, Liikunta & Tiede 2-3/2019. PSST! Ihmisen syke kertoo, montako kertaa sydän lyö yhden minuutin aikana. Syke vaihtelee ennen muuta kehon fyysisen aktiivisuuden ja rasituksen mukaan: mitä enemmän keho rasittuu, sitä enemmän sydämen on pumpattava verta työtä tekeville lihaksille. Syke on alhaisimmillaan levossa (nukkuessa) ja korkeimmillaan voimakkaassa fyysisessä rasituksessa esim. HIIT-harjoituksessa. Sykkeeseen vaikuttaa myös henkilön psyyke, kuten mielialan muutokset, stressi ja jännitys, sekä tupakka, alkoholi ja kofeiinipitoiset juomat. Maksimisyke tarkoittaa sykettä, jonka henkilö voi saavuttaa kovassa fyysisessä suorituksessa ilman, että sen hetkellisestä saavuttamisesta on hänelle vaaraa. Maksimisyke on yksilöllinen ominaisuus, joka riippuu muun muassa henkilön iästä ja sukupuolesta. Vanhemmiten maksimisyke laskee. Yksi yleinen tapa arvioida henkilön maksimisykettä on vähentää henkilön ikä luvusta 220. Leposyke tarkoittaa nimensä mukaisesti sykettä henkilön ollessa levossa, mutta kuitenkin hereillä. Tyypillisesti leposyke on aikuisella noin 50-90 lyöntiä minuutissa, mutta maksimisykkeen lailla leposyke on yksilöllinen ja myös geneettinen ominaisuus. Aktiiviliikkujilla leposyke voi hyvin olla alle viitearvon, sillä kestävyysliikunta ja –urheilu laskevat leposykettä. Jännittäviä huhuja liikkuu juoksijalegendojen historiallisen alhaisista leposykkeistä 25-30 lyönnin välillä. Kuitenkin esimerkiksi Paavo Nurmella oli nykytiedon valossa normaali sydän ja syke, vaikka aikanaan Amerikassa värikkäästi tokaistiin "alhaisin pulssi, korkein taksa". Tutkimusnäyttöön perustuvan kansallisen Käypä hoito-suosituksen määritelmän mukaan kestävyysliikunta eli aerobinen liikunta on ”suuria lihasryhmiä vähintään kohtalaisesti (suhteessa toteuttajansa suorituskykyyn) kuormittavaa, yleensä ainakin kymmeniä minuutteja (yhtäjaksoisesti tai jaksoittain) kestävää, aineenvaihduntaa ja hengitys- ja verenkiertoelimistöä kehittävää ja tällaisessa liikunnassa jaksamista ylläpitävää tai lisäävää liikuntaa”. 11 SYVENTÄVÄÄ TIETOA Myyttinen aamuaerobinen treeni faktoja puolesta ja vastaan Aerobisella liikunnalla on tutkitusti monia terveyshyötyjä. Aerobisen harjoittelun seurauksena mm. kehon kyky vastustaa väsymystä paranee ja verenkiertoelimistön kyky kuljettaa happea paranee mm. hiussuoniston tilavuuden kasvaessa, happea sitovan hemoglobiinin määrän lisääntyessä verenkierrossa, punasolujen määrän lisääntyessä sekä sydämen iskutilavuuden laajentuessa. Toistuvassa kestävyystyyppisessä harjoittelussa keho oppii myös käyttämään rasvoja paremmin energiakseen silloin, kun hiilihydraatteja (glykogeenivarastot) ei ole käytössä. Aerobisella harjoittelulla on myös myönteisiä hermostollisia ja hormonaalisia vaikutuksia. Tunnetuimpia lienee endorfiinin lisääntynyt eritys, josta aiheutuu liikunnan jälkeinen hyvä olo ja mieli. Matalatehoiseen aerobiseen harjoitteluun liittyen puhutaan kansanomaisesti myös rasvanpolttoliikunnasta tai liikkumisesta rasvanpolttosykkeellä, jolla tarkoitetaan noin 60-70 %:lla maksimisykkeestä tehtävää harjoitusta. Tässä esseessä pureudutaan erityisesti aamulla ennen aamiaista tehtävään aerobiseen harjoitteluun liittyviin myytteihin ja totuuksiin. Aamulla tehtävän aerobisen harjoituksen vaikutuksia päivä- tai ilta-aerobiseen treeniin verrattuna Yöunen aikana ihmisellä verenpaine alenee verrattuna diurnaaliseen eli päivänaikaiseen verenpaineeseen, mikä laskee verenkiertoelimistön stressiä. Sekä akuutista aerobisesta harjoituksesta aiheutuva madaltunut verenpaine että unen laatu voivat vaikuttaa tähän luontaiseen alenemisreaktioon. Kimberly Fairbrotherin ym. (2014) tutkimuksessa selvitettiin aerobisen harjoituksen ajoituksen vaikutusta elimistön sisäiseen vuorokausirytmiin liittyviin verenpaineen muutoksiin ja unen struktuuriin. Tutkimuksessa saatiin selville, että harjoitus aamuseitsemältä (klo 7) aiheutti suuremman pudotuksen öiseen systoliseen verenpaineeseen kuin jos sama harjoitus tehtiin iltapäivällä (klo 13) tai illalla (klo 19). Iltapäivän harjoitukseen verrattuna aamuharjoitus pidensi syvän unen vaihetta. Myös Yamanakan ym. (2015) tutkimuksessa aamulla ja illalla tehdyllä harjoituksella huomattiin olevan erilaisia vaikutuksia. Aamulla tehty harjoitus tehosti pitkällä aikavälillä parasympaattisen hermoston toimintaa, mitä osoitti sydämen sykkeen vaihteluvälin laajeneminen yöunien aikana. Iltaharjoittelu aktivoi sympaattisen hermoston toimintaa, mitä indikoi sydämen sykkeen nousu harjoitusta seuraavan yön unen aikana. Nämä aamu- ja iltaharjoittelun erilaiset vaikutukset heijastuvat sykemuutosten lisäksi mm. melatoniinin erityksen vuorokausirytmiin (iltaharjoitus siirsi melatoniinin erityksen aloitusvaihetta myöhemmäksi). Aamulla tehty harjoitus rauhoittaa sydäntä ja auttaa lihaksia palautumaan yön aikana, kun taas iltaharjoittelu kiihdyttää sydän- ja verisuonielimistön toimintaa yöunien aikana. Harjoituksen jälkeinen verenpaineen lasku on suurempi ilta/iltapäivä- kuin aamuharjoituksen jälkeen. Toisaalta tämä harjoituksen jälkeinen laskuefekti voi aamuisin naamioitua verenpaineen vaihtelun normaaliin vuorokausirytmiin, jossa aamuisin verenpaine on iltaa korkeammalla. De Briton yms. (2015) tutkimuksessa selvisi, että aamuharjoituksessa systolisen verenpaineen laskuefekti on suhteessa suurempi huomioitaessa verenpaineen luontainen vuorokausivaihtelu. Tähän aamutreenin jälkeiseen laskuefektiin liittyy myös sydämen sykkeen maltillisempi nousu sekä pienempi nousumuutos sympaattisen hermoston ja vagus hermon (parasympaattisen hermoston kehoa rauhoittava ja stressiä vähentävä hermo) tasapainotilassa treenin jälkeen. Iltatreenin jälkeiseen verenpaineen laskuun liittyi verisuonien välitöntä laajenemista, minkä seurauksena aamutreeniä voidaan pitää iltatreeniä parempana vaihtoehtona stressin vähentämisessä. Arjessa puhutaan usein aamuaerobisen treenin hyödyistä painonhallinnassa ja laihduttamisessa. Alizadehin yms. (2015) tutkimuksessa kuitenkin havaittiin, että aamulla tehtävästä aerobisesta treenistä ei ole iltapäivällä tehtyyn treeniin verrattuna merkittäviä painonhallinnallisia etuja ylipainoisilla. Harjoitusaika ei siis vaikuttanut ruokahaluun ja ruoan vetoisuuteen. Toisaalta kyseisessä tutkimuksessa selvisi, että aamuaerobinen treeni saattaa lisätä kylläisyydentunnetta hieman päivällä tehtävää harjoitusta enemmän. Tämä ei kuitenkaan vaikuttanut tutkittavien kokonaisenergiankulutukseen. Toisessa hyvin spesifiin ryhmään, vaihdevuotisiin naisiin, kohdistuvassa Ammarin (2015) tutkimuksessa saatiin tuloksia, joiden mukaan aamulla tehdyn aerobisen harjoituksen myönteiset terveysvaikutukset eivät yllä myöhään iltapäivällä (klo 17) tehdyn aerobisen harjoituksen vaikutuksiin. Vaihdevuodet saattavat nostaa riskiä korkeaan verenpaineeseen ja verenpainetautiin sekä epätavalliseen lipidiprofiiliin (kokonaiskolesteroli-, SBP-, DBP-, HDL-, LDL- & TG-arvot). Tutkimuksessa tutkittiin pelkän lääkityksen, lääkityksen ja aamuaerobisen harjoittelun, sekä lääkityksen ja iltapäiväaerobisen harjoittelun vaikutuksia verenpaineeseen ja lipidikoostumukseen 49-60-vuotiailla naisilla. Tutkimuksen tulokset osoittivat tilastollisesti merkitsevät erot kaikkien em. ryhmien välillä. Eniten systolinen ja diastolinen verenpaine laskivat iltapäivällä harjoitelleilla naisilla. Myös lipiditasot olivat tilastollisesti merkittävän erilaiset kaikilla ryhmillä - jälleen iltapäivätreenaajien eduksi. PSST! Tämä kirjoitus on essee ja käsittelee aihetta useiden yliopistotutkimusten tuloksia tutkiskellen. 12 Aamuaerobinen treeni - aamiaisella vai ilman Ajatus tyhjällä vatsalla tehdyn aamuaerobisen harjoituksen tehokkuudesta rasvanpoltossa perustuu yön aikana tapahtuvaan elimistön hiilihydraattivarastojen tyhjenemiseen, jolloin aamulla tyhjällä vatsalla tehdyssä aerobisessa treenissä elimistön on otettava energiansa muualta eli muutettava rasvaa treenissä tarvitsemakseen energiaksi. Kuitenkin Hulmin (2013) mukaan rasvanpolttoa ajatellen on tyhjällä vatsalla tehdyn aamuaerobisen treenin etu varsin vähäinen. Seuraavassa esittelen Hulmin blogikirjoitusta mukaillen muutamia argumentteja tyhjällä vatsalla tehdyn aamuaerobisen treenaamisen puolesta ja vastaan. Aamuaerobinen treeni ennen aamiaista voi olla miellyttävämpää kuin täydellä vatsalla aamiaisen jälkeen: olo on kevyt ja treenillä on virkistävämpi vaikutus. Treenaaminen ennen aamiaista saattaa olla myös ajankäytöllisesti kätevää, sillä aikaa ruoan sulatteluun ei työaamuina ennen harjoitusta välttämättä ole. Yöunien eli pienimuotoisen paaston jälkeen treenaaminen saattaa ainakin epäterveellisellä ruokavaliolla tehostaa glukoositoleranssia ja insuliiniherkkyyttä, mikä esim. Van Proeyenin (2011) tutkimuksen mukaan edistää terveyttä. Samassa tutkimuksessa havaittiin myös, että rasvojen hapetuskapasiteetti eli tuttavallisemmin rasvanpoltto tehostui ja harjoitusvaste parantui joillain kestävyysurheilijoilla tyhjällä vatsalla treenatessa. Nämä ilmiöt perustuvat pitkälti juuri lihasten glykogeenivarastojen keskimääräistä tyhjempään tilaan aamulla. Samanaikaisesti treenissä tarvittu energia kehossa saadaan tehostamalla ja lisäämällä rasvojen hapetusta. Gonzalesin ym. (2013) tutkimuksessa selvisi, että osalla tutkittavista ruoan kulutus oli pienempää päivinä, joina he olivat tehneet aamuaerobisen harjoituksen ilman aamiaista. Aamiaisen nauttineilla ei tällaista eroa ollut eli jonkinlaista yhteyttä näläntunteen vähenemiseen saattaa paastossa tehdyllä aerobisella aamutreenillä olla. Tyhjällä vatsalla tehdyn aerobisen aamutreenin lisähyödyt aamiaisen jälkeen tehtyyn vastaavaan treeniin verrattuna ovat pääosin lähes olemattomia ja joissain tapauksissa tyhjällä vatsalla treenaamisesta voi olla jopa haittaa. Tyhjällä vatsalla treenatessa huono olo saattaa yllättää ja harjoituksen teho laskea. Pienikin energia- tai proteiinilataus ennen harjoitusta tai sen aikana mahdollistaa treenin tehostumisen. Aamuisin suorituskyky on alhaisempi kuin muina vuorokauden aikoina. Toisaalta aamuaerobisessa treenissä ei monesti tarkoituksena ole kovatehoisen treenin tekeminen. Paastotilassa tehdyn aamuaerobisen harjoituksen haittana on se, että lihaskatabolia ei lihasproteiinin käyttö energiaksi lisääntyy (Lemmon & Mullin 1980). Wilsonin ym. (2012) tutkimuksessa selvisi, että monta kertaa viikossa kovaa aerobisesti treenaavilla lihasmassa kärsii: usein, kovaa ja aerobisesti liikkuvilla voimaharjoittelijoilla lihasten kasvu vähenee. Liikunnan aikainen rasvan hapetus energiaksi on lopputuloksen eli kehon rasvavarastojen vähenemisen kannalta varsin pikkuruisessa roolissa. Lopputulos eli harjoituksen jälkeisten päivien ja viikkojen aikana kehossa tapahtuneet muutokset rasvan määrässä ratkaisevat. Esimerkiksi korkeaintensiteettinen intervalliharjoittelu (HIIT-High Interval Training) näyttäisi Gibalan ym (2012) tutkimuksen mukaan toimivan elimistön rasvan vähentämisessä yhtä hyvin kuin pidempikestoinen rasvanpolttosyketreeni. Paastossa tehty aamuaerobinen harjoitus ei merkitsevissä määrin tehosta rasvanpolttoa pitkällä aikavälillä verrattuna harjoitukseen, jota edeltää ruokailu. Shimadan ym (2013) tutkimuksessa havaittiin, ettei 24 tunnin aikaisessa energiankulutuksessa ollut eroa aamiais- ja paastotreenaajilla. Tutkimuksessa havaittiin pieni ero harjoituksen aikaisessa rasvanpoltossa paastoajien eduksi. Toisaalta tutkimukset (Paoli ym. 2011 & Hulmi ym. 2005) osoittavat, että harjoitusta edeltävän ravinnon, etenkin proteiinin, nauttiminen lisää liikunnan aikaista ja sen jälkeistä energiankulutusta, sekä kohottaa proteiinisynteesiä, johon toisaalta myös kuluu energiaa. Van Proyenin (2011) kuusiviikkoisella tutkimusjaksolla osoittautui, ettei yön jälkeisessä paastossa tehty aamuaerobinen harjoitus vähentänyt kehon painoa enempää kuin sokeripitoisen aamiaisen jälkeen tehty. Tässä tutkimuksessa kehon koostumusta ei tutkittu. Paastolla aamuaerobiseen treeniin lähtevien, painonpudotuksesta haaveilevien harjoittelijoiden on hyvä pitää mielessä, että pelkän liikunnan merkitys laihdutuksessa on vähäinen. Liikunnan lisäksi tarvitaan ravintosuositusten mukaista ravitsemusta ja itsekuria syömisen suhteen, jos mielessä on laihduttaminen. Ravinnon ja ruokailutottumusten muutokset ovat painonpudotuksessa merkittävässä roolissa. Liikunta on hyvä apukeino saavutettujen laihdutustulosten ylläpitämisessä ja itsessään terveyttä edistävää riippumatta siitä, harrastaako sitä syömisen jälkeen tai paastossa. Mitä tästä kaikesta pitäisi ajatella? Kaikkiaan ei näyttäisi olevan merkittävää vaikutusta sillä, tekeekö aamuaerobisen harjoituksen tyhjällä vatsalla vai aamiaisen jälkeen. Painonhallinnan näkökulmasta kyse on kokonaiskulutuksesta eli siitä, että energian saanti ja kulutus ovat tasapainossa. Harjoittelun tavoitteet (esim. kunnon kohentuminen, kiinteytyminen tai painonpudotus) ratkaisevat, kannattaako ennen treeniä syödä vai ei. Tutkimuksissa havaittiin myös yksilöllisiä eroja rasvanpolttotehokkuudessa harjoituksen aikana sen mukaan, tehtiinkö treeni tyhjällä vai täydellä vatsalla. Oman kehon tuntemuksia on tärkeää treenatessa kuunnella. Rasvanpoltto on suhteellisesti tehokkainta, kun tehdään töitä sykkeen aerobisella alueella (ns. rasvanpolttosyke). Absoluuttisesti eniten rasvaa palaa silti kovatehoisessa liikunnassa. Liikuntasuositusten mukaan (UKK-instituutin liikuntapiirakka 18-64-vuotiaille) aikuisen tulisi harrastaa kestävyyskuntoa parantavaa aerobista liikuntaa vähintään tunnin ja 15 minuuttia viikossa rasittavasti tai kaksi ja puoli tuntia reippaasti. Aerobinen harjoittelu on 13 harjoitteluajankohdasta riippumatta terveyttä edistävää ja tekee hyvää niin keholle kuin mielelle. Aerobisen treenin ajankohdan valinnalla voi olla yksilöllinen merkitys ihmiselle riippuen siitä, miten hänen arkensa aikataulut rakentuvat. Harjoituksen tekeminen aamulla voi olla päivä- ja iltatreeniin verrattuna suositeltavaa matalamman stressitason, rauhoittumisen, nukahtamisen ja levollisen unen kannalta. Lähteet: Kimberly Fairbrother, Ben Cartner, Jessica R Alley, Chelsea D Curry, David L Dickinson, David M Morris and Scott R Collier: Effects of exercise timing on sleep architecture and nocturnal blood pressure in prehypertensives. Vasc Health Risk Manag. 2014; 10: 691–698. Yamanaka Y, Hashimoto S, Takasu NN, Tanahashi Y, Nishide SY, Honma S, Honma K: Morning and evening physical exercise differentially regulate the autonomic nervous system during nocturnal sleep in humans. Am J Physiol Regul Integr Comp Physiol. 2015 Nov 1;309(9):R1112-21 Alizadeh Z, Mostafaee M, Mazaheri R, Younespour S.: Acute Effect of Morning and Afternoon Aerobic Exercise on Appetite of Overweight Women. Asian J Sports Med. 2015 Jun;6(2):e24222. Ammar T.: Effects of aerobic exercise on blood pressure and lipids in overweight hypertensive postmenopausal women. J Exerc Rehabil. 2015 Jun 30;11(3):145-50. de Brito LC, Rezende RA, da Silva Junior ND, Tinucci T, Casarini DE, Cipolla-Neto J, Forjaz CL.: Post-Exercise Hypotension and Its Mechanisms Differ after Morning and Evening Exercise: A Randomized Crossover Study. PLoS One. 2015 Jul 17;10(7):e0132458. Juha Hulmi: Tyhjällä mahalla tehty aamuaerobinen – totuus? 2013. Blogikirjoitus. https://lihastohtori.wordpress.com/2013/02/17/tyhjalla-mahalla- aamuaerobinen-j/ Luettu 16.10.2021  Gibala MJ, Little JP, Macdonald MJ, Hawley JA: Physiological adaptations to low-volume, high-intensity interval training in health and disease. J Physiol. 2012 Mar 1;590(5):1077-84.  Gonzalez JT, Veasey RC, Rumbold PL, Stevenson EJ: Breakfast and exercise contingently affect postprandial metabolism and energy balance in physically active males.Br J Nutr. 2013 Aug;110(4):721-32.  Hulmi JJ1, Volek JS, Selänne H, Mero AA: Protein ingestion prior to strength exercise affects blood hormones and metabolism. Med Sci Sports Exerc. 2005 Nov;37(11):1990-7.  Lemon PW, Mullin JP: Effect of initial muscle glycogen levels on protein catabolism during exercise. J Appl Physiol Respir Environ Exerc Physiol. 1980 Apr;48(4):624-9.  Paoli A, Marcolin G, Zonin F, Neri M, Sivieri A, Pacelli QF: Exercising fasting or fed to enhance fat loss? Influence of food intake on respiratory ratio and excess postexercise oxygen consumption after a bout of endurance training. Int J Sport Nutr Exerc Metab. 2011 Feb;21(1):48-54.  Shimada K, Yamamoto Y, Iwayama K, Nakamura K, Yamaguchi S, Hibi M, Nabekura Y, Tokuyama K: Effects of post-absorptive and postprandial exercise on 24 h fat oxidation. Metabolism. 2013 Jun;62(6):793-800.  Van Proeyen K, Szlufcik K, Nielens H, Ramaekers M, Hespel P: Beneficial metabolic adaptations due to endurance exercise training in the fasted state. J Appl Physiol (1985). 2011 Jan;110(1):236-45.  Wilson JM, Marin PJ, Rhea MR, Wilson SM, Loenneke JP, Anderson JC: Concurrent training: a meta-analysis examining interference of aerobic and resistance exercises. J Strength Cond Res. 2012 Aug;26(8):2293-307. 14 Tehtävä 8: Ensiaputaidot Ensiapu on loukkaantuneelle tai sairastuneelle henkilölle tapahtumapaikalla usein nopeasti annettavaa apua, jolla pyritään turvaamaan autettavan peruselintoiminnot sekä estämään hänen tilansa paheneminen. Ensiavun käsite pitää sisällään monenlaisia auttamisen taitoja; se voi olla tilanteesta riippuen esimerkiksi hätäkeskukseen soittamista, tilannearvion tekemistä onnettomuuspaikalla, sairauskohtauksissa auttamisen taitoja, haavojen sidontaa, henkistä tukemista, tukehtumisen estämistä tai paineluelvytystä. Ensiapua ja hätäensiapua voidaan antaa, vaikka antajalla ei olisi erityistä ammattitaitoa tai välineitä. Usein maallikon antama apu parantaa huomattavasti apua saavan mahdollisuuksia selviytyä ja toipua. LähiTapiolan Arjen katsaus –kyselyn (n=1026) tulosten mukaan noin 36% ihmisistä osaisi oman arvionsa mukaan antaa ensiapua liikenneonnettomuuden sattuessa. Valitaan viiden hengen satunnainen otos suomalaisia. Asetetaan satunnaismuuttujaksi X otokseen valittujen liikenneonnettomuustilanteessa ensiaputaitoisten henkilöiden lukumäärä. a) Perustele, mitä jakaumaa satunnaismuuttuja X noudattaa ja miksi. b) Muodosta satunnaismuuttujan X jakauma, esitä se taulukossa ja selvitä, mikä on sen todennäköisin arvo. Lisää aiheesta: Ensiapuohjeita eri tilanteisiin, Suomen Punainen Risti. Maailman elvytyspäivä 16.10.(WorldRestartAHeart) ja biisejä elvytystilanteeseen, SPR ja Sydänliitto. Arjen katsaus –kysely 2021: Miten suomalaiset toimivat liikenneonnettomuuden sattuessa, LähiTapiola. Auttamisen taitoja harjoitellaan suomalaiskouluissa jo alakoulusta lähtien ja moni suomalainen käy ensiapukurssin tai – kursseja. Suomen Punaisen Ristin (SPR) Ensiapukurssi EA 1® - koulutus on virallinen sertifioitu koulutus, josta saa Punaisen Ristin ensiapukortin eli pätevyystodistuksen. Kurssin suorittanut hallitsee ensiavun antamisen perusteet kurssin sisällön mukaisissa aiheissa. SPR Ensiapukurssi EA 1® -todistus on voimassa 3 vuotta. PSST! Bee Gees yhtyeen Stayin' Alive –kappaleessa on oikea rytmi (104 lyöntiä minuutissa) paineluelvytyksen antamiseen. Kappale on esimerkiksi Amerikan sydänliiton (the American Heart Association) suosittelema elvytyksen taustalle. 15 Tehtävä 9: Koulukiusaaminen Koulukiusaaminen on koulussa tai muussa oppilaitoksessa tapahtuvaa psyykkistä, sosiaalista tai fyysistä väkivaltaa, joka on tarkoituksellista ja toista vahingoittavaa. Kiusaaminen on sen uhrille henkisesti vahingollista ja voi aiheuttaa traumoja, jotka saattavat jatkua läpi elämän. Kouluterveyskyselyssä 2021 yhteensä 91 560 8. ja 9. luokkalaiselta kysyttiin: ”Kuinka usein sinua on kiusattu koulussa tämän lukukauden aikana?” Merkitään edellä mainittua kiusaamisen yleisyyttä kartoittavaa kysymystä diskreetillä satunnaismuuttujalla X. Alla olevan taulukon jakauma mukailee saatuja tuloksia. a) Laadi jakaumasta pylväsdiagrammi. b) Määritä suhteellinen frekvenssi f%, summafrekvenssi sf ja suhteellinen summafrekvenssi sf%. c) Selvitä, millä todennäköisyydellä 8. tai 9. luokan opiskelija on joutunut kiusaamisen uhriksi lukukauden aikana. Lisää aiheesta: Tietoa koulukiusaamisesta, KiVa Koulu Niko Tiuraniemen tarina kiusatuksi joutumisesta, Yle 20.2.2022 Kiusaamisen yleisyys yläkoulussa ja toisella asteella vuosina 2006-2021, THL Kouluterveyskysely Kiusaamisen vastainen toimenpideohjelma KiVa Koulu, KiVA Koulu –ohjelma ja Turun yliopisto Koulukiusaamisen vastaisten ohjelmien arviointi, Yle 20.10.2021 Harjoituksia mielenterveyden vahvistamiseen, Suomen Mielenterveys ry Koulukiusaaminen on maailmalla ja sitä ehkäiseviä asioita, Unesco, The Global Education 2030 Agenda –hanke x f useita kertoja viikossa 2 106 noin kerran viikossa 3 388 harvemmin 17 213 ei lainkaan 68 853 Koulukiusaamisella on niin yksilö-, yhteisö- kuin väestötasonkin seurauksia. Kiusaaminen aiheuttaa turvattomuuden tunnetta sekä kiusatulle että hänen koululuokalleen. Se on vakava uhka hyvinvoinnille ja terveydelle, ja voi aiheuttaa mm. itsetunto-ongelmia, ahdistuneisuutta, yksinäisyyttä ja vaikeutta luottaa muihin ihmisiin. Kiusaaminen voi jättää jälkensä kiusattuun pysyvästi ja olla yhteydessä psyykkisen ja sosiaalisen terveyden sekä työelämässä menestymisen ongelmiin myös aikuisuudessa. Kiusaamisen kova hinta näkyy sekä sen inhimillisissä että kansanterveydellisissä kustannuksissa. Alla olevat kuvat Unescon Behind the numbers: Ending school violence and bullying –raportista (2019). 16 Tehtävä 10: Terveyspalveluiden käyttö eri ikäryhmissä Tutkitaan iän ja terveyskeskuskäyntien välistä yhteyttä. Alla olevassa kuviossa on esitetty perusterveydenhuollon käynnit** palvelumuodoittain ja ikäryhmittäin vuonna 2017 (Lähde: Suomalaisten sosiaali- ja terveyspalveluiden käyttö tilastojen valossa). a) Laadi pylväskuvion pohjalta taulukko perusterveydenhuollon käyntien lukumääristä eri ikäryhmissä 100 000 käynnin tarkkuudella. Muodosta taulukon pohjalta hajontakuvio. b) Sovita aineistoon lineaarinen malli ja toisen asteen polynominen malli. c) Määritä mallien selitysasteet ja lineaarisesta mallista iän ja terveyskeskuskäyntien välinen korrelaatiokerroin. Tulkitse riippuvuuden voimakkuutta ja pohdi tulosta mahdollisesti vääristäviä tekijöitä. Alle kouluikäisillä lapsilla lastenneuvolapalvelut ovat yleisin palvelumuoto. Työikäiset käyttävät eniten avosairaanhoidon ja työterveyshuollon palveluja sekä äitiysneuvolapalveluja. Vanhimmissa ikäryhmissä avosairaanhoito ja kotisairaanhoito ovat merkittävimmät palvelumuodot. PSST! Suomalaisten terveys on parantunut viime vuosikymmeninä paljon, mutta siitä huolimatta terveyserot eivät ole kaventuneet eri väestöryhmien välillä. Muun muassa henkilön ikä, sukupuoli, asuinalue, siviilisääty, äidinkieli ja sosioekonominen asema vaikuttavat kukin osaltaan yksilön terveyteen, mutta myös terveyteen väestötasolla luoden eriarvoisuutta väestöryhmien välille. Esimerkiksi terveys- ja toimintakyky heikkenevät iän myötä, miehet sairastavat naisia enemmän sydän- ja verisuonitauteja, asuinalueiden erilaiset elinolosuhteet (kuten työllisyystilanne, elämänmeno, sosiaali- ja terveyspalveluiden saavutettavuus) heijastuvat kansantautien sairastavuuteen, parisuhteessa elävien koettu terveys on parempi ja elinikä pidempi kuin yksineläjillä ja suomenruotsalaiset ovat suomenkielisiä terveempiä. Mitä parempi on henkilön sosioekonomisen asema, sitä terveempi ja hyvinvoivempi hän todennäköisesti on. Vähäinen koulutus, epävarma ja heikko ammatillinen asema (pienituloisuus) sekä vähäinen varallisuus ovat vahvasti yhteydessä toisiinsa sekä huonon terveyden ja pahoinvoinnin kasaantumiseen. Erot terveyskäyttäytymisessä, kuten tupakoinnissa ja alkoholinkäytössä, selittävät arviolta noin puolet terveyden sosioekonomisista eroista. Sosioekonomiseen asemaan liittyvät terveyserot ovat monimutkainen toisiinsa linkittyvien syiden ja seurausten vyyhti. Yhteiskunnalliset rakenteet vaikuttavat sosioekonomisen aseman muotoutumiseen ja terveyttä heikentävän sosiaalisen eriarvoisuuden syntyyn. Kuitenkin yksi suomalaisen terveyspolitiikan perusperiaatteista on tarjota jokaiselle terveydentilan edellyttämät riittävät ja laadukkaat palvelut sosioekonomisesta asemasta, taloudellisista edellytyksistä tai asuinalueesta riippumatta. Käytännössä erot terveysosaamisessa sekä terveyteen liittyvissä tiedoissa ja taidoissa aiheuttavat sen, että eri sosioekonomisessa asemassa olevat henkilöt eivät ole yhdenvertaisia palveluihin hakeuduttaessa. Lisäksi esim. asuinalue ja ikä vaikuttavat palveluiden saatavuuteen ja saavutettavuuteen. Edellä mainituista syistä perusterveydenhuollon palveluiden käyttö vaihtelee eri väestöryhmissä. * Sisältää päihdetyön, perhesuunnittelu-, ehkäisy-, kasvatus- ja perheneuvolapalvelut sekä muut neuvolapalvelut, seulonnat ja joukkotarkastukset, apuvälinepalvelut, puhe- toiminta-, jalka- ja ravitsemusterapian, terveyssosiaalityön, muut kuntoutus- ja erityisterapiat, päivätoiminnan, päiväsairaalatoiminnan sekä muun palvelutoiminnan. ** Perusterveydenhuollon avohoidon käynnit vastaanotolla, kotikäynnit, työpaikkakäynnit ja sairaalakäynnit. 17 TIETOTÖÖTTÄYS Rokote - miksi piikille? Rokotteista, rokottautumisesta ja rokoteohjelmista on käyty eri medioissa kiivasta keskustelua viime vuosina. Huomiota ovat saaneet muun muassa 2009-2010 Pandemix-sikainfluenssarokotteesta aiheutuneet narkolepsiatapaukset ja puutiaisaivokuumerokote, johon keväästä 2018 alkaen riskialueilla asuvat yli kolmevuotiaat henkilöt ovat olleet oikeutettuja osana kansallista rokotusohjelmaa. Keväällä 2017 keskustelua herätti Keski-Euroopasta matkailijoiden mukana Suomeen paluun tehnyt erittäin tarttuva tuhkarokko, jolla on ikäviä jälkitauteja ja jota vastaan suomalaisia 60- ja 70- luvuilla syntyneitä on harvoin rokotettu. Maaliskuusta 2020 lähtien on medioissa hetki hetkeltä seurattu Covid-19-viruksen leviämistä maailmalla ja Suomessa. Rokotteista saadut sivuoireet sekä yksittäisten henkilöiden tarinat niistä ovat saaneet julkisuutta mm. sosiaalisessa mediassa. Oireiden ja tarinoiden on arveltu vaikuttaneen rokotekriittisyyden lisääntymiseen ja rokotekattavuuden laskuun osassa Suomea. Rokotteista kieltäytymistä perustellaan sivuoireiden lisäksi mm. taipumuksella lieväoireiseen sairastamiseen. Osa tautitartunnan saaneista saa vain lieviä oireita, mutta toisilla taudin aiheuttamat oireet saattavat olla hengenvaarallisia esimerkiksi elimistön immuunijärjestelmän heikon tilan, korkean iän tai sairauden vuoksi. Rokottamisessa kyse ei ole vain omasta terveydestä ja mukavuudesta, vaan läheisten ja muiden ihmisten terveydestä ja toisinaan jopa elämästä. Rokotekriitikot ovatkin saaneet asiantuntijoilta tiukkaa palautetta rokottamatta jättäytymisen kansanterveydellisesti vakavista seurauksista. Rokotekielteisyys on huolestuttava trendi, sillä rokotteen antama suoja perustuu paitsi tartunnan todennäköisyyden pienenemiseen rokotetulla, niin myös laumasuojaan eli laumaimmuniteettiin: riittävän monen rokottauduttua, myös rokottamattomat ovat suojassa taudin leviämisen estyessä populaatiossa. Päivä- ja iltapäivälehtien sekä somekanavien keskusteluista voi huomata monen kuvittelevan rokottautumisen estävän taudin tarttumisen kokonaan. Todellisuudessa on kyse taudin tarttumisen vaikeutumisesta eli tartunnan todennäköisyyden pienenemisestä. Ihmiselimistössä on satunnaistavia tekijöitä myös immuunijärjestelmän toiminnassa, joten rokotuskaan ei takaa täydellistä suojaa. Rokotekattavuuden eli rokotettujen osuuden koko populaatiosta on oltava riittävän laaja, jotta myös ne, joiden ei ole mahdollista ottaa rokotetta esimerkiksi iän, perussairauden tai heikon terveydentilan vuoksi, olisivat turvassa taudilta. Monissa infektiotaudeissa laumaimmuniteettiin riittävä rokotettujen osuus on noin 95 % populaatiosta, mutta osuus vaihtelee taudin tarttuvuuden mukaan. Laumaimmuniteettiin liittyviä todennäköisyyslaskennan ongelmia tarkastellaan tehtävässä 11 (sivu 20). Tehtävä mukailee Mark Chu- Carrollin blogikirjoituksessaan (http://www.goodmath.org/blog/2015/02/05/quick-vaccine-math/ ) esittämää havainnollistusta. "Vauva rokotettavana äitiysneuvolassa vuonna 1961”, Museoviraston kuvakokoelmat (Museiverkets Bildsamlingar). Kuvakokoelman lisenssi: CC BY-NC-ND 2.0. Lisenssikopio saatavilla osoitteessa: https://creativecommons.org/licenses/by-nc-nd/2.0/ 18 TEORIATAUSTAA TEHTÄVIIN 11 JA 12: Ehdollinen todennäköisyys ja kertolaskusääntö Ehdolliseen todennäköisyyteen liittyvästä ongelmasta on kyse, kun halutaan laskea jonkin tapauksen A todennäköisyys silloin, kun tapaus B on jo sattunut. Ehdollista todennäköisyyttä merkitään P(A|B), jonka voi lukea esimerkiksi seuraavasti: "todennäköisyys, että A tapahtuu, kun B on tapahtunut". Ehdollinen todennäköisyys P(A|B) voidaan määritellä kahdella tavalla: joko tapahtuman A todennäköisyytenä supistetussa otosavaruudessa B tai alkuperäisen otosavaruuden  todennäköisyyksien avulla. Jälkimmäisen määrittelytavan avulla voidaan johtaa seuraavaksi esiteltävät ehdolliseen todennäköisyyteen liittyvät tulokset. Todistus (SYVENTÄVÄÄ TIETOA) Leikkauksen todennäköisyys saadaan ratkaisemalla ehdollisen todennäköisyyden P(A|B) kaavasta leikkauksen P(A∩B) todennäköisyys. Vastaavasti leikkauksen P(A∩B) todennäköisyys saadaan myös ratkaistua ehdollisen todennäköisyyden P(B|A) kaavasta seuraavasti 𝑃(𝐵|𝐴) = 𝑃(𝐴 ∩ 𝐵) 𝑃(𝐴) , jos 𝑃(𝐴) > 0 jolloin 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵|𝐴)𝑃(𝐴). ∎ Seuraavaksi esiteltävät Määritelmä 3 ja Lauseet 2 ja 3 eivät yleensä kuulu lukion pitkän matematiikan Tilastot ja todennäköisyys - opintojakson sisältöön. Ne ovat kuitenkin ehdollisen todennäköisyyden yleistyksiä, joiden tuntemus lisää aihepiirin soveltamisen mahdollisuuksia. Määritelmä 1 Jos P(B) > 0, niin ehdollinen todennäköisyys P(A|B) on tapauksen A todennäköisyys otosavaruudessa B. Määritelmä 2 Jos P(B) > 0, niin ehdollinen todennäköisyys P(A|B) on 𝑃(𝐴|𝐵) = 𝑃(𝐴 ∩ 𝐵) 𝑃(𝐵) . Lause 1 (Kertolaskusääntö) Tapausten A ja B leikkauksen todennäköisyys toteuttaa kaavat 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴|𝐵)𝑃(𝐵), jos 𝑃(𝐵) > 0 ja 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵|𝐴)𝑃(𝐴), jos 𝑃(𝐴) > 0. Määritelmä 3 Tapaukset 𝐴1, … , 𝐴𝑛 muodostavat otosavaruuden  osituksen, jos tapaukset ovat  toisensa poissulkevat   = ⋃ 𝐴𝑖 𝑛 𝑖=1 ja  𝑃(𝐴𝑖) > 0 kaikilla i 19 Todistus (SYVENTÄVÄÄ TIETOA) Osituksen määritelmää (Määritelmä 3) ja summakaavaa apuna käyttäen saadaan: 𝑃(𝐵) = 𝑃(𝐵 ∩) = P(𝐵 ∩ (⋃ 𝐴𝑖 𝑛 𝑖=1 )) = 𝑃(⋃ (𝐵 ∩𝑛𝑖=1 𝐴𝑖)) = ∑ 𝑃(𝐵 ∩ 𝐴𝑖) 𝑛 𝑖=1 = ∑ 𝑃(𝐵|𝐴𝑖) 𝑃(𝐴𝑖) 𝑛 𝑖=1 . ∎ Lauseen 2 kokonaistodennäköisyyskaavalla kokonaistodennäköisyys P(B) saadaan koottua ehdollisista todennäköisyyksistä painottamalla kutakin itse ehdon todennäköisyydellä. Seuraava keksijänsä mukaan nimetty, 1700-luvulla eläneen matemaatikon Thomas Bayesin kehittämä kaava on monesti hyödyllinen ehdollisia todennäköisyyksiä laskettaessa. Todistus (SYVENTÄVÄÄ TIETOA) Ehdollisen todennäköisyyden määritelmästä (Määritelmä 2) ja Lauseesta 1 seuraa 𝑃(𝐴|𝐵) = 𝑃(𝐵 ∩ 𝐴𝑘) 𝑃(𝐵) = 𝑃(𝐵|𝐴𝑘) 𝑃(𝐴𝑘) 𝑃(𝐵) . Koska tapaukset muodostavat otosavaruuden osituksen, niin kokonaistodennäköisyyslauseen (Lause 2) mukaan P(B) voidaan koota ehdollisista todennäköisyyksistä 𝑃(𝐵|𝐴𝑖) painottamalla kutakin ehdollista todennäköisyyttä ehdon todennäköisyydellä 𝑃(𝐴𝑖). Siis 𝑃(𝐴|𝐵) = 𝑃(𝐵|𝐴𝑘) 𝑃(𝐴𝑘) 𝑃(𝐵) = 𝑃(𝐵|𝐴𝑘) 𝑃(𝐴𝑘) ∑ 𝑃(𝐵|𝐴𝑖) 𝑃(𝐴𝑖) 𝑛 𝑖=1 . ∎ Lause 2 (Kokonaistodennäköisyyslause) Jos tapaukset 𝐴1, … , 𝐴𝑛 muodostavat otosavaruuden osituksen, niin 𝑃(𝐵) =∑𝑃(𝐵|𝐴𝑖) 𝑃(𝐴𝑖) 𝑛 𝑖=1 . Lause 3 (Bayesin lause) Jos tapaukset 𝐴1, … , 𝐴𝑛 muodostavat otosavaruuden osituksen ja 𝑃(𝐵) > 0 𝑃(𝐴|𝐵) = 𝑃(𝐵|𝐴𝑘) 𝑃(𝐴𝑘) 𝑃(𝐵) = 𝑃(𝐵|𝐴𝑘) 𝑃(𝐴𝑘) ∑ 𝑃(𝐵|𝐴𝑖) 𝑃(𝐴𝑖) 𝑛 𝑖=1 , 𝑘 = 1,… , 𝑛. 20 Tehtävä 11: Rokotteen rooli taudin leviämisen ehkäisyssä Yksittäiset tautitartunnat puhkeavat populaatiossa tautiaalloksi tartunnan saaneiden määrän kasvaa. Jos jokainen sairastunut tartuttaa enemmän kuin yhden ihmisen, tauti alkaa levitä populaatiossa eksponentiaalisesti. Kuinka suuresta tautiaallosta populaatiossa on kyse, riippuu siitä, kuinka monta kukin sairastunut tartuttaa. Oletetaan, että tauti X on erittäin helposti tarttuva ja jokaista sataa ei-immuunia ihmistä kohden 96 sairastuu kohdatessaan tautia sairastavan henkilön. Oletetaan myös, että tautiin X kehitetty rokote on 95 %:n varma eli 95 ihmistä 100:sta ovat täysin immuuneja taudin tarttumiselle. a) Oletetaan, että ensimmäinen tautiin sairastunut henkilö on tekemisissä kahdenkymmenen terveen kanssa. Tutki, montako ihmistä yksi sairastunut keskimäärin altistaa taudin tartunnalle. Pohdi, pääseekö tauti leviämään populaatiossa epidemiaksi jokaisen populaation jäsenen otettua rokotteen. b) Tutki a-kohdan oletuksin tilannetta, jossa 5 % populaatiosta on jättänyt rokotteen ottamatta. c) Tutkitaan taudin X leviämistä rokottamattomien, ei-immuunien ihmisten n-henkisessä ketjussa sairastuneelta taudinkantajalta S terveelle, ketjun viimeiselle henkilölle 𝑇𝑛, kun S tapaa ensin henkilön 𝑇1, sitten 𝑇1 tapaa henkilön 𝑇2 ja niin edelleen, kunnes jonon toiseksi viimeinen, n-1:s henkilö 𝑇𝑛−1 kohtaa viimeisen henkilön 𝑇𝑛. Oletetaan kohtaamisaikavälien olevan tarttumisen kannalta suotuisat. Vertaile 100 %-rokottautuneen yhteisön tilannetta täysin rokottautumattoman yhteisön tilanteeseen tutkimalla henkilön 𝑇𝑛 tartunnan saamisen todennäköisyyttä eri jonon pituuksilla n=5, n=20 ja yleisessä tapauksessa n. Lisää aiheesta: Infektioiden tartunta, taudin synty ja leviäminen, Duodecim. PSST! Taudin yleisellä leviämiskyvyllä kuvataan sitä, kuinka monta uutta henkilöä yksi sairastunut keskimäärin tartuttaa ympäristössään. Esimerkiksi tuberkuloosipotilas tartuttaa keskimäärin 0,5 henkilöä ja tuhkarokkopotilas 18. Tätä leviämiskyvyn ilmoittamisessa käytettyä lukua kutsutaan R0-luvuksi, joka on sitä suurempi, mitä helpommin tauti leviää. R0-luvun ollessa pienempi kuin 1 tauti ei yleensä aiheuta epidemioita. Käytännössä siihen, kuinka paljon uusia tapauksia kukin sairastunut tartuttaa ja kuinka tehokkaasti tauti leviää yhteisössä, vaikuttaa myös ihmisyhteisön tiiviys, ihmisten käyttäytyminen ja minkä pituisesta tartuttavavasta vaiheesta on kyse. Tietyissä yhteisöissä, kuten perheissä, päiväkodeissa ja puolustusvoimien kasarmeissa, leviävät herkästi sellaisetkin taudit, joiden leviämiskyky muuten on vähäinen esim. kausi-influenssat. 21 Tehtävä 12: Tautitestin luotettavuustarkastelu Moni virus, kuten tässä tehtävässä tutkittava HI-virus, voidaan havaita pääosin terveyskeskuksissa ja sairaaloissa tehtävillä testeillä. Tällaisia ovat esimerkiksi verinäytteestä tehtävät vasta-aine- ja antigeenitestit. Oletetaan, että HI-virusta kantaa väestössä kolme ihmistä tuhannesta. Jos ihmisellä on HI-virus, tietty testi ilmoittaa 95 % varmuudella, että ihmisellä on kyseinen virus. Jos taas ihmisellä ei ole virusta, testi ilmoittaa 95 % varmuudella, että ihmisellä ei ole virusta. Oletetaan myös sekä väärien positiivisten että väärien negatiivisten testituloksien osuuden olevan kummankin 5 %. Millä todennäköisyydellä a) testitulos on positiivinen, b) testitulos on negatiivinen, c) ihmisellä on virus, jos tiedetään testituloksen olevan positiivinen, d) ihmisellä ei ole virusta, jos tiedetään testituloksen olevan positiivinen? Pohdi testin luotettavuutta. e) Tarkastellaan tilannetta Etelä-Karjalassa, jossa oli vuonna 2017 Suomen korkein HIV-ilmaantuvuus (6,1/100 000). Oletetaan muutoin tehtävänannon tiedot testistä oikeiksi. Millä todennäköisyydellä positiivisen testituloksen saaneella henkilöllä ei ole virusta? Lisää aiheesta: HIV sairautena, Hivpoint (Hiv-säätiö). PSST! HIV on krooninen autoimmunologinen sairaus, jonka aiheuttaa HI-virus. Viruksen aiheuttamille haitoille ei toistaiseksi ole löydetty parannuskeinoa, mutta lääkehoidoilla pystytään pitämään viruksen aiheuttamat vauriot hallinnassa. Taudin varhainen toteaminen on tärkeää, jotta hoito toteutuu parhaalla mahdollisella tavalla eikä infektoituneen elimistön puolustuskyky laske viruksen tuhotessa valkosoluja, jotka suojaavat elimistöä taudinaiheuttajilta. Hoitamattomana HIV-infektio voi edetä pahimmillaan henkeä uhkaavaan AIDS-vaiheeseen, jossa elimistön puolustusjärjestelmä heikentyy vakavasti. HI-viruksen aiheuttama tartunta voidaan havaita verinäytteestä tehtävällä vasta-ainetestillä. Tämä tehtävä perustuu Richard Isaacin kirjassaan The Pleasures of Probability (s. 31-34) esittämään esimerkkiin HIV-testin luotettavuuden tutkimisesta. Esimerkissä testi on viruksen havaitsemiseksi sikäli hyvä, että jos henkilöllä on virus, sen havaitsemisen todennäköisyys verikokeella on korkea; suuressa ryhmässä, jonka tiedetään koostuvan vain tartunnan saaneista, testi antaa oikean, positiivisen tuloksen 95 prosentilla ryhmästä. Tässä yhteydessä puhutaan testin sensitiivisyydestä, joka edeltävässä tapauksessa on 0.95. Merkitään todennäköisyyttä, että testi on positiivinen henkilön ollessa taudin kantaja, seuraavasti P(testi positiivinen | henkilöllä tauti) = 0.95. Testi siis vaikuttaa intuitiivisesti hyvin luotettavalta. Seuraavaksi keskitytään kuitenkin tutkimaan mahdollisia virhetuloksia, jotka ovat P(testi positiivinen | henkilöllä ei ole virusta) eli väärä positiivinen tulos ja P(testi negatiivinen | henkilöllä on virus) eli väärä negatiivinen tulos. 22 Vihjeet ja vinkit JOHDANTOTEHTÄVÄ: Terveyteen liittyvien ilmiöiden riippumattomuus Harjoituksen tarkoituksena on huomata, että terveyteen liittyvät ilmiöt ovat usein monisyisiä ja voivat liittyä toisiinsa suoraan tai välillisesti. Terveysaiheisia tai muutoin ympäröivän maailman ilmiöihin linkittyviä todennäköisyyslaskennan tehtäviä ratkoessa on siis paikallaan pysähtyä hetkeksi pohtimaan aihetta itseään. Näin pystyy mahdollisesti välttämään tehtävän ratkaisun miinakohdat sekä lopuksi pohtimaan perustellusti saadun tuloksen järkevyyttä ja merkitystä. Tehtävä 1: Lukiolaisten terveystottumuksia ”Neljäsosa opiskelijoista sekä jätti koululounaan syömättä että liikkui alle tunnin päivän aikana”. Neljäsosa eli yksi neljäsosa voidaan tulkita todennäköisyydeksi 1 4 = 25 100 = 0,25. Tilannetta kannattaa hahmotella kuvan (Venn-diagrammi) avulla. Tehtävässä halutaan ratkaista, kuinka todennäköisesti satunnaisesti valittu opiskelija kuuluu joukkoon, joka koostuu niistä opiskelijoista, jotka sekä syövät koululounaan että liikkuvat vähintään tunnin joka päivä. Tähän joukkoon kuulumisen todennäköisyys voidaan ratkaista sen vastatapahtuman todennäköisyyden avulla. Tässä vastatapahtuma on tapaus, jossa opiskelija jättää koululounaan syömättä tai liikkuu alle tunnin päivässä. Kun vastatapahtuman todennäköisyys vähennetään koko otosavaruudesta, saadaan selville kysytyn tapahtuman todennäköisyys. Tehtävä 2: Verenluovutus a) Promillet ovat tuhannesosia ( 1 1000 ) ja prosentit sadasosia ( 1 100 ). Yksi promille (merkitään 1 ‰) on siis prosentin kymmenesosa eli 1 ‰ = 0,1 %. Todennäköisyys sille, että suomalainen kuuluu veriryhmään B+ saadaan suoraan ympyräkaaviosta. Tapahtuman, jossa ainakin yksi suomalaisryhmästä kuuluu veriryhmään B+, todennäköisyyttä on luontevaa tarkastella sen vastatapahtuman todennäköisyyden avulla. Tapahtuman ”ainakin yksi suomalainen kuuluu veriryhmään B+” vastatapahtuma on tapahtuma, jossa yksikään henkilö ei kuulu veriryhmään B+. Kun vastatapahtuman todennäköisyys vähennetään koko otosavaruudesta, saadaan selville kysytyn tapahtuman todennäköisyys. On hyvä huomata, että satunnaisesti valitussa suomalaisryhmässä henkilöiden kuuluminen tiettyyn veriryhmään ei riipu ryhmän muiden henkilöiden veriryhmistä. 23 b) Verenluovutuksessa potilaalle annetaan hänen veriryhmänsä kanssa yhteensopivaa verta tehtävänannon taulukon mukaisesti. Ympyräkaaviosta saadaan ratkaistua, paljonko sopivia luovuttajia AB- - ryhmäläiselle on väestössä yhteensä prosentuaalisesti. Ratkaisussa voidaan a-kohdan tapaan hyödyntää vastatapahtuman todennäköisyyttä. Tehtävä 3: Tartuntalähteet Eri tartuntalähteet ovat toisensa poissulkevia, sillä tartunta on saatu tietyltä tartuttajalta tietyllä hetkellä. Esimerkiksi jos tartunta on saatu perhepiiristä, niin sitä ei ole voitu saada muista tartuntalähteistä. Lisäksi, koska viisi sairastunutta henkilöä on valittu satunnaisesti, voidaan näiden henkilöiden tartunnat lähteineen olettaa toisistaan riippumattomiksi. P (”tartunnan saanut henkilö on saanut tartunnan jostain tartuntalähteestä”) = 1, sillä jokaisella tautitartunnalla on aina jokin lähde. Täten kuvan histogrammi on todennäköisyysjakauma ja eri tartuntalähteiden todennäköisyyksien summa on 1 eli 100%. Näin ollen kunkin tartuntalähteen todennäköisyys saadaan suoraan histogrammista. Tehtävä 4: Seksuaalivähemmistöt a) Tilannetta voidaan ajatella toistokokeena, jossa täsmälleen samaa koetta toistetaan 30 kertaa ja seurataan onnistuneiden kokeiden lukumäärää. Tässä 30 henkilöä valitaan satunnaisesti ja tapahtuman ”henkilö kuuluu seksuaalivähemmistöön” todennäköisyys on jokaisella valinnalla sama ja riippumaton aiempien valintojen tuloksista. Kyseinen tapahtuma joko tapahtuu tai ei tapahdu. Näin ollen seksuaalivähemmistöön kuuluvien henkilöiden lukumäärä noudattaa siis binomijakaumaa. b) Tapahtuma, jossa ainakin 28 henkilöä 30 henkilöstä kuuluu seksuaalivähemmistöihin, voidaan ajatella tapahtumana ”seksuaalivähemmistöihin kuuluu joko 28 tai 29 tai 30 henkilöä 30:stä”. Tapahtumat ”seksuaalivähemmistöihin kuuluu 28 henkilöä”, ”seksuaalivähemmistöihin kuuluu 29 henkilöä” ja ”seksuaalivähemmistöihin kuuluu 30 henkilöä” taas ovat toisensa poissulkevia eli erillisiä tapahtumia. Huomautus! Yle Uutisten grafiikassa eri tartuntalähteiden todennäköisyyksien pyöristys on tehty prosentin tarkkuudella, jonka vuoksi saadaan 0,6 + 0,15 + 0,10 + 0,08 + 0,08 = 1,01 , mikä on ristiriidassa todennäköisyyden perusominaisuuksien kanssa; todennäköisyys kuuluu aina välille [0,1]. Tässä tehtävässä voidaan kuitenkin olettaa kyseessä olevan todennäköisyysjakauma. Edellä mainittu virhelähde on hyvä ottaa huomioon vastauksen mielekkyyttä ja pyöristystarkkuutta pohdittaessa. 24 c) Tässä tapahtuma ”enintään yksi 30:stä henkilöstä kuuluu seksuaalivähemmistöön” voidaan ajatella tapahtumana ”seksuaalivähemmistöihin kuuluu yksi tai ei yksikään 30:stä henkilöstä”. d) Tapahtuman, jossa ainakin yksi henkilö 30:stä kuuluu seksuaalivähemmistöön, vastatapahtuma on tapahtuma, jossa yksikään henkilö ei kuulu seksuaalivähemmistöön. Kun vastatapahtuman todennäköisyys vähennetään koko otosavaruudesta, saadaan selville kysytyn tapahtuman todennäköisyys. Tehtävä 5: Kansantaudit Tehtävänannosta löydetään todennäköisyydet tapahtumille ”henkilö sairastuu syöpään”, ”henkilö sairastuu diabetekseen”, ”syöpään sairastunut henkilö paranee syövästä” ja ”painonhallintaohjelmaan osallistunut diabeetikko pääsee remissioon”. Lisäksi vastatapahtuman todennäköisyyden avulla saadaan muotoiltua todennäköisyydet tapahtumille ”henkilö ei sairastu syöpään” ja ”henkilö ei sairastu diabetekseen”. a-b) Koska tehtävässä oletetaan, että syöpään ja diabetekseen sairastuminen ovat toisistaan riippumattomat tapahtumat, saadaan a- ja b-kohdat laskettua kertolaskusääntöä käyttämällä. c) Tapahtuma ”henkilö sairastuu ainakin toiseen kyseisistä sairauksista” tarkoittaa, että henkilö sairastuu syöpään tai diabetekseen tai molempiin. Tämän tapahtuman todennäköisyys saadaan ratkaistua mukavasti hyödyntämällä sen vastatapahtuman todennäköisyyttä. d) Tapahtuma ”henkilö sairastuu enintään toiseen kyseisistä sairauksista” tarkoittaa sitä, että henkilö sairastuu syöpään, mutta ei tyypin 2 diabetekseen tai hän sairastuu tyypin 2 diabetekseen, mutta ei syöpään tai hän ei sairastu kumpaankaan”. e) Tapahtuma ”henkilö sairastuu vain toiseen kyseisistä sairauksista”, tarkoittaa sitä, että hän sairastuu syöpään, mutta ei tyypin 2 diabetekseen tai hän sairastuu tyypin 2 diabetekseen, mutta ei syöpään. f-g) Sairastuminen ja siitä paraneminen eivät ole toisistaan riippumattomia tapahtumia, sillä paraneminen voi tapahtua vain silloin, kun henkilö on ensin sairastunut. Tapahtuma ”henkilö paranee” tarkoittaa siis itse asiassa tapahtumaa ”henkilö paranee, kun hän on ensin sairastunut”. Näin ollen todennäköisyys tapahtumalle ”henkilö ensin sairastuu ja sitten paranee” saadaan laskettua yleistä kertolaskusääntöä käyttäen. Tehtävä 7: Kestävyystreeni Merkitään sykettä satunnaismuuttujalla X. Satunnaismuuttuja X noudattaa normaalijakaumaa parametrein 130 (odotusarvo, joka on normaalijakaumalle sama kuin keskiarvo) ja 8 (keskihajonta). Koska odotusarvo poikkeaa nollasta ja keskihajonta on erisuuri kuin 1, tulee suorittaa normittaminen. Satunnaismuuttujan arvoa x vastaava normitettu arvo z on 𝑧 = 𝑥 − 𝜇 𝜎 , jossa μ on keskiarvo ja σ on keskihajonta. 25 Normaalijakauma on symmetrinen jakauma, jossa ns. todennäköisyysmassa on keskittynyt odotusarvon läheisyyteen. Todennäköisyyden laskemisessa käytetään apuna normaalijakauman kertymäfunktion taulukkoa, joka löytyy MAOL-taulukkokirjasta. Tehtävä 8: Ensiaputaidot a) Jokainen viidestä henkilöstä joko on tai ei ole ensiaputaitoinen. Jokaisen henkilön valitseminen viiden joukosta on itsenäinen, muiden henkilöiden valinnoista riippumaton tapahtuma. Näin ollen tilannetta voidaan ajatella toistokokeena, jossa valintatilanteita eli toistoja on viisi. Ensiaputaitoisen henkilön löytymisen todennäköisyys on jokaisen viiden henkilön kohdalla sama 36%. Todennäköisyys, että valittu henkilö ei ole ensiaputaitoinen saadaan laskettua vastatapahtuman avulla. b) Ensiaputaitoisia henkilöitä voi olla viiden henkilön joukossa 0, 1, 2, 3, 4 tai 5. Kaikkien näiden tapausten todennäköisyydet on selvitettävä, jotta jakauma saadaan selvitettyä. Esimerkiksi jos joukossa on yksi ensiaputaitoinen henkilö, niin siinä on neljä ensiaputaidotonta henkilöä. Tehtävä 9: Koulukiusaaminen c) Oletetaan, että 8. tai 9. luokan opiskelija on joutunut kiusaamisen uhriksi lukukauden aikana, jos hän on vastannut kysymykseen ”Kuinka usein sinua on kiusattu koulussa tämän lukukauden aikana?” joko ”useita kertoja viikossa”, ”noin kerran viikossa” tai ”harvemmin”. Tehtävä 11: Rokotteen rooli taudin leviämisen ehkäisyssä a) Tauti voi tarttua vain rokotuksen jäljiltä ei-immuuneihin henkilöihin. b) Tauti voi tarttua vain kahdenlaisiin ihmisiin: rokottamattomiin ja sellaisiin rokotettuihin, jotka eivät ole saaneet riittävää immuniteettia rokotteesta. c) Jotta jonon viimeinen jäsen saisi taudin X, on taudin pitänyt tarttua kaikkiin häntä edeltäviin jäseniin. 26 Tehtävä 12: Tautitestin luotettavuustarkastelu a) Henkilön testitulos voi olla positiivinen, kun hänellä on HI-virus, mutta on myös mahdollista, että testitulos on positiivinen, kun henkilöllä ei ole virusta. Tapaukset ”henkilöllä on virus” ja ”henkilöllä ei ole virusta” muodostavat otosavaruuden osituksen, sillä ne ovat toisensa poissulkevat, niiden summa muodostaa koko otosavaruuden  (nimittäin henkilöllä joko on tai ei ole virusta) ja kummankin tapauksen todennäköisyys on suurempi kuin 0 (annettu tehtävänannossa). b) Henkilön testitulos voi olla negatiivinen, kun hänellä ei ole HI-virusta, mutta on myös mahdollista, että testitulos on negatiivinen, kun henkilöllä on virus. Tapaukset ”henkilöllä on virus” ja ”henkilöllä ei ole virusta” muodostavat otosavaruuden osituksen ja ovat paitsi toisensa poissulkevat, niin myös toistensa vastatapahtumat. c) Koska tapaukset ”henkilöllä on virus” ja ”henkilöllä ei ole virusta” muodostavat otosavaruuden osituksen ja tapahtuman ”henkilö saa positiivisen testituloksen” todennäköisyys on suurempi kuin 0, niin saadaan ehdollisen tapahtuman ”henkilöllä on virus, kun tiedetään testituloksen olevan positiivinen” todennäköisyys ratkaistua ehdollisen todennäköisyyden määritelmän ja kertolaskusäännön avulla. d) Vastaavaan tapaan kuin c-kohdassa. e) Vastaavaan tapaan kuin c-kohdassa. Lukion matematiikan pitkä oppimäärä Tilastot ja todennäköisyys TERVE! Terveysaiheinen tehtäväpaketti opiskelijalle OPETTAJAN MATERIAALI Annina Ruokonen Sisällys Käyttäjälle 2 Tehtävät ja ratkaisut 3 2 Käyttäjälle Todennäköisyyslaskenta on suhteellisen nuori, noin 400-vuotias, matematiikan osa-alue, joka perinteisesti on keskittynyt erilaisten rahapelien voiton todennäköisyyden laskemiseen. Myös useiden lukion todennäköisyyslaskennan oppikirjojen tehtävät ovat keskittyneet pelisovelluksiin, kuten noppa- ja korttipeleihin sekä erilaisiin arvontoihin. Tehtävät ovat monesti melko irrallaan todellisen maailman sovelluskohteista ja aiheiltaan opiskelijalle etäisiä. Tämä on sääli, sillä todennäköisyyslaskennan keinot taipuvat useiden arjen, luonnon ja yhteiskunnan ilmiöiden ja tapahtumien mallintamiseen, jotka kiinnostavat nuoria ja saattavat sopia paremmin heidän kokemusmaailmaansa. Mielenkiintoinen tehtävä voi innostaa opiskelijaa matemaattisen ongelmanratkaisuun. Tämän materiaalin tehtävät liittyvät ajankohtaisiin arkiympäristön ja yhteiskunnan terveysilmiöihin, kuten treenaamiseen, ensiaputaitoihin, rokotteisiin, punkkien levittämiin tauteihin ja väestöryhmien välisiin terveyseroihin. Kunkin tehtävän yhteydessä kerrotaan myös hieman tehtävän aiheesta ja annetaan vinkkejä asiallisen lisätiedon löytämiseen. Tehtävien tavoitteena on, että opiskelija tutustuu erilaisten terveysilmiöiden syihin ja seurauksiin, ymmärtää ja kehittää niihin liittyvää matemaattista ajattelua sekä oppii analysoimaan saatujen tulosten mielekkyyttä ja luotettavuutta. Tarkoituksena on harjoitella pohtimaan saatujen tulosten merkitystä terveydelle yksilö-, yhteisö- ja yhteiskuntatasolla. Tämä materiaali on tarkoitettu ensisijaisesti lukion pitkän matematiikan todennäköisyyslaskennan opintojaksolle (MAA8 Tilastot ja todennäköisyys, LOPS 2021), mutta osa tehtävistä* soveltuu myös matematiikan lyhyttä oppimäärää opiskeleville (MAB5 Tilastot ja todennäköisyys ja MAB9 Tilastolliset ja todennäköisyysjakaumat, LOPS2021). Tehtävissä on käytetty seuraavia symboleja, joiden merkitys on tässä selitetty: Tökkääkö ratkaiseminen? Vihjeitä on saatavilla. Laskinohjelmistoja saa käyttää tehtävän ratkaisemiseksi. Laskinohjelmistoja ei saa käyttää tehtävän ratkaisemiseksi. Funktiolaskin, kuten SpeedCrunch ja KCalc ovat käytössä. Opiskelijan materiaalista löytyvät sanalliset vihjeet tehtävien ratkaisemiseksi. Tässä materiaalissa on esitetty jokaiselle tehtävälle eräs malliratkaisu. Innostavia hetkiä tehtävien tutkailuun! Annina Ruokonen Tekijä * MAB5: 1, 3, (5), 6, 9 ja 10 & MAB9: 2, 3, 4, 7 ja 8 3 Tehtävät ja ratkaisut JOHDANTOTEHTÄVÄ: Terveyteen liittyvien ilmiöiden riippumattomuus Todennäköisyyslaskennassa kahden tapahtuman riippumattomuus tarkoittaa, että jonkin tapahtuman todennäköisyys ei riipu toisen tapahtuman toteutumisesta ja toisin päin. Toisinaan tapahtumien riippumattomuus on ilmeistä tai asiayhteydestä helposti ymmärrettävissä. Näin on esimerkiksi silloin, kun heitetään kahta noppaa: toisen nopan silmäluku ei riipu siitä, mitä ensimmäisellä nopalla saatiin silmäluvuksi. Terveyteen liittyvät tapahtumat ovat kuitenkin usein monisyisiä, minkä vuoksi tapahtumien riippumattomuuden tarkastelu on tärkeää ja tehtävissä on syytä mainita, voidaanko tapahtumat olettaa riippumattomiksi vai ei. Pohdi itsenäisesti tai keskustele parin kanssa, millä tavoin seuraavat asiat voivat liittyä toisiinsa ja ovatko ilmiöt toisistaan riippumattomia:  ilmastonmuutos ja tartuntatautien leviäminen  sosioekonominen asema ja terveydentila  lapsityövoima ja tupakkatuotteet  rokotteet ja kuolleisuus  liikunta ja stressi  ylipaino ja tyypin 2 diabetes  ravitsemus ja uni  mieliala ja ystävyyssuhteet  tupakointi ja masennus  aktiivisuusmittari ja unen laatu  ilmaston lämpeneminen ja lonkkamurtumat  pyöräilykypärän käyttäminen ja turvavyön käyttäminen Ratkaisun idea: Harjoituksen tarkoituksena on huomata, että terveyteen liittyvät ilmiöt ovat usein monisyisiä ja voivat liittyä toisiinsa suoraan tai välillisesti. Terveysaiheisia tai muutoin ympäröivän maailman ilmiöihin linkittyviä todennäköisyyslaskennan tehtäviä ratkoessa on siis paikallaan pysähtyä hetkeksi pohtimaan aihetta itseään. Näin pystyy mahdollisesti välttämään tehtävän ratkaisun miinakohdat sekä lopuksi pohtimaan perustellusti saadun tuloksen järkevyyttä ja merkitystä. 4 Tehtävä 1: Lukiolaisen terveystottumuksia Vuonna 2019 turkulaisista 1. ja 2. vuosikurssin lukio-opiskelijoista 33,8 % ei syönyt koululounasta päivittäin ja 85,4 % liikkui päivässä alle tunnin (Kouluterveyskysely 2019). Oletetaan, että neljäsosa opiskelijoista sekä jätti koululounaan väliin että liikkui alle tunnin päivän aikana. Millä todennäköisyydellä sattumanvaraisesti valittu turkulaisopiskelija syö koululounaan ja liikkuu vähintään tunnin joka päivä? Lisää aiheesta: Kouluruokailun merkityksestä, Opetushallitus. Lasten ja nuorten liikkumissuositus, UKK-instituutti. Terveelliset välipalat voivat edistää jaksamista, Valtioneuvoston selvitys- ja tutkimustoimikunta. PSST! Kouluruokailu on niin opiskelijoiden kuin muun koulun henkilökunnan terveyttä ja hyvinvointia tukeva tekijä. Koululounas on suunniteltu monipuoliseksi ateriaksi, joka kokonaisuudessaan nautittuna on ravitsemuksellisesti täysipainoinen ja terveellinen. Kylläisenä ihminen jaksaa keskittyä paremmin opiskeluun ja sietää arjen kiireisyyttä. Kouluruokailu myös lisää yhteisiä ruokailuhetkiä ja ruoan arvostusta. Ruokailu antaa mahdollisuuden pieneen hengähdyshetkeen hektisen koulupäivän keskellä ja sillä on samalla sosiaalinen merkityksensä koulun arjessa. Sosiaali- ja terveysministeriön asiantuntijakeskus UKK-instituutin laatimien, laajaan tutkimustietoon perustuvien liikkumissuositusten tarkoituksena on tiivistää terveyden kannalta tarvittavan viikoittaisen liikkumisen määrä sekä antaa esimerkkejä eri liikkumisen muodoista kaikenikäisille kansalaisille. Instituutin suosituksen mukaan 7-17-vuotiaiden lasten ja nuorten tulisi liikkua reippaasti ja rasittavasti tunti päivässä. Tunti voi kertyä useista liikuntahetkistä päivän aikana ja tärkeää olisi välttää pitkäkestoista paikallaanoloa, kuten istumista. 5 Eräs malliratkaisu Hahmotellaan tilannetta Venn-diagrammin avulla: Tehtävässä halutaan siis ratkaista, kuinka todennäköisesti satunnaisesti valittu opiskelija kuuluu joukkoon, joka koostuu niistä opiskelijoista, jotka sekä syövät koululounaan että liikkuvat vähintään tunnin joka päivä. Merkitään tätä joukkoa/tapahtumaa A:lla: A = ” opiskelija syö koululounaan ja liikkuu vähintään tunnin joka päivä”. Ratkaistaan tapahtuman A todennäköisyys sen vastatapahtuman avulla. Nimittäin 𝑃(𝐴) = 1 − 𝑃(𝐵), jossa tapahtuma B on tapahtuman A vastatapahtuma. Venn-diagrammi auttaa hahmottamaan tapahtuman A vastatapahtuman B: B = ”opiskelija jättää koululounaan syömättä tai liikkuu alle tunnin päivässä”. Näin ollen tapahtuman A todennäköisyys P(A) saadaan seuraavasti 𝑃(𝐴) = 1 − 𝑃(𝐵), josta 𝑃(𝐵):n todennäköisyys saadaan mukaanlukemis-poissulkemis-periaatteen eli yleisen yhteenlaskusäännön mukaisesti: 𝑃(𝐴) = 1 − (0.338 + 0.854 − 0.25) = 1 − 0.942 = 0,058 (5,8%). Siis todennäköisyys sille, että satunnaisesti valittu turkulaislukiolainen syö koululounaan ja liikkuu vähintään tunnin päivittäin on 0,058 eli 5,8 %. 6 Tehtävä 2: Verenluovutus Veriryhmät ovat tapa ryhmitellä verityyppejä ominaisuuksineen. Erilaisia veriryhmäluokitteluja on maailmassa yli 30, mutta yleisimmin käytössä ovat ABO- ja reesusveriryhmäjärjestelmät. Ihmisellä veri kuuluu yhteen neljästä ABO-veriryhmästä (A, B, AB ja O) ja on luokiteltavissa edelleen reesusnegatiivisiin ja reesuspositiivisiin: A-, A+, B-, B+, AB-, AB+, O- tai O+. Verenluovutuksessa potilaalle annetaan hänen veriryhmänsä kanssa yhteensopivaa verta alla olevan taulukon (Veripalvelu, SPR) mukaisesti. Verentarve noudattaa keskimäärin suomalaisten veriryhmäjakaumaa. Epäsopivan veren saaminen voi johtaa potilaan omien punasolujen rikkoutumiseen, millä voi olla vakavia seurauksia. a) Kuinka suuri ryhmän suomalaisia tulee olla, jotta todennäköisyys, että ainakin yksi heistä kuuluu veriryhmään B+, ylittää 995 ‰? b) Kuinka suuri satunnaisesti valituista henkilöistä koostuvan ryhmän tulee olla, jotta veriryhmään AB- kuuluvalle henkilölle löytyy sopiva luovuttaja yli 950 ‰:n todennäköisyydellä? Lisää aiheesta: Veriryhmät, niiden periytyvyys ja verenluovutus, Veripalvelu (Suomen Punainen Risti, SPR). Mitä verenluovutuksessa tapahtuu? Veripalvelu. Voittoa tavoittelematon verenluovutus Euroopassa, EBA. PSST! Tiesitkö, että verenluovutus on helppo tapa auttaa? Se vie vain noin 10 minuuttia. Luovutetusta verestä tehtyjä verivalmisteita tarvitaan muun muassa leikkauspotilaiden, onnettomuusuhrien, syöpää sairastavien ja keskoslasten hoidossa. Suomessa verenluovutustoiminta on perustunut aina vapaaehtoisuuteen ja maksuttomuuteen. Luovuttaja auttaa potilasta ilman korvausta, mikä on tärkeä asia verivalmisteen turvallisuuden kannalta. Joissain maissa verenluovutuksesta maksetaan korvaus, mikä voi aiheuttaa vakavia, jopa kuolemaan johtavia terveys- ja turvallisuusriskejä luovuttajan tavoitellessa palkkiota. 7 Eräs malliratkaisu a) Suomalaisten veriryhmäjakaumasta (ympyräkaavio) nähdään, että B+ veriryhmään kuuluu 16 % suomalaisista. Siis tapahtuman 𝐴 = ”henkilö kuuluu veriryhmään B+” todennäköisyys 𝑃(𝐴) = 0,16. Tapahtuman 𝐴 vastatapahtuman 𝐴𝐶 = ”henkilö ei kuulu veriryhmään B+” todennäköisyys 𝑃(𝐴𝐶) = 1 − 0,16 = 0,84. Olkoon suomalaisryhmän koko 𝑛 henkilöä. Tapahtuman 𝐵 = ”ainakin yksi henkilö ryhmästä kuuluu veriryhmään B+” todennäköisyys saadaan laskettua sen vastatapahtuman 𝐵𝐶 = ”yksikään henkilö ryhmästä ei kuulu veriryhmään B+” todennäköisyyden avulla. Koska kunkin ryhmän henkilön kuuluminen tiettyyn veriryhmään ei riipu toinen toisistaan (erilliset tapahtumat), saadaan: 𝑃(𝐵) = 1 − 𝑃(𝐵𝐶) 𝑃(𝐵) = 1 − 𝑃(𝐴𝐶) ∙ 𝑃(𝐴𝐶) ∙ … ∙ 𝑃(𝐴𝐶)⏟ 𝑛 𝑘𝑝𝑙 𝑃(𝐵) = 1 − 0,84𝑛. Etsitään sitten pienin luku 𝑛, jolle todennäköisyys 𝑃(𝐵𝐶) > 0,995 eli 1 − 0,84𝑛 > 0,995 0,84𝑛 < 0,005. Ratkaistaan yhtälö 0,84𝑛 = 0,005 logaritmin avulla: 0,84𝑛 = 0,005 𝑛 = 𝑙𝑜𝑔0,840,005 𝑛 = 30,3883… Näin ollen 30 henkilöä ei aivan riitä ryhmäkooksi, vaan tarvitaan vähintään 31 henkilöä, jotta todennäköisyys sille, että ryhmässä on ainakin yksi veriryhmään B+ kuuluva henkilö, on yli 995 promillea. Mitä enemmän ryhmässä on henkilöitä, sitä todennäköisempää on, että heistä ainakin yksi kuuluu veriryhmään B+. b) Verenluovutuksessa potilaalle annetaan hänen veriryhmänsä kanssa yhteensopivaa verta. Taulukon mukaan veriryhmään AB- kuuluvalle henkilölle verta voi luovuttaa veriryhmiin A-, B-, O- ja AB- kuuluvat henkilöt. Näin ollen kaikki reesusnegatiiviset henkilöt kelpaavat luovuttajiksi. Heitä on veriryhmäjakauman mukaan väestöstä yhteensä 6 % + 5 % + 2 % + 1 % = 14 %. Tapahtuman 𝐴 = ”henkilö on sopiva luovuttaja” todennäköisyys on siis 𝑃(𝐴) = 0,14. Tapahtuman 𝐴 vastatapahtuman 𝐴𝐶 = ”henkilö ei ole sopiva luovuttaja” todennäköisyys 𝑃(𝐴𝐶) = 1 − 0,14 = 0,86. Olkoon suomalaisryhmän koko 𝑛 henkilöä. Tapahtuman 𝐵 = ”ainakin yksi henkilö ryhmästä on sopiva luovuttaja” todennäköisyys saadaan laskettua sen vastatapahtuman 𝐵𝐶 = ”yksikään henkilö ryhmästä ei ole sopiva luovuttaja” todennäköisyyden avulla. Koska kunkin henkilön kuuluminen tiettyyn veriryhmään ei riipu toinen toisistaan (erilliset tapahtumat), saadaan: 𝑃(𝐵) = 1 − 𝑃(𝐵𝐶) 8 𝑃(𝐵) = 1 − 𝑃(𝐴𝐶) ∙ 𝑃(𝐴𝐶) ∙ … ∙ 𝑃(𝐴𝐶)⏟ 𝑛 𝑘𝑝𝑙 𝑃(𝐵) = 1 − 0,86𝑛. Etsitään sitten pienin luku 𝑛, jolle todennäköisyys 𝑃(𝐵𝐶) > 0,950 eli 1 − 0,86𝑛 > 0,950 0,86𝑛 < 0,050. Ratkaistaan yhtälö 0,84𝑛 = 0,050 logaritmin avulla: 0,86𝑛 = 0,050 𝑛 = 𝑙𝑜𝑔0,860,050 𝑛 = 19,8625… Näin ollen, kun ryhmässä on vähintään 20 henkilöä, todennäköisyys sille, että ryhmässä on ainakin yksi sopiva luovuttaja veriryhmään AB- kuuluvalle henkilölle, on yli 950 promillea. Mitä enemmän ryhmässä on henkilöitä, sitä todennäköisempää on, että heistä löytyy ainakin yksi sopiva luovuttaja. 9 Tehtävä 3: Tartuntalähteet Yle Uutisten 5.11.2020 mukaan Covid-19-viruksen tartunnan jäljittäminen on aiempaan verrattuna helpottunut ja noin 60 % tartuntalähteistä selviää. Terveyden ja hyvinvoinnin laitoksen (THL) tietojen mukaan selvinneiden tartuntojen lähteet ovat seuraavat: Tarkastellaan viittä satunnaisesti valittua tartunnan saanutta henkilöä. Millä todennäköisyydellä a) heillä kaikilla on eri tartuntalähde? b) he kaikki ovat saaneet tartunnan perhepiiristä? c) kaksi henkilöä on saanut tartunnan perhepiiristä ja kolme muualta? Lisää aiheesta: Koronavirus, Terveyden ja hyvinvoinnin laitos (THL). Ajankohtaista tietoa Covid-19-taudista, THL. PSST! Covid-19-taudin, kansanomaisesti koronan, aiheuttaja on koronaviruksiin kuuluva SARS-CoV-2-virus. Virus todettiin ensimmäisen kerran Kiinassa joulukuussa 2019 ja se levisi maailmanlaajuisesti alkukeväällä 2020. Maailman terveysjärjestö WHO julisti 11.3.2020 taudin levinneen pandemiaksi. Koronaviruksia tunnetaan useita kymmeniä erilaisia, mutta vain pienehkö osa niistä voi tarttua ihmiseen ja aiheuttaa vakavia, jopa kuolemaan johtavia infektioita. Tällaisia ovat aiheuttaneet SARS-CoV-2-koronaviruksen lisäksi vain kaksi: SARS-CoV- ja MERS-CoV-koronavirukset, jotka levisivät kumpainenkin vakaviksi epidemiaksi asti. SARS vuonna 2003 ja MERS vuonna 2012. Tavallisesti koronavirukset aiheuttavat lieviä hengitystieinfektioita erityisesti syys- ja talvikaudella. Yleensä oireina on jonkinlainen yhdistelmä yskää, nuhaa sekä muita flunssan oireita. Covid-19, kuten moni virus- ja bakteeritauti, leviää hengitystie-eritteiden kautta pisaratartuntana suun, nenän ja silmien limakalvoilta. Koska Covid-19-tauti on erityisen herkästi tarttuva ja riskiryhmille jopa hengenvaarallinen, on suojatoimeksi pandemia-aikana vakiintunut tavanomaisen suojautumisen, kuten käsienpesun ja hyvän yskimishygienian lisäksi, kasvomaskien käyttö julkisilla paikoilla. 10 Eräs malliratkaisu a) Kuvan vaakapylväsdiagrammi (histogrammi) on todennäköisyysjakauma, jossa eri tartuntalähteiden todennäköisyyksien summa on 1. Merkitään tapahtumia seuraavasti: A = ”Tartuntalähteenä on perhepiiri” B = ”Tartuntalähteenä on yksityistilaisuus/lähipiiri” C = ” Tartuntalähteenä on työpaikka” D = ”Tartuntalähteenä on harrastus” E = ”Tartuntalähteenä on oppilaitos” Yle Uutisten grafiikassa kyseisten tapahtumien todennäköisyyksien pyöristys on tehty prosentin tarkkuuteen, jolloin satunnaismuuttujan X = ”tautilähde” jakauman muodostavien tapahtumien A, B, C, D ja E todennäköisyyksien summa onkin 101 % eli 1,01. Tämä virhelähde on hyvä ottaa huomioon vastauksen mielekkyyttä ja pyöristystarkkuutta pohdittaessa. Tapahtumat A, B, C, D ja E ovat toisensa poissulkevia, sillä tartunta on saatu tietyltä tartuttajalta tietyllä hetkellä. Esimerkiksi jos tartunta on saatu perhepiiristä, niin sitä ei ole voitu saada muista tartuntalähteistä. Koska viisi sairastunutta henkilöä on valittu satunnaisesti, voidaan näiden henkilöiden tartunnat lähteineen olettaa toisistaan riippumattomiksi. Tapahtumien poissulkevuuden ja riippumattomuuden nojalla todennäköisyys, että kaikki viisi henkilöä ovat saaneet tartunnan eri tartuntalähteistä, voidaan laskea kertolaskusäännön avulla: P (”kaikilla eri tartuntalähde”) = P (”yksi saanut tartunnan perhepiiristä ja toinen lähipiiristä ja kolmas työpaikalta ja neljäs harrastuksista ja viides oppilaitoksesta”) P (”kaikilla eri tartuntalähde”) = 𝑃(𝐴) ∙ 𝑃(𝐵) ∙ 𝑃(𝐶) ∙ 𝑃(𝐷) ∙ 𝑃(𝐸) P (”kaikilla eri tartuntalähde”) = 0,6 ∙ 0,15 ∙ 0,10 ∙ 0,08 ∙ 0,08 P (”kaikilla eri tartuntalähde”) = 0,0000576 P (”kaikilla eri tartuntalähde”) ≈ 6 ∙ 10−5. Tehtävänannon jakauman virhelähteen vuoksi tämä vastaus antaa vain suuruusluokan todennäköisyydestä, jolla viidellä satunnaisesti valitulla sairastuneella henkilöllä on eri tartuntalähde. Tämä todennäköisyys on hyvin pieni - suuruusluokaltaan noin kuusi sadastuhannesosaa. b) Käytetään ratkaisussa a-kohdan merkintöjä. Koska satunnaisesti valittujen viiden henkilön tartunnat voidaan olettaa toisistaan riippumattomiksi, saadaan P (”kaikki saaneet tartunnan perhepiiristä”) = P (”yksi saanut tartunnan perhepiiristä ja toinen ja kolmas ja neljäs ja viides myös”) P (”kaikki saaneet tartunnan perhepiiristä”) = 𝑃(𝐴) ∙ 𝑃(𝐴) ∙ 𝑃(𝐴) ∙ 𝑃(𝐴) ∙ 𝑃(𝐴) 11 P (”kaikki saaneet tartunnan perhepiiristä”) = 𝑃(𝐴)5 = 0,65”) = 0,07776 ≈ 0,08. Siis tehtävänannon histogrammin todennäköisyyksien pyöristyksen vuoksi todennäköisyys, jolla viidellä satunnaisesti valitulla sairastuneella henkilöllä on kaikilla tartuntalähteenä perhepiiri, on 0,08 eli 8 % (l. kahdeksan sadasosaa l. kaksi kahdeskymmenesviidesosaa) tai vastaavaa suuruusluokkaa (0,05-0,10). Tämä todennäköisyys on joka tapauksessa merkittävä. c) Tapahtuma A = ”Tartuntalähteenä on perhepiiri” a-kohdan merkintöjen mukaisesti. Todennäköisyyttä, jolla kaksi henkilöä on saanut tartunnan perhepiiristä ja kolme muualta, voidaan tarkastella binomitodennäköisyytenä, jossa satunnaisen tartunnansaajan valinta toistetaan riippumattomasti viisi (5) kertaa. Kukin valinta onnistuu, eli sen seurauksena valitaan perhepiiristä tartunnan saanut henkilö, todennäköisyydellä p=P(A)=0,6. Merkitään epäonnistumisen todennäköisyyttä q=1-p=1-0,6=0,4. Todennäköisyys q on siis tapahtuman A vastatapahtuman ”tartunta saatu perhepiirin ulkopuolelta” todennäköisyys. Olkoon satunnaismuuttuja X perhepiiristä saatujen tartuntojen lukumäärä. Tällöin kaksi perhepiiritartuntaa saadaan todennäköisyydellä 𝑃(𝑋 = 2) = ( 5 2 ) ∙ 0,62 ∙ 0,43 𝑃(𝑋 = 2) = 5! 2! 3! ∙ 0,62 ∙ 0,43 𝑃(𝑋 = 2) = 5 ∙ 4 ∙ 3 ∙ 2 ∙ 1 2 ∙ 1 ∙ 3 ∙ 2 ∙ 1 ∙ 0,62 ∙ 0,43 𝑃(𝑋 = 2) = 10 ∙ 0,62 ∙ 0,43 𝑃(𝑋 = 2) = 0,2304 𝑃(𝑋 = 2) ≈ 0,23. Siis tehtävänannon histogrammin todennäköisyyksien pyöristyksen vuoksi todennäköisyys, jolla kaksi henkilöä on saanut tartunnan perhepiiristä ja kolme muualta, on 0,23 (eli 23 %) tai vastaavaa suuruusluokkaa (n. 0,20-0,25). Huomautus ratkaisusta Toinen tapa ratkaista tehtävä jakauman virhe huomioiden on skaalata jakaumassa esitetyt todennäköisyydet: P (”tartuntalähteenä perhepiiri”) = 60 101 , P (”tartuntalähteenä yksityistilaisuudet/lähipiiri”) = 15 101 , ⋮ Käyttämällä skaalattuja todennäköisyyksiä myös vältetään virhemarginaalin pohdinta ratkaisun yhteydessä. 12 Tehtävä 4: Seksuaalivähemmistöt Vuoden 2017 kouluterveyskyselyn mukaan toisen asteen opiskelijoista noin 11 % (15 % tyttöoletetuista, 7 % poikaoletetuista) kokee kuuluvansa seksuaalivähemmistöihin. Suomalaisten lukiolaisten keskuudesta arvotaan 30 henkilön otos. Millä todennäköisyydellä näistä henkilöistä johonkin seksuaalivähemmistöön kuuluu: a) puolet b) ainakin 28 c) enintään yksi d) ainakin yksi? Lisää aiheesta: Seksuaalinen suuntautuminen, Seta ry. Itsemäärittelyoikeus ja normit, Seta ry. Ensimmäinen HLBTIQ-henkilöiden tasa-arvoa koskeva EU:n strategia, Euroopan komissio. Sukupuoli- ja seksuaalivähemmistöihin kuuluvien nuorten hyvinvointi, THL. PSST! HLBTIQ on seksuaali- ja sukupuolivähemmistöistä käytetty lyhenne, joka tulee sanoista homo, lesbo, bi, trans, inter ja queer. Seksuaalinen suuntautuminen on ominaisuus, joka kertoo siitä, kehen ihminen ihastuu, rakastuu tai tuntee vetoa tunnetasolla tai eroottisessa mielessä. Monesti seksuaalinen suuntautuminen määritellään oman sukupuolen ja tunteiden kohteen sukupuolen perusteella, mikä on toisinaan ongelmallinen määrittelytapa niin seksuaalisen suuntautumisen kuin sukupuolien moninaisuuden kannalta. Puhuttiin sitten sukupuolesta tai seksuaalisesta suuntautumisesta, jokaisella ihmisellä on oikeus määritellä, kuka on ja kuinka haluaa tulla nähdyksi. Jokaisella on myös täysi oikeus olla tietämättä. Itsensä saa määritellä, olla määrittelemättä ja muuttaa mielensä määritelmien suhteen. Kouluterveyskyselyssä kartoitetaan myös sukupuoli- ja seksuaalivähemmistöön kuuluvien nuorten hyvinvointia ja yhdenvertaisuuden toteutumista. Vuoden 2019 kyselyn tulokset osoittavat, että näihin vähemmistöihin kuuluvilla nuorilla oli muihin ikätovereihinsa verrattuna huomattavasti enemmän terveyteen ja hyvinvointiin sekä koulunkäyntiin ja kouluyhteisössä elämiseen liittyviä haasteita, kuten yksinäisyyden, kiusaamisen ja uupumuksen kokemuksia. Erityisen ongelmallista on sateenkaarinuorten kohtaaman väkivallan ja mielenterveyden ongelmien yleisyys sekä tarvitun avun ulkopuolelle jäämisen kokemukset muita nuoria useammin. Seksuaalivähemmistöjen syrjintäsuoja ja yhdenvertaisuuden edistämisvelvoite viranomaisille on kirjattu yhdenvertaisuuslakiin, mutta siitä huolimatta jokaisella meistä on myös yksilönä vastuu yhdenvertaisuuden toteutumisessa. Terveyden ja hyvinvoinnin laitoksen joka toinen vuosi teettämä Kouluterveyskysely on perusopetuksen 4.-5. ja 8.-9. vuosiluokkalaisille, lukion 1.-2. vuoden opiskelijoille sekä ammatillisten oppilaitosten 1.-2. vuoden opiskelijoille suunnattu kysely. Siinä kartoitetaan eri- ikäisten lasten ja nuorten hyvinvointiin, terveyteen, koulunkäyntiin, osallisuuteen sekä avun ja tuen saamiseen liittyviä kokemuksia, tapoja ja tottumuksia sekä paikallisesti että maakuntatasolla. Kouluterveyskyselystä saatuja tietoja voidaan hyödyntää hyvinvoinnin edistämistyössä niin oppilaitoksissa, hyvinvointialueilla ja valtakunnallisesti. 13 Eräs malliratkaisu Tilannetta voidaan ajatella toistokokeena, jossa toistoja eli tässä yhteydessä henkilöitä on 30 ja onnistunut toisto on tapahtuma A: A = ”henkilö kuuluu seksuaalivähemmistöön”. Tapahtuman A todennäköisyys p on jokaisella toistolla 11% eli 0,11. Näin ollen tapahtuman A vastatapahtuman ”henkilö ei kuulu seksuaalivähemmistöön” todennäköisyys q saadaan laskettua 𝑞 = 1 − 𝑝 eli 𝑞 = 1 − 0,11 = 0,89. Merkitään seksuaalivähemmistöihin kuuluvien henkilöiden lukumäärää 30 henkilön otoksessa satunnaismuuttujalla X. Seksuaalivähemmistöön kuuluvien henkilöiden lukumäärä X noudattaa binomijakaumaa Bin(30; 0,11), jolloin 𝑃(𝑋 = 𝑘) = (𝑛𝑘)𝑝 𝑘𝑞𝑛−𝑘, missä 𝑛 = 30, 𝑝 = 0,11, 𝑞 = 0,89 ja 𝑘 = 0, 1, 2, … , 30. Kolmellakymmenellä toistolla k onnistumista saadaan siis todennäköisyydellä 𝑃(𝑋 = 𝑘) = ( 30 𝑘 ) ∙ 0,11𝑘 ∙ 0,8930−𝑘, 𝑘 = 0, 1, 2, … , 30. a) Binomitodennäköisyyden mukaisesti puolet 30:stä eli 15 henkilöä kuuluu seksuaalivähemmistöihin todennäköisyydellä: 𝑃(𝑋 = 15) = ( 30 15 ) ∙ 0,1115 ∙ 0,8915 = 155 117 520 ∙ 0,1115 ∙ 0,8915 𝑃(𝑋 = 15) = 0,0000001128… 𝑃(𝑋 = 15) ≈ 0,00000011. Siis 30:stä satunnaisesti valitusta lukiolaisesta puolet kuuluu seksuaalivähemmistöön todennäköisyydellä 0,00000011 eli 0,000011 % (yksitoista miljoonasosaa). b) Tapahtuma, jossa ainakin 28 henkilöä 30:stä kuuluu seksuaalivähemmistöihin, voidaan ajatella tapahtumana ”seksuaalivähemmistöihin kuuluu joko 28 tai 29 tai 30 henkilöä 30:stä”, joka taas koostuu kolmesta erillisestä tapahtumasta. Binomitodennäköisyyttä ja erillisten tapausten yhteenlaskusääntöä käyttäen saadaan laskettua todennäköisyys, jolla ainakin 28 kuuluu seksuaalivähemmistöihin. 𝑃(𝑋 ≥ 28) = 𝑃(𝑋 = 28) + 𝑃(𝑋 = 29) + 𝑃(𝑋 = 30) 𝑃(𝑋 ≥ 8) = ( 30 28 ) ∙ 0,1128 ∙ 0,892 + ( 30 29 ) ∙ 0,1129 ∙ 0,891 + ( 30 30 ) ∙ 0,1130 ∙ 0,890 𝑃(𝑋 ≥ 8) = 435 ∙ 0,1128 ∙ 0,892 + 30 ∙ 0,1129 ∙ 0,89 + 0,1130 𝑃(𝑋 ≥ 8) = 5,011… ∙ 10−25 𝑃(𝑋 ≥ 8) ≈ 5,1 ∙ 10−25. 14 Siis 30:stä satunnaisesti valitusta lukiolaisesta ainakin 28 kuuluu seksuaalivähemmistöön todennäköisyydellä 5,1 ∙ 10−25 eli 0,00000000000000000000000050 %. Tämä todennäköisyys on niin lähellä nollaa, että voidaan puhua melkein mahdottomasta tapahtumasta. c) Samoin kuin b-kohdassa, saadaan binomitodennäköisyyden ja erillisten tapausten yhteenlaskusäännön avulla laskettua todennäköisyys, jolla enintään yksi kolmestakymmenestä kuuluu seksuaalivähemmistöihin. Tapahtuma ”enintään yksi 30:stä henkilöstä kuuluu seksuaalivähemmistöön” voidaan ajatella tapahtumaksi ”0 tai 1 henkilöä kolmestakymmenestä kuuluu seksuaalivähemmistöön”. Täten 𝑃(𝑋 ≤ 1) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) 𝑃(𝑋 ≤ 1) = ( 30 0 ) ∙ 0,110 ∙ 0,8930 + ( 30 1 ) ∙ 0,111 ∙ 0,8929 𝑃(𝑋 ≤ 1) = 0,8930 + 30 ∙ 0,11 ∙ 0,8929 𝑃(𝑋 ≤ 1) = 0,1427… 𝑃(𝑋 ≤ 1) ≈ 0,14. Siis kolmestakymmenestä satunnaisesti valitusta lukiolaisesta enintään yksi kuuluu seksuaalivähemmistöön todennäköisyydellä 0,14 eli 14 % (neljätoista sadasosaa). d) Tapahtuman, jossa ainakin yksi henkilö 30:stä kuuluu seksuaalivähemmistöön, todennäköisyys saadaan laskettua sen vastatapahtuman ”yksikään henkilö ei kuulu seksuaalivähemmistöön” avulla: 𝑃(𝑋 ≥ 1) = 1 − 𝑃(𝑋 = 0) 𝑃(𝑋 ≥ 1) = 1 − 0,8930 𝑃(𝑋 ≥ 1) = 0,9696… 𝑃(𝑋 ≥ 1) ≈ 0,97. Siis kolmestakymmenestä satunnaisesti valitusta lukiolaisesta ainakin yksi kuuluu seksuaalivähemmistöön todennäköisyydellä 0,97 eli 97 %. On siis erittäin todennäköistä (lähes varmaa), että esimerkiksi 30 opiskelijan ryhmässä on ainakin yksi seksuaalivähemmistöön kuuluva opiskelija. Huomautus ratkaisusta Edeltävien b- ja c-kohtien tavoin kysytty tapahtuma voitaisiin paloitella erillisiksi tapauksiksi: yksi tai kaksi tai kolme tai … tai 29 tai 30 henkilöä kolmestakymmenestä kuuluu seksuaalivähemmistöihin. Tämä tapa olisi kuitenkin esimerkiksi ylioppilaskokeen A-osiossa yllä esitettyä ratkaisua alttiimpi virheille, sillä laskettavaa on enemmän. 15 Tehtävä 5: Kansantaudit Syöpäsairaudet ja diabetes ovat Suomessa kansantauteja. Yksilöllisten ja inhimillisten haittojen lisäksi kansantaudit vaikuttavat väestötasolla terveydentilaan, kuolleisuuteen ja työkykyyn sekä kuormittavat rajusti terveydenhuoltoa vaikuttaen samalla myös kansantalouteen. Syöpäjärjestöjen tiedon mukaan joka kolmas suomalainen sairastuu jossakin elämänsä vaiheessa syöpään. Lähes kaksi kolmesta kuitenkin paranee. FinTerveys 2017-tutkimuksen mukaan tyypin 2 diabetekseen sairastuu elämänsä aikana n. 13% väestöstä (10 % naisista ja 15 % miehistä). Hiljattain todetusta diabeteksesta on mahdollista parantua täysin ja pitkään sairastanutkin voi saada sairauden remissiotilaan eli piiloon elämäntaparemontilla (terveellinen ravinto ja liikunnan lisääminen: eroon ylipainosta). Dataa remissioon päässeistä suomalaisista diabeetikoista ei ole kerätty, mutta brittitutkimuksessa* kahden vuoden seurannan jälkeen ilman painonhallintaohjelmaa remissioon pääsi 3 %, kun taas painonhallintaohjelman saaneista 36 % pääsi remissioon. Voidaan olettaa, että elintapaohjauksella on sama vaikutus myös suomalaisiin diabeetikoihin ja että sairaudesta parantuminen ei riipu sairastumisesta, vaan muista asioista (esim. hoidon onnistuminen ja yleiskunto). Lääketieteellisissä tutkimuksissa** on havaittu voimakas yhteys syöpien ja tyypin 2 diabeteksen sairastavuuden välillä. Tämä johtuu erityisesti siitä, että molemmilla sairauksilla on yhteisiä riskitekijöitä. Tarkkaa arviota siitä, kuinka suuri osa potilaista sairastaa molempia samanaikaisesti, ei ole. Oletetaan tässä tehtävässä, että itse sairastumistapahtumat ovat toisistaan riippumattomia. Laske, kuinka suurella todennäköisyydellä satunnainen suomalainen elämässään: a) sairastuu sekä syöpäsairauteen että 2-tyypin diabetekseen b) ei sairastu kumpaankaan c) sairastuu ainakin toiseen d) sairastuu enintään toiseen e) sairastuu vain toiseen f) sairastuu syöpään ja paranee siitä g) sairastuu diabetekseen ja pääsee remissioon, kun hän on saanut painonhallintaohjelman. * https://www.thelancet.com/journals/landia/article/PIIS2213-8587(19)30068-3/fulltext ** https://pubmed-ncbi-nlm-nih-gov.ezproxy.utu.fi/27219686/ Lisää aiheesta Syöpä, Kaikki syövästä (Syöpäjärjestöt). Diabeteksen ilmenemismuodot, Suomen Diabetesliitto ry. Huonosti hoidettuna diabetes kuormittaa munuaisia diabetes ja munuaiset & munuaisten tehtävät, Diabetesliitto ja Munuais- ja maksaliitto. Samanaikaissairastavuus eli komorbiditeetti tarkoittaa kahden tai useamman sairauden tai niin sanotun häiriön samanaikaista esiintymistä. Ilmiö on yleisempi sellaisilla sairauksilla, joilla on yhteisiä riskitekijöitä. Esimerkiksi ylipaino, tupakointi, korkea verenpaine ja veren korkea kolesterolipitoisuus ovat yhteisiä riskitekijöitä useille suomalaisille kansantaudeille, kuten syöville, diabetekselle sekä sydän- ja verisuonisairauksille. Myös erilaiset oppimisvaikeudet esim. hahmotusvaikeudet, lukivaikeus ja tarkkaavaisuuden vaikeudet esiintyvät usein päällekkäin. 16 Eräs malliratkaisu Merkitään tehtävänannon tapahtumia ja niitä vastaavia todennäköisyyksiä seuraavasti: S = ”Henkilö sairastuu syöpään”, 𝑃(𝑆) = 1 3 E = 𝑆𝐶= ”Henkilö ei sairastu syöpään”, 𝑃(𝐸) = 1 − 𝑃(𝑆) = 2 3 K = ”Sairastunut paranee syövästä”, 𝑃(𝐾|𝑆) = 2 3 D = ”Henkilö sairastuu diabetekseen”, 𝑃(𝐷) = 0,13 T = 𝐷𝐶= ”Henkilö ei sairastu diabetekseen”, 𝑃(𝑇) = 1 − 𝑃(𝐷) = 0,87 R = ”Painonhallintaohjelmaan osallistunut diabeetikko pääsee remissioon”, 𝑃(𝑅|𝐷) = 0,36. Oletetaan, että syöpään ja diabetekseen sairastuminen ovat toisistaan riippumattomat tapahtumat. a) Todennäköisyys, jolla henkilö sairastuu sekä syöpäsairauteen että 2-tyypin diabetekseen, saadaan laskettua seuraavasti: 𝑃(𝑆 𝑗𝑎 𝐷) = 𝑃(𝑆) ∙ 𝑃(𝐷) = 1 3 ∙ 0,13 = 0,043333. . ≈ 0,04. Siis todennäköisyys, että henkilö sairastuu elämänsä aikana molempiin sairauksiin, on noin 4 %. b) Todennäköisyys, että henkilö ei sairastu kumpaankaan, saadaan laskettua seuraavalla tavalla: 𝑃(𝐸 𝑗𝑎 𝑇) = 𝑃(𝐸) ∙ 𝑃(𝑇) = 2 3 ∙ 0,87 = 0,58. Siis todennäköisyys, että henkilö ei sairastu elämänsä aikana kumpaankaan sairauteen, on 58 %. c) Todennäköisyys, että henkilö sairastuu ainakin toiseen kyseisistä sairauksista, voidaan laskea vastatapahtuman todennäköisyyttä hyödyntäen seuraavasti: 𝑃(𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑎𝑖𝑛𝑎𝑘𝑖𝑛 𝑡𝑜𝑖𝑠𝑒𝑒𝑛) = 1 − 𝑃(𝑒𝑖 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢 𝑘𝑢𝑚𝑝𝑎𝑎𝑛𝑘𝑎𝑎𝑛) 𝑃(𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑎𝑖𝑛𝑎𝑘𝑖𝑛 𝑡𝑜𝑖𝑠𝑒𝑒𝑛) = 1 − 0,58 𝑃(𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑎𝑖𝑛𝑎𝑘𝑖𝑛 𝑡𝑜𝑖𝑠𝑒𝑒𝑛) = 0,42. Siis todennäköisyys, että henkilö sairastuu elämänsä aikana ainakin toiseen kansantautiin, on 42 %. d) Todennäköisyys, että henkilö sairastuu enintään toiseen kyseisistä sairauksista, tarkoittaa sitä, että henkilö sairastuu joko syöpään, mutta ei tyypin 2 diabetekseen tai tyypin 2 diabetekseen, mutta ei syöpään tai hän ei sairastu kumpaankaan. Saadaan täten 𝑃(𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑒𝑛𝑖𝑛𝑡ää𝑛 𝑡𝑜𝑖𝑠𝑒𝑒𝑛) = 𝑃(𝑆) ∙ 𝑃(𝑇) + 𝑃(𝐷) ∙ 𝑃(𝐸) + 𝑃(𝐸) ∙ 𝑃(𝑇) 𝑃(𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑒𝑛𝑖𝑛𝑡ää𝑛 𝑡𝑜𝑖𝑠𝑒𝑒𝑛) = 1 3 ∙ 0,87 + 0,13 ∙ 2 3 + 2 3 ∙ 0,87 17 𝑃(𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑒𝑛𝑖𝑛𝑡ää𝑛 𝑡𝑜𝑖𝑠𝑒𝑒𝑛) = 0,956666… 𝑃(𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑒𝑛𝑖𝑛𝑡ää𝑛 𝑡𝑜𝑖𝑠𝑒𝑒𝑛) ≈ 0,96. Siis todennäköisyys, että henkilö sairastuu elämänsä aikana enintään toiseen taudeista, on 96 %. e) Todennäköisyys, että henkilö sairastuu vain toiseen kyseisistä sairauksista, tarkoittaa sitä, että hän sairastuu joko syöpään, mutta ei tyypin 2 diabetekseen tai tyypin 2 diabetekseen, mutta ei syöpään. Saadaan siis 𝑃(𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑣𝑎𝑖𝑛 𝑡𝑜𝑖𝑠𝑒𝑒𝑛) = 𝑃(𝑆) ∙ 𝑃(𝑇) + 𝑃(𝐷) ∙ 𝑃(𝐸) 𝑃(𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑣𝑎𝑖𝑛 𝑡𝑜𝑖𝑠𝑒𝑒𝑛) = 1 3 ∙ 0,87 + 0,13 ∙ 2 3 𝑃(𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑣𝑎𝑖𝑛 𝑡𝑜𝑖𝑠𝑒𝑒𝑛) = 0,376666… 𝑃(𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑣𝑎𝑖𝑛 𝑡𝑜𝑖𝑠𝑒𝑒𝑛) ≈ 0,38. Eli todennäköisyys, että henkilö sairastuu elämänsä aikana vain toiseen taudeista, on 37 %. f) Syöpään sairastuminen ja siitä paraneminen eivät ole toisistaan riippumattomia tapahtumia, sillä paraneminen voi tapahtua vain silloin, kun henkilö on ensin sairastunut. Tapahtuma ”henkilö paranee syövästä” tarkoittaa siis itse asiassa tapahtumaa ”henkilö paranee syövästä, kun hän on sairastunut syöpään”. Näin ollen tapahtuman ”henkilö sairastuu syöpään ja paranee siitä” laskemisessa käytetään yleistä kertolaskusääntöä ja saadaan 𝑃(ℎ𝑙ö 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑠𝑦ö𝑝ää𝑛 𝑗𝑎 𝑝𝑎𝑟𝑎𝑛𝑒𝑒) = 𝑃(𝑆) ∙ 𝑃(𝐾|𝑆) 𝑃(ℎ𝑙ö 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑠𝑦ö𝑝ää𝑛 𝑗𝑎 𝑝𝑎𝑟𝑎𝑛𝑒𝑒) = 1 3 ∙ 2 3 𝑃(ℎ𝑙ö 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑠𝑦ö𝑝ää𝑛 𝑗𝑎 𝑝𝑎𝑟𝑎𝑛𝑒𝑒) = 0,222222… 𝑃(ℎ𝑙ö 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑠𝑦ö𝑝ää𝑛 𝑗𝑎 𝑝𝑎𝑟𝑎𝑛𝑒𝑒) ≈ 0,22. Eli todennäköisyys, että henkilö sairastuu elämänsä aikana syöpään ja paranee siitä, on 22 %. g) Kuten edeltävässä kohdassa, myös tässä on huomattava, että diabetekseen sairastuminen ja remissiotilaan pääseminen eivät ole toisistaan riippumattomia tapahtumia, sillä remissioon voi päästä vain silloin, kun henkilö on ensin sairastunut. Tapahtuma ”henkilö pääsee remissioon” tarkoittaa siis itse asiassa tapahtumaa ”henkilö pääsee remissioon, kun hän on ensin sairastunut diabetekseen”. Näin ollen käyttämällä yleistä kertolaskusääntöä saadaan 𝑃(ℎ𝑙ö 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑑𝑖𝑎𝑏𝑒𝑡𝑒𝑘𝑠𝑒𝑒𝑛 𝑗𝑎 𝑝ää𝑠𝑒𝑒 𝑟𝑒𝑚𝑖𝑠𝑠𝑖𝑜𝑜𝑛) = 𝑃(𝐷) ∙ 𝑃(𝑅|𝐷) 𝑃(ℎ𝑙ö 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑑𝑖𝑎𝑏𝑒𝑡𝑒𝑘𝑠𝑒𝑒𝑛 𝑗𝑎 𝑝ää𝑠𝑒𝑒 𝑟𝑒𝑚𝑖𝑠𝑠𝑖𝑜𝑜𝑛) = 0,13 ∙ 0,36 𝑃(ℎ𝑙ö 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑑𝑖𝑎𝑏𝑒𝑡𝑒𝑘𝑠𝑒𝑒𝑛 𝑗𝑎 𝑝ää𝑠𝑒𝑒 𝑟𝑒𝑚𝑖𝑠𝑠𝑖𝑜𝑜𝑛) = 0,0468 𝑃(ℎ𝑙ö 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑑𝑖𝑎𝑏𝑒𝑡𝑒𝑘𝑠𝑒𝑒𝑛 𝑗𝑎 𝑝ää𝑠𝑒𝑒 𝑟𝑒𝑚𝑖𝑠𝑠𝑖𝑜𝑜𝑛) ≈ 0.05 Eli todennäköisyys, että henkilö sairastuu elämänsä aikana diabetekseen ja tauti saadaan remissiotilaan, on 5 %. 18 Tehtävä 6: Puutiaisaivotulehdukset Saaristomeren alueella Arviolta noin 500 000:ta suomalaista puree vuosittain punkki. Puutiaisaivokuumetta aiheuttavaa virusta kantaa noin 1-2 % riskialueiden* punkeista. Puutiaisaivotulehdus (TBE) on punkin kaikkien kehitysmuotojen (toukka, nymfi ja aikuinen) välityksellä tarttuva virustauti, jolle ei ole olemassa lääkehoitoa. Siihen on kuitenkin olemassa rokote, joka suojaa taudilta. Virus tarttuu punkista ihmiseen minuuteissa, minkä vuoksi ihon tarkastaminen punkkien varalta ei auta. Lähivuosina Suomessa on raportoitu vuosittain keskimäärin 60–80 puutiaisaivotulehdustapausta, mutta esimerkiksi vuonna 2020 diagnosoitiin 91 tapausta, mikä on enemmän kuin koskaan aikaisemmin. Määritä alla olevasta puutiaisaivotulehduksen esiintyvyys –taulukosta** a) tapausaineiston moodi sekä b) tapausten lukumäärien keskiarvo ja otoskeskihajonta vuonna 2020 taulukossa nimetyillä paikkakunnilla. Selitä, kuinka hyvin keskiarvo mielestäsi kuvaa aineistoa ja mitä keskihajonnan arvo tarkoittaa tässä tilastossa. Lisää aiheesta: Tietoa TBE-viruksesta: puutiaisaivotulehdus ja TBE:n esiintyvyys kartalla, THL Tietoa borrelia-viruksesta ja oireista: borrelioosi, THL Punkkien levinneisyys ja seuranta: punkkilive, Turun yliopisto Punkkien levinneisyyttä kartoitetaan kansalaistutkimuksen avulla: mediatiedote, Turun yliopisto PSST! Puutiaiset, tuttavallisemmin punkit, ovat levinneet yhä laajemmalle alueelle Suomessa ja samalla punkkien välittämät borrelioosi- ja puutiaisaivotulehdustartuntojen määrät ovat kasvaneet. Yhtenä syynä siihen, että punkkeja tavataan yhä pohjoisemmilla leveysasteilla sekä yhä varhaisemmin keväällä ja myöhemmin syksyllä, pidetään ilmaston lämpenemistä. Uusia punkkiriskialueita on syntynyt jopa aivan kaupunkien puisto- ja viheralueille. Tämän vuoksi on hyödyllistä tietää, millä alueilla punkkeja on havaittu ja kuinka niiltä voidaan suojautua. * Eteläinen Suomi saaristoineen sekä Ahvenanmaan saaristo. **Taulukko supistettu Varsinais-Suomeen ja Ahvenanmaahan Puutiaisaivokuumeen esiintyvyys ja rokotussuositukset tartuntapaikkakunnittain –taulukosta (THL, 2021). THL ylläpitää valtakunnallista tartuntatautirekisteriä (tilastotietokanta) tartuntatautilakiin ja -asetukseen perustuen. Tartuntatautirekisteriin ilmoitetaan vuosittain noin 100 000 tartuntatautitapausta. Tietoja on kerätty vuodesta 1995 alkaen. Tartuntatautirekisteriin voivat tehdä ilmoituksia lääkärit ja laboratoriot. Rekisterin lukuja tarkastellessa on hyvä pitää mielessä, että niihin vaikuttaa se, kuinka suuri osa tautiin sairastuneista hakeutuu terveydenhuoltoon sekä kuinka suurelle osalle tehdään mikrobiologisia tutkimuksia aiheuttajan toteamiseksi. Lisäksi lukuihin vaikuttavat muutokset diagnostisissa käytännöissä ja menetelmissä. Kunta tai kaupunki Tapausten lkm vuonna 2020 Parainen 7 Ahvenanmaa 15 Kustavi 0 Naantali 0 Uusikaupunki 2 Kaarina 2 Turku 1 19 Eräs malliratkaisu a) Moodi eli tyyppiarvo on havaintoaineistossa yleisimmin esiintyvä tilastomuuttujan arvo eli se arvo, jolla on suurin frekvenssi. Tämän aineistoin tyyppiarvo on ”Ahvenanmaa”, sillä sen frekvenssi on 15 eli siellä puutiaisaivokuume- eli TBE-tapauksia on ollut 15 vuonna 2020. b) Keskiarvo kuvaa, kuinka paljon puutiaisaivokuumetapauksia eri paikkakunnilla on keskimäärin. Tilastomuuttujan keskiarvo saadaan laskemalla yhteen muuttujan arvot ja jakamalla summa havaintojen lukumäärällä: 𝜇 = 1 𝑛 ∑𝑥𝑖 𝑛 𝑖=1 = 1 7 ∙ (7 + 15 + 0 + 0 + 2 + 2 + 1) = 27 7 = 3 6 7 ≈ 4. Taulukon paikkakuntien puutiaisaivokuumetapausten keskiarvo on siis 4 tapausta paikkakunnalla. Tämä keskiarvo ei yksistään riitä kuvamaan aineistoa, sillä se ei anna kuvaa TBE-tapausten todellisesta jakautumisesta eri paikkakunnille; esimerkiksi Kustavissa ja Naantalissa TBE-tapauksia ei ole vuonna 2020 ollut lainkaan, kun taas Ahvenanmaalla tapauksia on ollut lähes nelinkertainen määrä keskiarvoon verrattuna. Jakauman hajontaa mittaavat tunnusluvut ilmentävät havaintojen eli tässä TBE-tapausten lukumäärän vaihtelun suuruutta havaintoaineistossa. Tutkitaan TBE-tapausten keskihajontaa, joka kuvaa havaintoaineiston arvojen poikkeamaa keskiarvosta. Keskihajonta 𝜎 𝜎 = √ 1 𝑛 ∑(𝑥𝑖 − 𝜇)2 𝑛 𝑖=1 = √ 1 7 ∑(𝑥𝑖 − 4)2 7 𝑖=1 = √ (7 − 4)2 + (15 − 4)2 + (0 − 4)2 + (0 − 4)2 + (2 − 4)2 + (2 − 4)2 + (1 − 4)2 7 = √ (3)2 + (11)2 + (−4)2 + (−4)2 + (−2)2 + (−2)2 + (−3)2 7 = √ 1253 7 = 5,0568… ≈ 5. Keskihajonta on siis 5 eli TBE-tapausten lukumäärät eri paikkakunnilla ovat hajautuneet keskimäärin 5:n tautitapauksen päähän keskiarvosta. 20 Tehtävä 7: Kestävyystreeni Matalatehoisessa aerobisessa harjoittelussa liikutaan sykkeellä, joka on noin 60-70% maksimisykkeestä. Eräässä tutkimuksessa todettiin, että matalatehoisessa aerobisessa harjoittelussa koehenkilöiden sykkeen keskiarvo oli 130 bpm (beats per minute) ja keskihajonta 8 bpm. Syke on kutakuinkin normaalisti jakautunut. a) Kuinka monella prosentilla koehenkilöistä syke oli alle 120 lyöntiä minuutissa? b) Millä todennäköisyydellä satunnaisesti valitun koehenkilön syke oli välillä 120-140 lyöntiä minuutissa? c) Millä sykevälillä syke oli 95,0 %:lla koehenkilöistä? Lisää aiheesta Syke-käsitteistö kuntoilijalle, Polar. Matalatehoinen peruskestävyysharjoittelu rakentaa kuntopohjaa ja auttaa palautumaan arjesta, Liikunta & Tiede 2-3/2019. PSST! Ihmisen syke kertoo, montako kertaa sydän lyö yhden minuutin aikana. Syke vaihtelee ennen muuta kehon fyysisen aktiivisuuden ja rasituksen mukaan: mitä enemmän keho rasittuu, sitä enemmän sydämen on pumpattava verta työtä tekeville lihaksille. Syke on alhaisimmillaan levossa (nukkuessa) ja korkeimmillaan voimakkaassa fyysisessä rasituksessa esim. HIIT-harjoituksessa. Sykkeeseen vaikuttaa myös henkilön psyyke, kuten mielialan muutokset, stressi ja jännitys, sekä tupakka, alkoholi ja kofeiinipitoiset juomat. Maksimisyke tarkoittaa sykettä, jonka henkilö voi saavuttaa kovassa fyysisessä suorituksessa ilman, että sen hetkellisestä saavuttamisesta on hänelle vaaraa. Maksimisyke on yksilöllinen ominaisuus, joka riippuu muun muassa henkilön iästä ja sukupuolesta. Vanhemmiten maksimisyke laskee. Yksi yleinen tapa arvioida henkilön maksimisykettä on vähentää henkilön ikä luvusta 220. Leposyke tarkoittaa nimensä mukaisesti sykettä henkilön ollessa levossa, mutta kuitenkin hereillä. Tyypillisesti leposyke on aikuisella noin 50-90 lyöntiä minuutissa, mutta maksimisykkeen lailla leposyke on yksilöllinen ja myös geneettinen ominaisuus. Aktiiviliikkujilla leposyke voi hyvin olla alle viitearvon, sillä kestävyysliikunta ja –urheilu laskevat leposykettä. Jännittäviä huhuja liikkuu juoksijalegendojen historiallisen alhaisista leposykkeistä 25-30 lyönnin välillä. Kuitenkin esimerkiksi Paavo Nurmella oli nykytiedon valossa normaali sydän ja syke, vaikka aikanaan Amerikassa värikkäästi tokaistiin "alhaisin pulssi, korkein taksa". Tutkimusnäyttöön perustuvan kansallisen Käypä hoito-suosituksen määritelmän mukaan kestävyysliikunta eli aerobinen liikunta on ”suuria lihasryhmiä vähintään kohtalaisesti (suhteessa toteuttajansa suorituskykyyn) kuormittavaa, yleensä ainakin kymmeniä minuutteja (yhtäjaksoisesti tai jaksoittain) kestävää, aineenvaihduntaa ja hengitys- ja verenkiertoelimistöä kehittävää ja tällaisessa liikunnassa jaksamista ylläpitävää tai lisäävää liikuntaa.” 21 Eräs malliratkaisu Merkitään sykettä satunnaismuuttujalla X. Nyt 𝑋~𝑁(130,8). Koska odotusarvo poikkeaa nollasta ja keskihajonta on erisuuri kuin 1, tulee suorittaa normittaminen. a) 𝑃(𝑋 < 120) = 𝑃(𝑍 < 120−130 8 ) 𝑃(𝑋 < 120) = 𝑃(𝑍 < − 5 4 ) 𝑃(𝑋 < 120) = 𝑃(𝑍 < −1,25). Tästä normaalijakauman symmetrian nojalla saadaan: 𝑃(𝑍 < −1,25) = 1 − 𝑃(𝑍 ≤ 1,25) 𝑃(𝑍 < −1,25) = 1 − Φ(1,25) 𝑃(𝑍 < −1,25) = 1 − 0,8944 𝑃(𝑍 < −1,25) = 0,1056 𝑃(𝑍 < −1,25) ≈ 10,6 %. Siis noin 10,6 %:lla koehenkilöistä syke oli alle 120 lyöntiä minuutissa. b) 𝑃(120 < 𝑋 < 140) = 𝑃(120−130 8 < 𝑍 < 140−130 8 ) 𝑃(120 < 𝑋 < 140) = 𝑃(−1,25 < 𝑍 < 1,25) 𝑃(120 < 𝑋 < 140) = Φ(1,25) − Φ(−1,25) 𝑃(120 < 𝑋 < 140) = Φ(1,25) − [1 − Φ(1,25)] 𝑃(120 < 𝑋 < 140) = Φ(1,25) + Φ(1,25) − 1 𝑃(120 < 𝑋 < 140) = 2 ∙ Φ(1,25) − 1 𝑃(120 < 𝑋 < 140) = 2 ∙ 0,8944 − 1 𝑃(120 < 𝑋 < 140) = 0,7888 𝑃(120 < 𝑋 < 140) ≈ 78,9 %. Siis satunnaisesti valitun koehenkilön syke on välillä 120-140 lyöntiä minuutissa 78,9 %:n todennäköisyydellä. c) Normaalijakauman symmetrian vuoksi oletetaan, että kysytyn välin minimi- ja maksimisyke ovat yhtä kaukana odotusarvosta (keskiarvosta) 130 bpm. Täten voidaan merkitä kysyttyä sykeväliä (130 − 𝑎, 130 + 𝑎). Syke kuuluu kyseiselle välille todennäköisyydellä 𝑃(130 − 𝑎 < 𝑋 < 130 + 𝑎) = 𝑃( 130 − 𝑎 − 130 8 < 𝑍 < 130 + 𝑎 − 130 8 ) 𝑃(130 − 𝑎 < 𝑋 < 130 + 𝑎) = 𝑃(− 𝑎 8 < 𝑍 < 𝑎 8 ) 𝑃(130 − 𝑎 < 𝑋 < 130 + 𝑎) = Φ( 𝑎 8 ) −Φ(− 𝑎 8 ) 𝑃(130 − 𝑎 < 𝑋 < 130 + 𝑎) = Φ( 𝑎 8 ) − [1 −Φ( 𝑎 8 )] 𝑃(130 − 𝑎 < 𝑋 < 130 + 𝑎) = 2 ∙ Φ( 𝑎 8 ) − 1 Koska tehtävässä oltiin kiinnostuneita sykevälistä, johon koehenkilön syke kuuluu 95,0 %:n todennäköisyydellä, saadaan yhtälö 2 ∙ Φ ( 𝑎 8 ) − 1 = 0,950 || + 1 2 ∙ Φ ( 𝑎 8 ) = 1,950 ||: 2 22 Φ ( 𝑎 8 ) = 0,975 Taulukosta saadaan Φ(𝑥) = 0,975, kun 𝑥 = 1,96. Näin ollen 𝑎 8 = 1,96 || ∙ 8 𝑎 = 15,68. Sijoittamalla 𝑎 = 15,68 ≈ 16 sykevälille (130 − 𝑎, 130 + 𝑎), saadaan sykeväliksi (114,146). Tämä on siis sykeväli, johon 95,0 %:n koehenkilöistä syke kuului heidän tehdessään matalatehoista aerobista harjoitusta. 23 Tehtävä 8: Ensiaputaidot Ensiapu on loukkaantuneelle tai sairastuneelle henkilölle tapahtumapaikalla usein nopeasti annettavaa apua, jolla pyritään turvaamaan autettavan peruselintoiminnot sekä estämään hänen tilansa paheneminen. Ensiavun käsite pitää sisällään monenlaisia auttamisen taitoja; se voi olla tilanteesta riippuen esimerkiksi hätäkeskukseen soittamista, tilannearvion tekemistä onnettomuuspaikalla, sairauskohtauksissa auttamisen taitoja, haavojen sidontaa, henkistä tukemista, tukehtumisen estämistä tai paineluelvytystä. Ensiapua ja hätäensiapua voidaan antaa, vaikka antajalla ei olisi erityistä ammattitaitoa tai välineitä. Usein maallikon antama apu parantaa huomattavasti apua saavan mahdollisuuksia selviytyä ja toipua. LähiTapiolan Arjen katsaus –kyselyn (n=1026) tulosten mukaan noin 36% ihmisistä osaisi oman arvionsa mukaan antaa ensiapua liikenneonnettomuuden sattuessa. Valitaan viiden hengen satunnainen otos suomalaisia. Asetetaan satunnaismuuttujaksi X otokseen valittujen liikenneonnettomuustilanteessa ensiaputaitoisten henkilöiden lukumäärä. a) Perustele, mitä jakaumaa satunnaismuuttuja X noudattaa ja miksi. b) Muodosta satunnaismuuttujan X jakauma, esitä se taulukossa ja selvitä, mikä on sen todennäköisin arvo. Lisää aiheesta: Ensiapuohjeita eri tilanteisiin, Suomen Punainen Risti. Maailman elvytyspäivä 16.10.(WorldRestartAHeart) ja biisejä elvytystilanteeseen, SPR ja Sydänliitto. Arjen katsaus –kysely 2021: Miten suomalaiset toimivat liikenneonnettomuuden sattuessa, LähiTapiola. Auttamisen taitoja harjoitellaan suomalaiskouluissa jo alakoulusta lähtien ja moni suomalainen käy ensiapukurssin tai – kursseja. Suomen Punaisen Ristin (SPR) Ensiapukurssi EA 1® - koulutus on virallinen sertifioitu koulutus, josta saa Punaisen Ristin ensiapukortin eli pätevyystodistuksen. Kurssin suorittanut hallitsee ensiavun antamisen perusteet kurssin sisällön mukaisissa aiheissa. SPR Ensiapukurssi EA 1® -todistus on voimassa 3 vuotta. PSST! Bee Gees yhtyeen Stayin' Alive –kappaleessa on oikea rytmi (104 lyöntiä minuutissa) paineluelvytyksen antamiseen. Kappale on esimerkiksi Amerikan sydänliiton (the American Heart Association) suosittelema elvytyksen taustalle. 24 Eräs malliratkaisu a) Tehtävän tilannetta voidaan ajatella toistokokeena, jossa toistoja on viisi. Niin sanotun onnistuneen toiston eli tässä ensiaputaitoisen henkilön löytymisen todennäköisyys on jokaisella toistolla sama 36% eli 0,36. Toistokokeessa onnistuneiden toistojen lukumäärä noudattaa aina binomijakaumaa eli 𝑋 ~ Bin(5; 0,36), jossa satunnaismuuttuja X on otokseen valittujen liikenneonnettomuustilanteessa ensiaputaitoisten henkilöiden lukumäärä. b) Ensiaputaitoisia henkilöitä voi olla viiden henkilön joukossa 0, 1, 2, 3, 4 tai 5. Näin ollen satunnaismuuttujan X mahdolliset arvot 0, 1, 2, 3, 4 tai 5. Lasketaan eri arvoja vastaavat pistetodennäköisyydet toistokokeen kaavalla 𝑃(𝑋 = 𝑘) = (𝑛𝑘)𝑝 𝑘𝑞𝑛−𝑘, jossa n on toistojen määrä. Tässä n=5; k=0, 1, 2, 3, 4, 5; p=0,36 ja q=1-p=1-0,36. Viiden joukossa on 0 ensiaputaitoista: 𝑃(𝑋 = 0) = (50)0,36 0 ∙ 0,645 = 0,1073… ≈ 0,11 Viiden joukossa on 1 ensiaputaitoinen: 𝑃(𝑋 = 1) = (51)0,36 1 ∙ 0,644 = 0,3019… ≈ 0,30 Viiden joukossa on 2 ensiaputaitoista: 𝑃(𝑋 = 2) = (52)0,36 2 ∙ 0,643 = 0,3397… ≈ 0,34 Viiden joukossa on 3 ensiaputaitoista: 𝑃(𝑋 = 3) = (53)0,36 3 ∙ 0,642 = 0,1911… ≈ 0,19 Viiden joukossa on 4 ensiaputaitoista: 𝑃(𝑋 = 4) = (54)0,36 4 ∙ 0,641 = 0,0537… ≈ 0,05 Viiden joukossa kaikki ovat ensiaputaitoisia: 𝑃(𝑋 = 5) = (55)0,36 5 ∙ 0,640 = 0.0060… ≈ 0.01 Tämä on satunnaismuuttujan X jakauma. Se voidaan esittää taulukkona k P(X=k) 0 0,11 1 0,30 2 0,34 3 0,19 4 0,05 5 0,01 Satunnaismuuttujan X todennäköisin arvo on 2, sillä sitä vastaava pistetodennäköisyys 0,34 on suurin. Täten siis on todennäköisintä, että viiden henkilön joukosta ensiaputaitoisia on kaksi. 25 Tehtävä 9: Koulukiusaaminen Koulukiusaaminen on koulussa tai muussa oppilaitoksessa tapahtuvaa psyykkistä, sosiaalista tai fyysistä väkivaltaa, joka on tarkoituksellista ja toista vahingoittavaa. Kiusaaminen on sen uhrille henkisesti vahingollista ja voi aiheuttaa traumoja, jotka saattavat jatkua läpi elämän. Kouluterveyskyselyssä 2021 yhteensä 91 560 8. ja 9. luokkalaiselta kysyttiin: ”Kuinka usein sinua on kiusattu koulussa tämän lukukauden aikana?” Merkitään edellä mainittua kiusaamisen yleisyyttä kartoittavaa kysymystä diskreetillä satunnaismuuttujalla X. Alla olevan taulukon jakauma mukailee saatuja tuloksia. a) Laadi jakaumasta pylväsdiagrammi. b) Määritä suhteellinen frekvenssi f%, summafrekvenssi sf ja suhteellinen summafrekvenssi sf%. c) Selvitä, millä todennäköisyydellä 8. tai 9. luokan opiskelija on joutunut kiusaamisen uhriksi lukukauden aikana. Lisää aiheesta: Tietoa koulukiusaamisesta, KiVa Koulu Niko Tiuraniemen tarina kiusatuksi joutumisesta, Yle 20.2.2022 Kiusaamisen yleisyys yläkoulussa ja toisella asteella vuosina 2006-2021, THL Kouluterveyskysely Kiusaamisen vastainen toimenpideohjelma KiVa Koulu, KiVA Koulu –ohjelma ja Turun yliopisto Koulukiusaamisen vastaisten ohjelmien arviointi, Yle 20.10.2021 Harjoituksia mielenterveyden vahvistamiseen, Suomen Mielenterveys ry Koulukiusaaminen on maailmalla ja sitä ehkäiseviä asioita, Unesco, The Global Education 2030 Agenda –hanke x f useita kertoja viikossa 2 106 noin kerran viikossa 3 388 harvemmin 17 213 ei lainkaan 68 853 Koulukiusaamisella on niin yksilö-, yhteisö- kuin väestötasonkin seurauksia. Kiusaaminen aiheuttaa turvattomuuden tunnetta sekä kiusatulle että hänen koululuokalleen. Se on vakava uhka hyvinvoinnille ja terveydelle, ja voi aiheuttaa mm. itsetunto-ongelmia, ahdistuneisuutta, yksinäisyyttä ja vaikeutta luottaa muihin ihmisiin. Kiusaaminen voi jättää jälkensä kiusattuun pysyvästi ja olla yhteydessä psyykkisen ja sosiaalisen terveyden sekä työelämässä menestymisen ongelmiin myös aikuisuudessa. Kiusaamisen kova hinta näkyy sekä sen inhimillisissä että kansanterveydellisissä kustannuksissa. Alla olevat kuvat Unescon Behind the numbers: Ending school violence and bullying –raportista (2019). 26 Eräs malliratkaisu Tässä ratkaisussa on käytetty MS Excel –ohjelmistoa ja TI-Nspire CX CAS –ohjelmistoa. a) Laaditaan tehtävänannon taulukon pohjalta pylväsdiagrammi. b) Määritetään suhteellinen frekvenssi f%, summafrekvenssi sf ja suhteellinen summafrekvenssi sf%. Käytetään apuna taulukkolaskentaa. Sarakkeissa käytetyt laskukaavat (soluviittaukset): c) Oletetaan, että 8. tai 9. luokan opiskelija on joutunut kiusaamisen uhriksi lukukauden aikana, jos hän on vastannut kysymykseen ”Kuinka usein sinua on kiusattu koulussa tämän lukukauden aikana?” joko ”useita kertoja viikossa”, ”noin kerran viikossa” tai ”harvemmin”. Näin ollen yhteenlaskusäännön nojalla: 𝑃(𝑜𝑝𝑖𝑠𝑘𝑒𝑙𝑖𝑗𝑎𝑎 𝑘𝑖𝑢𝑠𝑎𝑡𝑡𝑢) = 0,0230013 + 0,0370031 + 0,187997 𝑃(𝑜𝑝𝑖𝑠𝑘𝑒𝑙𝑖𝑗𝑎𝑎 𝑘𝑖𝑢𝑠𝑎𝑡𝑡𝑢) = 24,8001 ≈ 0,2480. Siis opiskelija on joutunut lukuvuoden aikana kiusaamisen uhriksi todennäköisyydellä 0,2480. Toisin sanoen 24,80 %:a 8. ja 9. luokan opiskelijoista on kiusattu kuluneen lukuvuoden aikana. 27 Tehtävä 10: Terveyspalveluiden käyttö eri ikäryhmissä Tutkitaan iän ja terveyskeskuskäyntien välistä yhteyttä. Alla olevassa kuviossa on esitetty perusterveydenhuollon käynnit** palvelumuodoittain ja ikäryhmittäin vuonna 2017 (Lähde: Suomalaisten sosiaali- ja terveyspalveluiden käyttö tilastojen valossa). a) Laadi pylväskuvion pohjalta taulukko perusterveydenhuollon käyntien lukumääristä eri ikäryhmissä 100 000 käynnin tarkkuudella. Muodosta taulukon pohjalta hajontakuvio. b) Sovita aineistoon lineaarinen malli ja toisen asteen polynominen malli. c) Määritä mallien selitysasteet ja lineaarisesta mallista iän ja terveyskeskuskäyntien välinen korrelaatiokerroin. Tulkitse riippuvuuden voimakkuutta ja pohdi tulosta mahdollisesti vääristäviä tekijöitä. Alle kouluikäisillä lapsilla lastenneuvolapalvelut ovat yleisin palvelumuoto. Työikäiset käyttävät eniten avosairaanhoidon ja työterveyshuollon palveluja sekä äitiysneuvolapalveluja. Vanhimmissa ikäryhmissä avosairaanhoito ja kotisairaanhoito ovat merkittävimmät palvelumuodot. PSST! Suomalaisten terveys on parantunut viime vuosikymmeninä paljon, mutta siitä huolimatta terveyserot eivät ole kaventuneet eri väestöryhmien välillä. Muun muassa henkilön ikä, sukupuoli, asuinalue, siviilisääty, äidinkieli ja sosioekonominen asema vaikuttavat kukin osaltaan yksilön terveyteen, mutta myös terveyteen väestötasolla luoden eriarvoisuutta väestöryhmien välille. Esimerkiksi terveys- ja toimintakyky heikkenevät iän myötä, miehet sairastavat naisia enemmän sydän- ja verisuonitauteja, asuinalueiden erilaiset elinolosuhteet (kuten työllisyystilanne, elämänmeno, sosiaali- ja terveyspalveluiden saavutettavuus) heijastuvat kansantautien sairastavuuteen, parisuhteessa elävien koettu terveys on parempi ja elinikä pidempi kuin yksineläjillä ja suomenruotsalaiset ovat suomenkielisiä terveempiä. Mitä parempi on henkilön sosioekonomisen asema, sitä terveempi ja hyvinvoivempi hän todennäköisesti on. Vähäinen koulutus, epävarma ja heikko ammatillinen asema (pienituloisuus) sekä vähäinen varallisuus ovat vahvasti yhteydessä toisiinsa sekä huonon terveyden ja pahoinvoinnin kasaantumiseen. Erot terveyskäyttäytymisessä, kuten tupakoinnissa ja alkoholinkäytössä, selittävät arviolta noin puolet terveyden sosioekonomisista eroista. Sosioekonomiseen asemaan liittyvät terveyserot ovat monimutkainen toisiinsa linkittyvien syiden ja seurausten vyyhti. Yhteiskunnalliset rakenteet vaikuttavat sosioekonomisen aseman muotoutumiseen ja terveyttä heikentävän sosiaalisen eriarvoisuuden syntyyn. Kuitenkin yksi suomalaisen terveyspolitiikan perusperiaatteista on tarjota jokaiselle terveydentilan edellyttämät riittävät ja laadukkaat palvelut sosioekonomisesta asemasta, taloudellisista edellytyksistä tai asuinalueesta riippumatta. Käytännössä erot terveysosaamisessa sekä terveyteen liittyvissä tiedoissa ja taidoissa aiheuttavat sen, että eri sosioekonomisessa asemassa olevat henkilöt eivät ole yhdenvertaisia palveluihin hakeuduttaessa. Lisäksi esim. asuinalue ja ikä vaikuttavat palveluiden saatavuuteen ja saavutettavuuteen. Edellä mainituista syistä perusterveydenhuollon palveluiden käyttö vaihtelee eri väestöryhmissä. * Sisältää päihdetyön, perhesuunnittelu-, ehkäisy-, kasvatus- ja perheneuvolapalvelut sekä muut neuvolapalvelut, seulonnat ja joukkotarkastukset, apuvälinepalvelut, puhe- toiminta-, jalka- ja ravitsemusterapian, terveyssosiaalityön, muut kuntoutus- ja erityisterapiat, päivätoiminnan, päiväsairaalatoiminnan sekä muun palvelutoiminnan. ** Perusterveydenhuollon avohoidon käynnit vastaanotolla, kotikäynnit, työpaikkakäynnit ja sairaalakäynnit. 28 Eräs malliratkaisu Tässä ratkaisussa on käytetty TI-Nspire CX CAS –ohjelmistoa. a) Laaditaan pylväsdiagrammin pohjalta taulukko, josta nähdään, paljonko käyntejä kussakin ikäryhmässä on. Ikäryhmät ovat itse asiassa luokkia, joiden luokkakeskukset saadaan laskettua luokan todellisen alarajan ja todellisen ylärajan keskiarvona. Merkitään siis taulukkoon ikäryhmät, niiden luokkakeskukset (ikä-sarake) hajontakuvion laatimista helpottamaan sekä terveyskeskuskäynnit (tk_käynnit-sarake) kyseisessä ikäryhmässä 100 000 käynnin tarkkuudella ja muodostetaan hajontakuvio: b) Piirretään lineaarinen malli (regressiosuora) ja toisen asteen polynominen malli: Lineaarinen malli (suora) 𝑦 = 6156,8𝑥 + 1,72715 ∙ 106 2. asteen polynominen malli (paraabeli) 𝑦 = −1063.49𝑥2 + 115371𝑥 + 920146 c) Iän ja terveyskeskuskäyntien väliseksi korrelaatiokertoimeksi saadaan laskinohjelmiston avulla r=0,711371. Näin ollen iän ja terveyskeskuskäyntien välinen korrelaatio on siis huomattava (ks. korrelaatiokertoimen tulkintataulukko, MAOL). Lisäksi koska korrelaatio on positiivinen, niin voidaan todeta, että iän kasvaessa myös terveyskeskuskäyntien määrä lisääntyy. Selitysaste on korrelaatiokertoimen neliö eli r²=0,506048 eli noin 50,6%. Voidaan siis sanoa lineaarisen mallin mukaan iän selittävän 50,6% terveyskeskuskäyntien määrän vaihtelusta. Laskinohjelmistolla saadaan toisen asteen polynomisen mallin selitysasteeksi r²=0,837506 eli noin 83,8%, joka selittää jo yli neljä viidesosaa terveyskeskuskäyntien määrän vaihtelusta. Selitysasteiden perusteella toisen asteen polynominen malli sopii kuvaamaan aineistoa lineaarista mallia paremmin. Toisen asteen mallissa 29 terveyskeskuskäyntien määrä on huipussaan noin 50-vuotiailla, jonka jälkeen käyntien määrä vähenee, kun taas lineaarisessa mallissa käyntien määrä kasvaa tasaisesti iän karttuessa. Saatua tulosta saattaa vääristää tehtävänannossa asetettu terveyskeskuskäyntien määrän suurpiirteinen tarkkuus sekä etenkin aineiston ikäryhmä-luokkien eri laajuudet: luokkavälit ovat eripituisia, mikä on hyvien laskukäytänteiden vastaista. Tuntuu luonnolliselta, että luokkaväliltään pisimmällä ikävälillä 25-49-vuotiaissa myös terveyskeskuskäyntejä on eniten. Jos kyseinen luokka olisi jaettu kahdeksi ikäryhmäksi, on mahdollista, että lineaarinen malli olisi kuvannut aineistoa toisen asteen mallia paremmin, sillä muiden datapisteiden perusteella vaikuttaisi siltä, että terveyskeskuskäyntien määrä lisääntyy iän myötä. 30 Tehtävä 11: Rokotteen rooli taudin leviämisen ehkäisyssä Yksittäiset tautitartunnat puhkeavat populaatiossa tautiaalloksi tartunnan saaneiden määrän kasvaa. Jos jokainen sairastunut tartuttaa enemmän kuin yhden ihmisen, tauti alkaa levitä populaatiossa eksponentiaalisesti. Kuinka suuresta tautiaallosta populaatiossa on kyse, riippuu siitä, kuinka monta kukin sairastunut tartuttaa. Oletetaan, että tauti X on erittäin helposti tarttuva ja jokaista sataa ei-immuunia ihmistä kohden 96 sairastuu kohdatessaan tautia sairastavan henkilön. Oletetaan myös, että tautiin X kehitetty rokote on 95 %:n varma eli 95 ihmistä 100:sta ovat täysin immuuneja taudin tarttumiselle. a) Oletetaan, että ensimmäinen tautiin sairastunut henkilö on tekemisissä kahdenkymmenen terveen kanssa. Tutki, montako ihmistä yksi sairastunut keskimäärin altistaa taudin tartunnalle. Pohdi, pääseekö tauti leviämään populaatiossa epidemiaksi jokaisen populaation jäsenen otettua rokotteen. b) Tutki a-kohdan oletuksin tilannetta, jossa 5 % populaatiosta on jättänyt rokotteen ottamatta. c) Tutkitaan taudin X leviämistä rokottamattomien, ei-immuunien ihmisten n-henkisessä ketjussa sairastuneelta taudinkantajalta S terveelle, ketjun viimeiselle henkilölle 𝑇𝑛, kun S tapaa ensin henkilön 𝑇1, sitten 𝑇1 tapaa henkilön 𝑇2 ja niin edelleen, kunnes jonon toiseksi viimeinen, n-1:s henkilö 𝑇𝑛−1 kohtaa viimeisen henkilön 𝑇𝑛. Oletetaan kohtaamisaikavälien olevan tarttumisen kannalta suotuisat. Vertaile 100 %-rokottautuneen yhteisön tilannetta täysin rokottautumattoman yhteisön tilanteeseen tutkimalla henkilön 𝑇𝑛 tartunnan saamisen todennäköisyyttä eri jonon pituuksilla n=5, n=20 ja yleisessä tapauksessa n. Lisää aiheesta: Infektioiden tartunta, taudin synty ja leviäminen, Duodecim. PSST! Taudin yleisellä leviämiskyvyllä kuvataan sitä, kuinka monta uutta henkilöä yksi sairastunut keskimäärin tartuttaa ympäristössään. Esimerkiksi tuberkuloosipotilas tartuttaa keskimäärin 0,5 henkilöä ja tuhkarokkopotilas 18. Tätä leviämiskyvyn ilmoittamisessa käytettyä lukua kutsutaan R0-luvuksi, joka on sitä suurempi, mitä helpommin tauti leviää. R0-luvun ollessa pienempi kuin 1 tauti ei yleensä aiheuta epidemioita. Käytännössä siihen, kuinka paljon uusia tapauksia kukin sairastunut tartuttaa ja kuinka tehokkaasti tauti leviää yhteisössä, vaikuttaa myös ihmisyhteisön tiiviys, ihmisten käyttäytyminen ja minkä pituisesta tartuttavavasta vaiheesta on kyse. Tietyissä yhteisöissä, kuten perheissä, päiväkodeissa ja puolustusvoimien kasarmeissa, leviävät herkästi sellaisetkin taudit, joiden leviämiskyky muuten on vähäinen esim. kausi-influenssat. 31 Eräs malliratkaisu a) Kaikki yhteisön jäsenet ovat rokotettuja. Tautiin sairastunut henkilö tapaa siis 20 ihmistä. Rokotteen vuoksi 95 % heistä ovat immuuneja, joten tauti voi teoreettisesti tarttua vain 0,0520=1 henkilöön. Todennäköisyys, että tauti tarttuu tähän ei-immuuniin henkilöön, on 0,96 eli taudin tarttumisen todennäköisyys on huomattavan suuri. Tauti X ei kuitenkaan pääse puhkeamaan tautiaalloksi ja häviää, sillä jokainen tartunnan saanut henkilö tartuttaa keskimäärin vain yhden ihmisen eikä aina sitäkään. b) Tutkitaan tapausta, jossa 5 % populaatiosta ei ota rokotetta. Tauti voi potentiaalisesti tarttua rokotettuihin ei-immuuneihin henkilöihin, joita on populaatiosta 100%− 95% = 5% sekä rokottamattomiin ihmisiin, joita on populaatiosta 5 %, eli yhteensä 5%+ 5% = 10% eli kymmenesosaan populaatiosta. Kun ensimmäisenä tartunnan saanut tapaa 20 ihmistä, voi tauti yhteensä siis tarttua 0,1 ∙ 20 = 2 eli kahteen henkilöön. Nyt todennäköisyys, että tauti tarttuu molempiin, on 0,96 ∙ 0,96 = 0,9216. Voidaankin siis sanoa, että noin 92 %:n todennäköisyydellä sairastunut henkilö tartuttaa kaksi henkilöä. Todennäköisyys, että tauti tarttuu vain toiseen kahdesta, on jaettavissa kahteen tapaukseen. Joko tauti tarttuu henkilöön A eikä tartu henkilöön B tai tauti ei tartu henkilöön A ja tarttuu henkilöön B. Merkitään A="tauti tarttuu vain henkilöön A" ja B="tauti tarttuu vain henkilöön B". Tapaukset A ja B ovat selvästi toisensa poissulkevat, joten saadaan 𝑃((𝐴 ∩ 𝐵𝐶) ∪ (𝐴𝐶 ∩ 𝐵)) = 𝑃(𝐴)𝑃(𝐵𝐶) + 𝑃(𝐴𝐶)𝑃(𝐵) = 0,96 ∙ 0,04 + 0,04 ∙ 0,96 = 2 ∙ 0,04 ∙ 0,96 = 0,0768. Siis todennäköisyys sille, että vain toinen saisi taudin on noin 8 %. Todennäköisyys, ettei kumpikaan saa tautia on 0,04 ∙ 0,04 = 0,0016. Täten todennäköisyys, ettei kumpikaan saisi tartuntaa on todella pieni, vain noin 2 ‰. Havainnollistetaan laskettuja tartunnan todennäköisyyksiä puukaaviolla: 32 On siis selvästi todennäköisintä, että yksi sairastunut tartuttaa kaksi henkilöä ja tämä riittää tartunta-aallon puhkeamiseen. Nimittäin keskimäärin jokainen sairastunut tartuttaa 1,92 (0,962) ihmistä. Vaikka rokote tautiin X on tehokas suojaten 95 % ottajistaan, niin tämän tehtävän tilanteessa, taudin ollessa erittäin tarttuva, laumaimmuniteettia ei saavuteta vielä sillä, että 95 % populaatiosta ottaa rokotteen. c) Piirretään tehtävän havainnollistukseksi kuva tartuntaketjusta: Tutkitaan ensin tilannetta, jossa kaikki jonon henkilöt ovat rokottamattomia. Jonon ensimmäiseen henkilöön tauti X tarttuu todennäköisyydellä 0,96. Jotta tauti tarttuisi jonon viimeiseen henkilöön 𝑇𝑛 (jonon n:s henkilö), sen täytyy tarttua hänen lisäkseen jokaiseen henkilöön kohtaamisten ketjussa ennen häntä. Siis todennäköisyys, että tauti tarttuu henkilöön 𝑇𝑛 on 𝑃(𝑇𝑛 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢) = 𝑃(𝑇1𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑗𝑎 𝑇2 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 𝑗𝑎 … 𝑗𝑎 𝑇𝑛 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢) 𝑃(𝑇𝑛 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢) =∏𝑃(𝑇𝑖 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢 ) 𝑛 1 𝑃(𝑇𝑛 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢) = 0,96 ∙ 0,96 ∙ … ∙ 0,96 𝑃(𝑇𝑛 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢) = 0,96 𝑛. Huomautus! Tehtävän havainnollistus taudilla X on hieman kärjistetty. Todellisuudessa useimmilla tartuntataudeilla laumaimmuniteetti saavutetaan, kun noin 95 % populaatiosta ottaa rokotteen, sillä suurin osa tartuntataudeista ei ole tartuttavuudeltaan taudin X tasoa. Viruksen aiheuttamat rokot ovat taudeista helpoimmin tarttuvia, esimerkiksi tuhkarokon tarttuvuus on noin 90 %:n luokkaa. 33 Siis n-henkisessä tartuntaketjussa todennäköisyys, että tauti tarttuu jonon viimeiseen henkilöön on 0,96𝑛. Näin ollen todennäköisyys on sitä pienempi, mitä pidempi jono on. Kun jono on viisihenkinen, todennäköisyys että tauti X tarttuu jonon viimeiseen henkilöön, on 𝑃(𝑇5 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢) = 0,965 = 0,815372… ≈ 0,8154. Vastaavasti, kun jono on 20-henkinen, saadaan 𝑃(𝑇20 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢) = 0,9620 = 0,442002… ≈ 0,4420. Sekä viisi- että 20-henkisessä jonossa tartunnan todennäköisyys on täten huomattavan suuri. Tarkastellaan sitten tilannetta, jossa kaikki jonon henkilöt ovatkin rokotettuja. Tällöin 𝑃(𝑇𝑛 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢) = 0,05𝑛, jolloin 𝑃(𝑇5 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢) = 0,055 = 0,000000312 ja 𝑃(𝑇20 𝑠𝑎𝑖𝑟𝑎𝑠𝑡𝑢𝑢) = 0,0520 = 9,5. .∙ 10−27 ≈ 0. Siis tartunnan leviäminen jonossa, jossa kaikki ovat rokotettuja, on hyvin epätodennäköistä viisihenkisessä jonossa ja lähes mahdotonta 20-henkisessä jonossa. Huomautus! Tässä ketjuesimerkissä huomataan hyvin, että sairastunut henkilö tartuttaa muita myös epäsuorasti. Todellisuudessa tartuntaketjut muodostavat tartuntaverkkoja sairastuneen henkilön tavatessa useita ihmisiä ja toisaalta myös näiden henkilöiden taas tavatessa muita ihmisiä. 34 Tehtävä 12: Tautitestin luotettavuustarkastelu Moni virus, kuten tässä tehtävässä tutkittava HI-virus, voidaan havaita pääosin terveyskeskuksissa ja sairaaloissa tehtävillä testeillä. Tällaisia ovat esimerkiksi verinäytteestä tehtävät vasta-aine- ja antigeenitestit. Oletetaan, että HI-virusta kantaa väestössä kolme ihmistä tuhannesta. Jos ihmisellä on HI-virus, tietty testi ilmoittaa 95 % varmuudella, että ihmisellä on kyseinen virus. Jos taas ihmisellä ei ole virusta, testi ilmoittaa 95 % varmuudella, että ihmisellä ei ole virusta. Oletetaan myös sekä väärien positiivisten että väärien negatiivisten testituloksien osuuden olevan kummankin 5 %. Millä todennäköisyydellä a) testitulos on positiivinen, b) testitulos on negatiivinen, c) ihmisellä on virus, jos tiedetään testituloksen olevan positiivinen, d) ihmisellä ei ole virusta, jos tiedetään testituloksen olevan positiivinen? Pohdi testin luotettavuutta. e) Tarkastellaan tilannetta Etelä-Karjalassa, jossa oli vuonna 2017 Suomen korkein HIV-ilmaantuvuus (6,1/100 000). Oletetaan muutoin tehtävänannon tiedot testistä oikeiksi. Millä todennäköisyydellä positiivisen testituloksen saaneella henkilöllä ei ole virusta? Lisää aiheesta: HIV sairautena, Hivpoint (Hiv-säätiö). PSST! HIV on krooninen autoimmunologinen sairaus, jonka aiheuttaa HI-virus. Viruksen aiheuttamille haitoille ei toistaiseksi ole löydetty parannuskeinoa, mutta lääkehoidoilla pystytään pitämään viruksen aiheuttamat vauriot hallinnassa. Taudin varhainen toteaminen on tärkeää, jotta hoito toteutuu parhaalla mahdollisella tavalla eikä infektoituneen elimistön puolustuskyky laske viruksen tuhotessa valkosoluja, jotka suojaavat elimistöä taudinaiheuttajilta. Hoitamattomana HIV-infektio voi edetä pahimmillaan henkeä uhkaavaan AIDS-vaiheeseen, jossa elimistön puolustusjärjestelmä heikentyy vakavasti. HI-viruksen aiheuttama tartunta voidaan havaita verinäytteestä tehtävällä vasta-ainetestillä. Tämä tehtävä perustuu Richard Isaacin kirjassaan The Pleasures of Probability (s. 31-34) esittämään esimerkkiin HIV-testin luotettavuuden tutkimisesta. Esimerkissä testi on viruksen havaitsemiseksi sikäli hyvä, että jos henkilöllä on virus, sen havaitsemisen todennäköisyys verikokeella on korkea; suuressa ryhmässä, jonka tiedetään koostuvan vain tartunnan saaneista, testi antaa oikean, positiivisen tuloksen 95 prosentilla ryhmästä. Tässä yhteydessä puhutaan testin sensitiivisyydestä, joka edeltävässä tapauksessa on 0.95. Merkitään todennäköisyyttä, että testi on positiivinen henkilön ollessa taudin kantaja, seuraavasti P(testi positiivinen | henkilöllä tauti) = 0.95. Testi siis vaikuttaa intuitiivisesti hyvin luotettavalta. Seuraavaksi keskitytään kuitenkin tutkimaan mahdollisia virhetuloksia, jotka ovat P(testi positiivinen | henkilöllä ei ole virusta) eli väärä positiivinen tulos ja P(testi negatiivinen | henkilöllä on virus) eli väärä negatiivinen tulos. 35 Eräs malliratkaisu a) Merkitään seuraavasti V = ”ihmisellä on virus”, E = V 𝑐 = ”ihmisellä ei ole virusta”, P = ”testi on positiivinen”, N = P 𝑐 = ”testi on negatiivinen”. Halutaan siis selvittää 𝑃(𝑃). Tunnetaan todennäköisyydet 𝑃(𝑉) = 3 1000 = 0,003 𝑃(𝐸) = 1 − 0,003 = 0,997 𝑃(𝑃|𝑉) = 𝑃(𝑁|𝐸) = 0,95 𝑃(𝑁|𝑉) = 𝑃(𝑃|𝐸) = 1 − 0,95 = 0,05. Sijoittamalla tunnetut todennäköisyydet kokonaistodennäköisyyskaavaan (Lause 2) saadaan, että testitulos on positiivinen todennäköisyydellä 𝑃(𝑃) = 𝑃(𝑃|𝑉)𝑃(𝑉) + 𝑃(𝑃|𝐸)𝑃(𝐸) = 0,95 ∙ 0,003 + 0,05 ∙ 0,997 = 0,0527. Koska todellisuudessa HIV-virusta kantaa 0,3 % väestöstä, huomataan testin antavan positiivisia tuloksia enemmän kuin taudinkantajia todellisuudessa on. b) Tarkastellaan negatiivisen testituloksen todennäköisyyttä 𝑃(𝑁) = 𝑃(𝑁|𝑉)𝑃(𝑉) + 𝑃(𝑁|𝐸)𝑃(𝐸) = 0,05 ∙ 0,003 + 0.95 ∙ 0,997 = 0,9473. Tähän oltaisiin päästy yhtä lailla vastatapahtuman todennäköisyyden avulla (komplementtikaava). Tuloksesta huomataan testin antavan viruksen todelliseen esiintyvyyteen verrattuna liian vähän negatiivisia tuloksia. c) Lasketaan seuraavaksi Bayesin kaavalla (Lause 3) ehdolliset todennäköisyydet käänteistapauksille P(V|P) ja P(E|P). Positiivisen testituloksen saanut henkilö on viruksen kantaja todennäköisyydellä 𝑃(𝑉|𝑃) = 𝑃(𝑃|𝑉) 𝑃 (𝑉) 𝑃(𝑃) = 0,95∙0,003 0,0527 = 0,05407. . ≈ 0,05. Siis vain 5 % saaduista positiivisista tuloksista tarkoittaa, että testin tehneellä henkilö on todellisuudessa viruksen kantaja. d) Vastaavasti positiivisen testituloksen saaneella henkilöllä ei ole virusta todennäköisyydellä 36 𝑃(𝐸|𝑃) = 𝑃(𝑃|𝐸) 𝑃 (𝐸) 𝑃(𝑃) = 0,05∙0,997 0,0527 = 0,94592. . ≈ 0.95. Samaan tulokseen päästäisiin myös komplementtikaavalla 𝑃(𝐸|𝑃) = 1 − 𝑃(𝑉|𝑃) = 1 − 0,05 = 0,95. Siis 95 % positiivisista testituloksista tulee virheellisesti terveille henkilöille. Huomataan, että intuitiivisesti luotettavalta vaikuttanut HIV-testi osoittautuikin huonoksi tavaksi seuloa tartuntoja. Testin huono luotettavuus johtuu virheellisten positiivisten tulosten suuresta määrästä, joka taas johtuu siitä, että vaikka virheellisten tulosten todennäköisyys on pieni (0.05), niin virheellisiä positiivisia tuloksia syntyy runsaasti, koska terveiden ihmisten osuus on suuri (0.997). e) Etelä-Karjalassa 2017 positiivisen testituloksen saaneella henkilöllä ei ole virusta todennäköisyydellä 𝑃(𝐸|𝑃) = 𝑃(𝑃|𝐸) 𝑃 (𝐸) 𝑃(𝑃) = 𝑃(𝑃|𝐸) 𝑃(𝐸) 𝑃(𝑃|𝑉)𝑃(𝑉)+𝑃(𝑃|𝐸)𝑃(𝐸) = 0,05∙0,999939 0,95∙0,000061+0,05∙0,999939 ≈0,99. Tässä testi siis vaikuttaisi vieläkin epäluotettavammalta. Todellisuudessa HI-viruksen havaitsemisessa vasta-ainetestillä oleellinen luotettavuustekijä on se, kuinka kauan mahdollisesta tartuntahetkestä on kulunut aikaa. Jos HIV-vasta-ainetta ei ole kolmessa kuukaudessa tartunnasta kehittynyt, voi olla varma, ettei ole viruksen kantaja eli negatiivinenkin testitulos on vasta tuolloin varmasti luotettava. Yleensä vasta-aineet kehittyvät kuitenkin muutamassa viikossa tartunnan jälkeen. Huomautus: Vastaavasti saataisiin laskettua myös todennäköisyydet tapauksille, joissa negatiivisen testituloksen saanut henkilö on viruksen kantaja tai terve henkilö, ja saataisiin P (V|N) ≈ 0,0002 ja P (E|N) ≈ 0,9998. Havainnollistetaan laskettuja ehdollisia todennäköisyyksiä puukaaviolla: