Otantatutkimus

  1. Otokset
  2. Näytteet
  3. Otantasuhde
  In English   En Español   Sisällysluettelosivulle

Sitä yksilöiden tai tapausten ryhmää kokonaisuudessaan, jonka ominaisuuksia halutaan saada selville, nimitetään perusjoukoksi (target population).

Empiirisessä tutkimuksessa perusjoukko koostuu fyysisistä kohteista kuten ihmisistä, esineistä taikka tapahtumista. Monografiassa kohteena on vain yksi tapaus, mutta teorian kehittämiseen tähtäävässä perustutkimuksessa perusjoukko useinkin on ääretön, eli halutaan tietoa, joka pätee jokaiseen vastaavaan tapaukseen koko maailmankaikkeudessa.

Sitten kun populaatio on saatu rajatuksi, sen yksilöiden tai tapausten ominaisuuksia voidaan selvittää kahdella tavalla: joko tutkitaan koko perusjoukko, taikka sen osa. Silloin, kun tutkija todella havainnoi tai mittaa kaikki perusjoukon yksilöt tai tapaukset, on kysymyksessä kokonaistutkimus. Se antaa kohteestaan erinomaisen tarkan kuvan, mutta se on mahdollinen vain silloin, kun perusjoukko ei ole liian suuri ja sen kaikkiin tapauksiin voidaan päästä käsiksi.

Kokonaistutkimus on verrattain kallis metodi, sillä empiirinen työ vaatii usein aikaa, laitteita ja matkustamista. Onkin syytä pitää mielessä, etteivät tutkimuksen päämäärät aina vaadi täysin täsmällistä selvitystä perusjoukon jokaisesta tapauksesta, vaan luotettava arvio voisi monesti riittää. Niinpä onkin tavallista että suoranaiset tutkimustoimet kohdistetaan vain niin moneen perusjoukon tapaukseen kuin katsotaan hankkeen tavoitteiden vaativan ja resurssien riittävän. Tähän pääsemiseksi on useita lähestymistapoja:

Periaatteessa kokonaistutkimuksen pitäisi tuottaa otantatutkimusta tarkempi tulos. Usein käy kuitenkin päinvastoin, etenkin niissä tapauksissa jolloin perusjoukko on hyvin suuri tai vaikeasti tavoitettavissa, ja tutkimuksen resurssit ovat pienet. Tällöin näet tutkittaessa koko perusjoukko, sen jokaista yksilöä kohti käytettävissä oleva tutkimustyöpanos saattaisi jäädä niin pieneksi, että tutkimus jäisi kovin pinnalliseksi. Tällaisessa tapauksessa saadaan parempi tulos siten, että tutkitaan vain osa perusjoukosta, ja tehdään työ sitä paremmin.

Muistettakoon, että otantatutkimuksessa tutkijaa ei niinkään kiinnosta näyte, vaan perusjoukko. Tutkittavaksi otettava ryhmä koetetaan siis poimia niin, että sen tutkijaa kiinnostavat ominaisuudet ovat keskimäärin samat kuin perusjoukossa keskimäärin. Tällöin sanotaan, että ryhmä on edustava.

Yleisesti käytetyt tutkittavan ryhmän poiminnan menetelmät perustuvat jompaankumpaan seuraavista periaatteista:
Otos perusjoukosta

Poiminta sinänsä jo aiheuttaa poikkeamia perusjoukon ja näytteen tai otoksen välille. Nämä poikkeamat ovat kahta lajia:

Herää kysymys, miksi näytteitä sitten lainkaan käytetään, onhan niissä kahdenlaista eroa perusjoukkoon ja otoksissa on vain yhtä poikkeaman lajia? Tähän on kyllä omat syynsä, lähinnä jokin seuraavista:

Otokset

Maalaisjärjellä voisi arvella, että satunnaiseen arvontaan perustuvat otosmenettelyt antaisivat tutkimuksessa "sattumanvaraisia" eli epäluotettavia tuloksia. Asia on kuitenkin päinvastoin, sillä juuri otoksen matemaattisesti hallittu satunnaisuus antaa mahdollisuudet tarkoin laskea se todennäköisyys jolla tulokset pätevät myös perusjoukossa. Toisin sanoen otoksista saatujen tulosten yleistettävyys on näytteistä saatuja parempi.

Otoksen satunnaisessa valitsemisessa täytyy, kuten arvonnoissa yleensäkin, jokaisella perusjoukon yksilöllä olla sama mahdollisuus päätyä valituksi otokseen. Tämä todennäköisyys eli otantasuhde on yhtä kuin otoksen lukumäärä jaettuna perusjoukon lukumäärällä.

Yksinkertainen satunnaisotosSeuraavassa esitetään yleisesti käytetyt otosten tyypit. Kaavakuvissa pienet pisteet tai muut symbolit kuvaavat perusjoukon yksilöitä, ja otokseen tai näytteeseen poimitut yksilöt esitetään lihavalla.

Näytteet

Tutkijan harkinnan mukaan valittua näytettä voidaan käyttää tutkimuksessa silloin kun ei tarvita tulosten luotettavuuden arvioimista. Näyte on helppo ja nopea muodostaa, niinpä niitä usein käytetään esimerkiksi yliopistojen metodikurssien demonstraatioissa, joista saatuja tuloksia ei ole tarkoitus käyttää mihinkään.

Toinen käyttöalue näytteille on tutkimus- ja kehittämishankkeissa, edellyttäen että niistä mahdollisesti aiheutuva harha korjataan hankkeen myöhemmissä vaiheissa. Niinpä usein käytetään ns. "helposti hankittavaa näytettä" kun nimetään mahdollisten asiakkaiden edustajia aivoriiheen kehittämään uutta tuotekonseptia. Jos valituksi sattuu tulemaan keskimääräisestä poikkeavia asiakkaita (eli näyte on harhainen) se ei paljoa haittaa, sillä syntyvät tuoteideat testataan myöhemmin vielä toisten henkilöiden kanssa, jolloin harha enimmäkseen korjaantuu.

Toteavissa (deskriptiivisissä) tutkimushankkeissa näytteen käyttäminen sensijaan on melko vaarallista. Se voi säästää hieman työtä, mutta siitä voi muodostua kokemattomalle tutkijalle ansa: näytteestä tehty tutkimus ehkä etenee ongelmitta hankkeen loppuvaiheisiin saakka, ja vasta valmiita tuloksia arvioidessaan, niiden yleistämistä pohtiessaan tutkijalle nousee seinä vastaan: ei ole perusteita väittää, että tulokset pätevät perusjoukossa.

Helposti hankittava näyte Seuraavassa on joitakin usein käytettyjä näytteiden lajeja.

Toistettakoon vielä, että aina näytteitä käytettäessä tutkijan olisi pidettävä mielessä perusjoukko. Onko luultavaa, että näytteestä saadaan samat tulokset kuin perusjoukosta?

Virheellisiä tapoja muodostaa näyte

Näyte ylittää perusjoukon rajat. Näytteeseen ei saa tulla mukaan tapauksia, jotka eivät kuulu tavoiteltuun perusjoukkoon. Esimerkiksi lumipallonäytteen haastatellut saattavat ehdottaa siihen perusjoukon ulkopuolisia henkilöitä, sillä hehän eivät yleensä tiedä mikä on tutkijan ajatus perusjoukoksi. Tutkijalla on tietenkin valta itse muuttaa määrittelemiään rajauksia.

Asiantuntijoiden näyte. Voisi näyttää järkevältä kysellä tietoja vain niiltä henkilöiltä, ns. avaintiedottajilta, joiden ajatellaan tuntevan asian parhaiten. Täten voisi esimerkiksi:

Kaikkia mainittuja menetelmiä on todella käytetty. Niiden etuihin kuuluu nopeus ja tehokkuus: on tarpeen haastatella vain muutamia ihmisiä, ja haastattelussa asiaan päästään heti. Ainoana ongelmana asiantuntijanäytteessä on se, että tuloksia on vaikeata yleistää mihinkään perusjoukkoon. "Asiantuntijat" eivät näet ole näyte "ei-asiantuntijoista" vaan nämä ovat kaksi erillistä perusjoukkoa.

Jos nyt kuitenkin halutaan haastatella juuri asiantuntijoita, mikäpä siinä. Tämän lisäksi voisi harkita, että haastatellaan erikseen tavallisia kuluttajia. Olisi myös pohdittava, kummassa järjestyksessä nämä tutkimukset tehdään: toinen niistä voisi palvella toisen esitutkimuksena. Joka tapauksessa kummassakin tutkimuksessa on oma perusjoukkonsa, joka on erikseen määriteltävä ja otos tai näyte on sitten poimittava vain siitä.

Ohjaavat näytteet. Ohjaava eli normatiivinen näkökulma on luonteva kehittämishankkeissa, joiden avulla pyritään löytämään parannuksia tuleviin vastaaviin kohteisiin. Sitä ei kuitenkaan tulisi toteuttaa näytteen valinnassa, sillä se tärvelisi lopullisesti mahdollisuudet pohtia näytteen edustavuutta ja yleistämiskelpoisuutta.

Näyte parhaista"Näyte parhaista" on melkeinpä perinteenä taideteosten tutkimuksessa. Ajatuksena on se, että ihailluissa suurten mestarien töissä taide nähdään lähimpänä aikakauden taiteen ihanteita, eli taide on niissä "puhtainta". Näin voidaan tietenkin tutkia, mutta tulosten ei sitten pidä väittääkään esittävän läpileikkausta aikakautensa taiteesta, vaan tutkijan on syytä ilmoittaa, että hänen perusjoukkonaan ovat juuri "suuret mestarit" tms. Ks. pohdintaa kohdassa Tutkimuksen rajaaminen.

Tutkimushankkeen myöhemmissä vaiheissa, aineistoa analysoitaessa, on parempi tilaisuus toteuttaa ohjaavaa näkökulmaa, joten näytteen muodostamiseen sitä ei tarvitse sotkea.

Otantasuhde

Tutkittavan ryhmän lukumäärän suhde perusjoukon lukumäärään on nimeltään otantasuhde. Millaiseksi se tulisi valita, jotta otannan tarkoitus: empiirisen työn säästäminen, saavutettaisiin tuloksia liiaksi huonontamatta?

Otoksen mitoittaminen

Otoksesta saadut tulokset ovat tavallisesti hieman erilaiset kuin koko perusjoukko tutkimalla saataisiin. Syynä on se, että satunnainen otanta on tuonut otokseen keskimääräisten tapausten tai yksilöiden ohella myös muutamia poikkeavia tapauksia. Miten monta, se voidaan ennustaa todennäköisyyslaskennan avulla. Samoin voidaan laskea miten suuri on riski saada virheellisiä tuloksia näiden poikkeavien tapausten takia. Riski on osapuilleen verrannollinen muuttujien varianssiin ja kääntäen verrannollinen otoksen kokoon.

Jos yllä mainittu laskelma tehdään toisin päin ja osataan sanoa tuloksilta toivottu tilastollinen merkitsevyys, voidaan muuttujien lukumäärän ja niiden varianssien pohjalta laskea otoksen tarvittava suuruus. Variansseja ei tosin useinkaan etukäteen tiedetä, mutta niiden likiarvo riittää laskelmaan.

Otetaan esimerkiksi kaksi muuttujaa, jotka on mitattu pienestä otoksesta ja niiden korrelaatioksi on saatu 0,26. Nyt on mahdollista, että tämä korrelaatio onkin otokseen syntynyt vain sattumalta sitä valittaessa eikä se vallitse perusjoukossa. Halutaan, että tällaisen sattuman todennäköisyys pysyy pienempänä kuin 1%. Tutkimalla taulukkoa kohdassa t-testi käy ilmi, että tarvitaan sadan tapauksen otos ennen kuin todennäköisyys saada sattumalta 0,26 korrelaatio pienenee yhteen prosenttiin.

Toisessa esimerkissä tutkitaan prosenttiosuuksia ja halutaan 95% varmuus siitä, että otoksesta mitattu prosenttiosuus vallitsee myös perusjoukossa. Käytetään luottamusvälin laskukaavaa:

jossa

p = otoksesta laskettu jokin prosenttiosuus, ja
n = otoksen suuruus.

Jos kaavan antama luottamusväli jää liian suureksi, sitä voidaan pienentää käyttämällä suurempaa otosta. Kaavasta nähdään, että esimerkiksi suurentamalla otos nelinkertaiseksi luottamusväli pienenee puoleen. Merkillepantavaa on, että perusjoukon suuruus ei vaikuta asiaan mitään.

Tilastollisen merkitsevyyden laskukaavat ovat ikävä kyllä hieman hankalia käyttää, sillä lähes jokaiselle tilastollisen tunnusluvun tyypille on omat kaavansa. Niitä ei siksi esitetä tässä. Isommissa tutkimushankkeissa onkin usein neuvonantajana tilastomatemaatikko, jonka huoleksi voidaan jättää otannan suunnittelu.

Pienissä hankkeissa otoksen koon usein määräävät tutkimuksen resurssit. Nyrkkisääntönä on silloin: Käytä niin isoa otosta mihin on varaa.

Näytteen mitoittaminen

Näytteen koon arvioimiseen ei ole laskukaavoja. Monesti, etenkin kvalitatiivisessa tutkimuksessa, menetellään niin, että näytettä kasvatetaan vähän kerrallaan ja tiedot analysoidaan sitä mukaa kuin niitä kertyy. Useimmiten lopulta saavutetaan se tilanne, että uudet tapaukset eivät enää tuo esiin uusia piirteitä, eikä näytteen joukossa myöskään ole anomalioita eli sellaisia tapauksia, jotka jossakin tärkeässä suhteessa poikkeavat siitä invarianssista, jonka tutkija on aineistosta löytänyt. Tällöin sanotaan että näyte on kyllääntynyt (engl. saturated), ja se katsotaan riittäväksi.

Huomattakoon, ettei näytteen kyllääntyminen suinkaan takaa sitä, ettei näyteyksilöiden valinnassa olisi järjestelmällistä harhaa, päinvastoin harhainen valinta voi pikemminkin edistää näytteen kyllääntymistä. Harhan välttämiseksi tutkijan pitäisi jo varhaisessa vaiheessa täsmentää perusjoukon rajat ja sitten valita sen piiristä mahdollisimman vaihteleva joukko yksilöitä tutkittavaksi. Vielä parempi voisi olla arpoa ensin satunnaisotos ja sitten poimia satunnaisesti tästä otoksesta tapauksia tutkittavaksi siksi kunnes aineisto kyllääntyy.

Jotta ei tutkijalle tulisi ikävää yllätystä työn loppuvaiheissa, kun pitäisi todeta missä perusjoukossa työn tulokset pitävät paikkansa, olisi hyvä jo ennen näytteen valitsemista lukaista kohta Näytteen arvioiminen luvusta "Tietojen arvioiminen".

  In English   En Español   Sisällysluettelosivulle

26.1. 2005. Alkuperäinen sijainti: http://www2.uiah.fi/projects/metodi
Kommentit kirjoittajalle: