| |
Jokainen tutkimushanke pyrkii poimimaan tutkimuskohteesta esiin hankkeen kysymyksenasettelussa määriteltyjä asioita. Jotta nämä asiat saataisiin mahdollisimman selvästi näkyviin tutkijan kokoamassa aineistossa ja sitten myös tuloksissa, olisi hyödyllistä jollakin tavalla vähentää aineistoon sisältyvää muuta, häiritsevää tietoutta. Siksi analyysin alkuvaiheena tehdään usein pari valmistelevaa toimenpidettä aineistolle:
Analyysin menetelmät määräytyvät tutkijan työnsä alussa valitseman mallin mukaan, mutta myös sen mukaan, minkä tyyppisellä asteikolla muuttujat on mitattu, katso lukua Tietojen rekisteröiminen. Tämä rajoitus ilmoitetaan alla ko. menetelmän esittelyn yhteydessä.
Tärkein kysymys analyysimetodin valinnassa on, halutaanko analysoida erillisiä muuttujia vai kahden tai useamman muuttujan välisiä suhteita? Vai kiinnostavatko muuttujat vain siksi, että niiden avulla voidaan luokitella tai lajitella tapauksia? Viimeksimainittuja menetelmiä käsitellään luvussa Luokittelu.
Toinen tärkeä kysymys koskee tutkimushankkeen lopullista päämäärää. Onko se tyypiltään "toteava", jolloin halutaan selvittää millainen tutkimuskohteen tila on (tai on ollut); vai halutaanko selvittää millainen kohteen pitäisi olla ja ehkä sitten myös vaikuttaa siihen. Viimeksimainittua "normatiivista" analyysin lajia käsitellään kohdassa Ohjaava muuttujien analyysi.
Seuraavassa on lueteltu muutamia tilastoanalyysin menetelmiä, joilla analysoidaan muuttujan vaihtelua erillisenä eli ottamatta huomioon sen mahdollista kytkeytymistä muihin kohteesta ehkä mitattuihin muuttujiin. Ne on järjestetty sen mukaan, minkä tyyppisellä asteikolla muuttuja on mitattu.
| - | Laatueroasteikot | Järjestysasteikot | Välimatka-asteikot | Suhdelukuasteikot |
|---|---|---|---|---|
| Käyttökelpoisia aineiston esitystapoja: | - - - - - - - - - - luokitteleminen ; graafinen esittäminen - - - - - - - - - - | |||
| Käyttökelpoisia keskilukuja: | - - - - - - - - - - moodi - - - - - - - - - - | |||
| - | - - - - - - - - mediaani - - - - - - - - | |||
| - | - | - - - - aritmeettinen keskiarvo - - - - | ||
| Käyttökelpoisia hajontalukuja: | - | - - - - - - - - kvartiilipoikkeama - - - - - - - - | ||
| - | - - - - - - - - - vaihteluväli - - - - - - - - - - | |||
| - | - | - - - - - - - keskihajonta - - - - - - - | ||
Yksinkertainen ja havainnollinen kuva muuttujan
arvojen jakautumisesta saadaan merkitsemällä kukin arvo
lukusuoralle pisteenä; jos arvoja on paljon, kuviota ehkä
selventää, jos arvot ensin jaetaan luokkiin.
Arvojen luku
kussakin luokassa eli frekvenssi voidaan sitten
esittää pylväsdiagrammina eli histogrammina
(kuva oik.):
Kyselytutkimuksissa (ja usein muutoinkin
ihmisiä tutkittaessa) saatujen arvojen jakauma usein (mutta ei
suinkaan aina) lähenee ns. Gaussin käyrää eli
kellokäyrää (kuva vas).
Tästä
jakaumasta käytetään nimeä
normaalijakauma. Sille on ominaista, että
enintään keskihajonnan
etäisyydellä keskiarvosta (kuvassa: M) on aina 68,26 %
tapauksista, ja enintään kahden keskihajonnan
etäisyydellä on 95,44 % tapauksista.
Toisinaan halutaan korostaa ei niinkään
muuttujan absoluuttisia arvoja vaan arvojen suhteellista eli
prosenttista jakaumaa. Tähän sopiva esitystapa on
ympyrädiagrammi (eli piirakkakuvio, oik.):
Useissa tapauksissa muuttujan arvojen vaihtelu on tutkimuksen kannalta mielenkiinnotonta, jopa haitallista. Vaihtelu voidaan helposti eliminoida tiivistämällä koko aineisto yhdeksi ainoaksi luvuksi, keskiluvuksi (engl. average), joka useimmiten on jokin seuraavista:
Moodi eli tyyppiarvo on se muuttujan arvo, joita on aineistossa eniten.
Mediaani on se muuttujan arvo, jota pienempiä ja
suurempia arvoja on yhtä monta. Mediaani siis katkaisee
suuruusjärjestykseen pannun aineiston kahteen yhtä
lukuisaan osaan.
Mainittakoon tässä samalla, että
ne muuttujan arvot, jotka katkaisevat suuruusjärjestykseen pannun
jakauman neljään yhtä lukuisaan osaan, ovat
nimeltään kvartiilit. Desiilit taas jakavat aineiston
kymmeneen yhtä suureen ryhmään.
(Aritmeettinen) keskiarvo (engl. mean) on muuttujan arvojen summa jaettuna niiden lukumäärällä. Sen symbolina käytetään muuttujan symbolia, jonka yläpuolella on viiva, esimerkiksi muuttujan x keskiarvo on
Yleensä tutkija voi valita tunnusluvuksi yllä esitetyistä sen keskiluvun, joka luontevimmin kuvaa muuttujan tyypillistä arvoa. Aritmeettinen keskiarvo on suosituin, mutta se voi antaa väärän kuvan esimerkiksi aineistosta, johon kuuluu yksi suuresti muista poikkeava arvo. Samoin käy, jos jakauma on vino (engl. skewed), kuten kuvassa alla.
Esimerkiksi kuvassa oikealla on luetteloitu ne
minuuttimäärät, jotka eri koehenkilöt
käyttivät erään tehtävän
suorittamiseen. Nopeimmat selvisivät 5 minuutissa, mutta useimmat (=moodi) tekivät työn 7 minuutissa. Kuvaan on punaisella M-kirjaimella merkitty arvoista keskimmäinen, eli mediaani, joka on
suuruudeltaan 11 minuuttia. Kun kuitenkin hitaimman koehenkilön
suoritus kesti peräti 34 minuuttia, keskiarvo kohosi 11,98 minuuttiin,
mikä ei tässä tapauksessa anna kovinkaan osuvaa
kuvaa keskimääräisestä suorituksesta.
Tästä havaitaankin, että vinoissa jakaumissa keskiluvun
valitseminen vaatii harkintaa. Graafinen esitys on havainnollisempi.
Kuvan jakauma on positiivisesti vino, arvot näet siinä
kasaantuvat asteikon pienempään päähän.
Vinoudelle löytyy tarvittaessa myös tunnusluku.
Keskiluvun valinnassa on otettava huomioon muuttujan mittaamisessa käytetyn asteikon tyyppi (katso lukua Tietojen rekisteröiminen). Luokitus- eli laatueroasteikolla mitatun muuttujan arvojen keskiluvuksi soveltuu näet ainoastaan moodi, ja järjestysasteikolla ainoastaan joko moodi tai mediaani.
Jos keskiluku on laskettu otoksesta, on lopuksi muistettava myös testata sen tilastollinen merkitsevyys. Tähän sopiva testi on t-testi (selostetaan luvussa Tietojen arvioiminen).
Keskiluvun ohella usein tarvitaan tunnuslukua, joka ilmoittaisi, miten laajalti aineisto hajaantuu keskiluvun molemmin puolin. Tämän tiedon antaa sopiva hajontaluku.
Jos kuitenkin keskihajonta lasketaan otoksesta, keskihajonnan symbolina käytetään kirjainta s, ja laskukaava on hieman erilainen:
Molemmissa kaavoissa n on arvojen lukumäärä ja
kohtaan x sijoitetaan vuoronperään kukin muuttujan arvoista.
Laskutoimitusta tuskin monikaan tutkija viitsii tehdä, sillä
tarvittava algoritmi löytyy jo taskulaskimistakin.
Keskihajonnan neliö on nimeltään varianssi, ja myös
sitä usein käytetään hajonnan kuvaamiseen ja
etenkin sen merkityksen analysoimiseen.
Jos hajontaluku on laskettu otoksesta, on lopuksi muistettava myös testata sen tilastollinen merkitsevyys. Tähän sopiva testi on t-testi (selostetaan luvussa Tietojen arvioiminen).
Jos kaksi muuttujaa vaihtelee toisiaan jossakin määrin seuraten, sanomme että muuttujilla on kovariaatiota, yhteisvaihtelua, eli muuttujien välillä on assosiaatiota. Esimerkiksi ihmisten pituus ja paino ovat tilastollisesti assosioituneita: vaikka yhdenkään ihmisen paino ei johdu hänen pituudestaan eikä hänen pituutensa aiheudu painosta, niin kuitenkin tavallisesti pitkät ihmiset ovat painavampia kuin lyhyet. Toisaalta aineistossa yleensä on myös poikkeuksia, eli tilastollinen assosiaatio on luonteeltaan stokastinen.
Kun aineistoa analysoimalla siinä havaitaan jokin assosiaatio muuttujien välillä, tämä tilastollinen riippuvuus ei tarkoita sitä, että kumpikaan muuttuja välttämättä kausaalisesti riippuisi tai johtuisi toisesta. Jos esimerkiksi muuttujilla A ja B on voimakas tilastollinen riippuvuus, se voi johtua neljästä vaihtoehtoisesta syystä:
Tutkijan on itse valittava näistä jokin vaihtoehto. Mitkään tilastoanalyysin keinot eivät ulotu osoittamaan yhteyden selitystä. Se on tutkijan haettava omaksumastaan teoriasta tai pääteltävä talonpoikaisjärjellä.
Seuraavassa on lueteltu muutamia tilastoanalyysin menetelmiä, joilla selvitetään kahden tai useamman muuttujan välisiä yhteyksiä. Ne on järjestetty sen mukaan, mitä mittauksen asteikkolajia muuttujat lähinnä vastaavat.
| - | Laatueroasteikot | Järjestysasteikot | Välimatka-asteikot | Suhdelukuasteikot |
|---|---|---|---|---|
| Käyttökelpoisia aineiston esitystapoja: | - - - - - - - - - - taulukointi ; graafinen esittäminen - - - - - - - - - - | |||
| Käyttökelpoisia muuttujain assosiaation mittoja: | - - - - - - - - kontingenssikerroin, khiin neliö - - - - - - - - | |||
| - | - - - järjestyskorrelaatio - - - | |||
| - | - | tulomomenttikorrelaatio, varianssianalyysi | ||
| - | - | regressio, faktorianalyysi | ||
Kahden tai hieman useammankin muuttujan yhteinen vaihtelu voidaan helposti esittää ristiintaulukoimalla (crosstabulation).
Taulukon etuna on, että siihen mahtuu suurikin aineisto ja tarkat arvot säilyvät. Taulukko voi auttaa etsittäessä alustavasti
aineistossa piileviä assosiaatioita muuttujien välillä, eli seuraako yhden muuttujan vaihtelu jollakin tavoin toisen muuttujan vaihtelua. Assosiaation tarkempi muoto on sitten haettava jollakin jäljempänä esitettävistä analyysimenetelmistä.
Taulukointiin vakiintuneita esitystapoja selostetaan sivulla Luokittelu.
Tuotteita ja esineitä kuvataan tutkimuksessa useinkin piirroksin, jotka jo sinänsä ovat eräänlaisia graafisia esityksiä.
Usein tutkija haluaa tuoda esille jonkin yleisen piirteen, jonka hän
on löytänyt useissa tai kaikissa tutkituissa kohteissa. Tämä
voidaan monesti esittää sijoittamalla päällekkäin useita piirroksia.
Esimerkiksi kuvasta vasemmalla käy ilmi, että Härnösandin vanhoissa rakennuksissa toistuu sama leveyden ja korkeuden suhde (paksu vinoviiva, Sture Balgårdin
tutkimuksesta).
Toisaalta on tilanteita, joissa kohteen ulkonäöllä ei ole väliä, ja tutkija haluaa vain näyttää graafisesti mittaustensa tulokset sekä eri muuttujien väliset yhteydet.
Tällöin sopivimman graafisen esitystavan valintaan vaikuttavat muuttujien lukumäärä ja niiden asteikkotyypit, ja ovatko muuttujat jatkuvia.
Ennen muuta tutkijan on ratkaistava, mitä hän haluaa aineistostaan näyttää. Tietenkin on sallittua esittää vain tosia tietoja, mutta mitä niistä
korostetaan, sen tutkija saa itse päättää.
Eräs ensimmäisistä kysymyksistä on, onko näytettävä erikseen jokainen havainto vai
pikemminkin jokin sääntö, jota havainnot noudattavat.
Kaikki havainnot on
mahdollista näyttää erillisinä
pisteinä koordinaatistossa, jos muuttujia ei ole kahta
enempää. Vielä kolmaskin muuttuja ehkä voidaan
kuvata esittämällä piste eri väreillä tai
symboleilla. Kuvassa oikealla muuttujan z kahta arvoa kuvaavat
plusmerkki ja neliö.
Harvoin tutkijaa niinkään kiinnostavat yksittäiset arvoparit, vaan enemmänkin muuttujien vaihtelun säännönmukaisuus. Jo silmämääräinen tarkastelu paljastaa ylläolevassa kuvassa säännönmukaisuuksia, esimerkiksi muuttujan x kasvaessa muuttuja y näyttää lievästi kasvavan. Tällaisten yhteyksien tarkastelua voidaan sitten jatkaa jäljempänä esitettävillä tilastollisen analyysin menetelmillä, esimerkiksi laskemalla muuttujien väliset korrelaatiot.
Muuttujien vaihtelua voidaan korostaa siten, että yhtä tai molempia asteikkoja typistetään eli niistä leikataan pois mielenkiinnoton osuus, tavallisesti alhaalta. Jotta lukija varmasti huomaisi typistämisen, se on hyvä näyttää myös diagrammin pohjaviivastossa.
Jos suhdeasteikolla mitattu muuttuja vaihtelee erityisen
laajoissa rajoissa, sille voidaan antaa logaritminen asteikko
(esimerkkinä pylväsdiagrammi, vasemmalla).
Jos havaintoja ei ole liikaa, monesti sopiva esitystapa löytyy erilaisista diagrammeista. Edellä yhden muuttujan esittämiseen käytettyä pylväsdiagrammia voidaan soveltaa kolmen, jopa neljänkin muuttujan esittämiseen, jolloin avuksi voidaan ottaa pylväiden leveydet, niiden rasteroinnit, värit ja kolmiulotteisuus (kuva vas.). Pelkästään koristeellisuuden vuoksi ei pitäisi valita kolmiulotteista esitystapaa.
Käyrä voi soveltua arvoparien esittämiseen,
kun muuttujat ovat jatkuvia ja kutakin x-arvoa vastaa vain yksi y-arvo.
Käyränä ei pitäisi esittää arvoja, jotka todellisuudessa eivät muodosta
muuttujaa. Esimerkiksi jonkin esineen tai kohteen eri ominaisuudet
eivät ole saman muuttujan arvoja. Useinhan kootaan
ihmisten arvioita jostakin kohteesta esittämällä
kyselylomakkeessa sana-asteikkoja esimerkiksi seuraavasti:
| Arvioi oman työhuoneesi ominaisuuksia. Merkitse yksi rasti kullekin riville | ||||||||
|---|---|---|---|---|---|---|---|---|
| valoisa | _ | _ | _ | _ | _ | _ | _ | pimeä |
| meluisa | _ | _ | _ | _ | _ | _ | _ | hiljainen |
| puhdas | _ | _ | _ | _ | _ | _ | _ | likainen |
| suuri | _ | _ | _ | _ | _ | _ | _ | pieni |
Tällöin jokainen adjektiivipari
tuottaa oman erillisen muuttujan, joita ei pitäisi yhdistää
yhdeksi "profiiliksi" siten kuin kuvassa (vasemmalla), kuten tosin
tutkimusraporteissa toisinaan nähdään
tehtävän.
Jos kuitenkin halutaan tuoda esiin, että muuttujat jollakin tavalla
kuuluvat yhteen, ratkaisuna voisi olla vaikkapa pylväistä
koottu diagrammiryhmä (oik.):
Jos tutkija todella haluaa selvittää miten läheisesti eri
adjektiivit mittaavat samaa asiaa, metodi tähän on faktorianalyysi.
Pylväsdiagrammin kuviointi usein valitaan niin, että se symbolisoi yhtä muuttujista. Esimerkiksi autojen myynnin määrää kuvaavat pylväät muodostetaan pinoamalla päällekkäin tai peräkkäin autojen kuvia. Tämä on asiallinen menettelytapa, mutta sensijaan pylväsdiagrammissa käytetyn symbolikuvion kokoa ei pitäisi varioida, sillä sen tulkinta olisi lukijalle vaikeaa (kuvaako myynnin määrää autokuvion pituus, pinta-ala vai sen näennäinen tilavuus?).
Kaikkia diagrammeja voidaan yhdistellä karttojen ja muiden topologisten esitysten kanssa. Esimerkiksi jonkin suureen vaihtelu maan eri lääneissä usein näytetään kartogrammina siten, että eri alueet täytetään erilaisin värein tai rasterein. Toinen tapa on "karttapiktogrammi", jossa kartalle on sijoiteltu pieniä ympyrä- tai pylväsdiagrammeja. Eri alueiden välisiä yhteyksiä taas usein kuvataan nuolilla, joiden vahvuus ilmoittaa yhteyksien määrän.
Kahden muuttujan välisen yhteyden voimakkuus voidaan taulukoinnin sekä graafisen esityksen ohella näyttää myös tunnusluvuilla. Tunnusluvun valinta riippuu siitä, minkä tyyppisillä asteikoilla muuttujat on mitattu (katso taulua edellä).
Näiden tunnuslukujen laskukaavoja ei esitetä tässä, sillä laskut ovat työläitä ja tutkija yleensä tekee ne tietokoneella.
(Tulomomentti)korrelaatio, josta käytetään lyhennettä r, kuvaa sitä, miten tarkoin kahden muuttujan välinen tilastollinen yhteys muistuttaa lineaarista riippuvuutta y = ax + b. Jos muuttujien arvot vastaavat yhtälöä aivan tarkoin, korrelaatiokertoimen arvoksi tulee tasan +1 tai -1. Jos sen sijaan r on lähellä nollaa, eli muuttujat eivät mainittavasti korreloi, se merkitsee sitä, että muuttujilla ei ole ainakaan lineaaria riippuvuutta toisistaan. - Korrelaatiokertoimen etumerkillä ei ole väliä, se näet tulee aina samaksi kuin yhtälön kertoimen a etumerkki.
Alla nähdään kolme erilaista aineistoa, joista jokaisessa on kahdesta muuttujasta kootut kahdeksan arvoparia. Jokaisesta aineistosta on myös laskettu siinä vallitseva korrelaatio noiden kahden muuttujan välillä. Ensimmäisessä aineistossa muuttujien välillä ei ole korrelaatiota ja kahdessa muussa korrelaatiot ovat 0,5 ja 1,0.
Vaikka korrelaatiot samoin kuin kontingenssikerroin sellaisenaan kuvaavat vain kahden muuttujan välistä yhteyttä, niitä sopii hyvin käyttää myös useita muuttujia käsittävän aineiston tarkasteluun. Tietokone laskee helposti suurestakin muuttujien joukosta kontingenssi- tai korrelaatiomatriisin, josta nähdään jokaisen mahdollisen muuttujaparin välinen korrelaatio. Tämän jälkeen voidaan sitten jatkaa eniten toisiinsa liittyvien muuttujien analysoimista muilla menetelmillä.
Korrelaatioanalyysin eräänä heikkoutena on, ettei se havaitse muuttujien välillä muita kuin lineaareja riippuvuuksia. Esimerkiksi toisen asteen riippuvuus muotoa y = ax2 + bx + c jäisi siltä huomaamatta. Joitakin uudehkoja tilastoanalyysin tietokoneohjelmia on tosin tässä suhteessa parannettu. Joka tapauksessa tutkija voi aina yrittää hakea korrelaatiomatriisissa näkymättömiä muuttujien yhteyksiä seuraavilla tavoilla:
Jos joidenkin kahden muuttujan korrelaatio (tai kontingenssi) osoittautuu korkeaksi, tutkija voi jatkaa niiden tarkastelua esimerkiksi seuraavasti:
Jos korrelaatio on laskettu otoksesta, on lopuksi muistettava myös testata sen tilastollinen merkitsevyys. Tähän soveltuu t-testi (selostetaan luvussa Tietojen arvioiminen).
Varianssianalyysissa (engl. ANOVA, ANalysis Of VAriance) tarkastellaan vähintään kahta mittaustulosten ryhmää ja pyritään selvittämään, onko näiden ryhmien välillä tilastollisesti merkitsevää eroa. Nämä ryhmät voivat olla esimerkiksi saman koeasetelman mukaan saatuja eri koeryhmien tuloksia, ja tutkija haluaa selvittää, onko niissä eroa. Ryhmien poikkeaminen toisistaan voidaan havaita siitä, että ryhmien välinen varianssi on suurempi kuin keskimääräinen ryhmän sisäinen varianssi.
Analyysi aloitetaan laskemalla kussakin tapausten ryhmässä tuon ryhmän sisäinen varianssi (within-group variance), ja näiden kaikkien
varianssien keskiarvo.
Toisaalta lasketaan kunkin tapausten ryhmän keskiarvo, ja näiden keskiarvojen varianssi
(between-groups variance).
Lopuksi tarkastellaan ns. F-lukua, joka on äsken mainittujen kahden luvun suhde eli
= (ryhmien keskiarvojen välinen varianssi) / (ryhmien sisäisten
varianssien keskiarvo).
F-lukua verrataan taulukoihin, joihin on laskettu sattuman vaikutuksesta eri todennäköisyyksillä
syntyviä F-lukuja. Jos tutkijan saama F on näitä lukuja suurempi, tutkittujen ryhmien välillä on kyseisen tilastollisen
merkitsevyystason ero. (Merkitsevyystasot selitetään luvussa Tietojen arvioiminen.)
Monesti tutkijalla on syytä uskoa, että jokin tietty muuttuja riippuu kausaalisesti yhdestä tai useammasta muusta muuttujasta. Tämä uskomus voi perustua alan vakiintuneeseen teoriaan taikka tavalliseen arkikokemukseen asioiden syistä. Jos tutkija tällöin haluaa ilmaista algebrallisena yhtälönä sen riippuvuussuhteen, jonka mukaisesti seuraus eli selitettävä aineiston mukaan näyttää riippuvan syystä eli selittäjästä, tutkimusmetodiksi soveltuu regressioanalyysi.
Regressioanalyysissa etsitään sitä ensimmäisen asteen yhtälöä, joka mahdollisimman hyvin kuvaa muuttujista saatuja empiirisiä havaintopareja. Tässä yhtälössä saa selittäviä muuttujia olla enemmän kuin yksi. Analyysissa voidaan tutkia myös sellaisia mahdollisia selittäjiä, joiden selityskyvystä eli vaikutuksesta selitettävään ei ole edes hypoteesia. Algoritmi pudottaa tällöin yhtälöstä automaattisesti pois ne selittäjät, joiden selityskyky osoittautuu vähäiseksi.
Regressioanalyysin laskukaava antaa tulokseksi yhtälön
y = a1x1 + a2x2 + a3x3 + ... + b
jossa
y = selitettävä
x1 , x2 jne =
selittäjiä
a1 , a2 jne = parametreja
b = vakio.
Analyysi antaa parametreille ja vakiolle ne arvot, joilla yhtälö poikkeaa mahdollisimman vähän selitettävän yksittäisistä empiirisistä arvoista, tarkemmin sanoen näiden poikkeamien neliöiden summa minimoituu. Tästä syystä regressioanalyysin algoritmia nimitetään "pienimmän neliösumman" menetelmäksi.
Jos nyt ylläolevaan yhtälöön sijoitetaan jonkin yksittäistapauksen arvot, yhtälöä on vielä täydennettävä jäännöstermillä j, joka siis sisältää sen yksittäistapausten vaihtelun, jota yhtälö ei kykene selittämään. Havaintojen yksittäistapaukset siis noudattavat kaavaa:
y = a1x1 + a2x2 + a3x3 + ... + b + j
Muutamat uusimmat regressioanalyysiohjelmat sallivat yhtälöön myös muita kuin ensimmäisen asteen muuttujia.
Jos regressioanalyysi on tehty otoksesta, on lopuksi muistettava myös testata saadun yhtälön tilastollinen merkitsevyys. Tähän sopiva testi on t-testi (selostetaan luvussa Tietojen arvioiminen).
Joskus tutkija on tullut keränneeksi suuren määrän aineistoa lukuisista eri muuttujista jotka osoittautuvat voimakkaasti korreloivan keskenään. Tällöin saattaa herätä ajatus, että näiden tutkittujen muuttujien "takaa" voisi olla löydettävissä muutama harva taustamuuttuja eli faktori joiden vaikutus ilmenee tutkijan keräämässä aineistossa. Faktorianalyysin avulla voidaan tällaisia taustamuuttujia hakea ja saada sitä kautta aineistossa piilevä rakenne selvemmin esiin, samalla kun aineisto tiivistyy murto-osaan alkuperäisestä.
Tyypillisesti faktorianalyysia käytetään aineistoon, joka on saatu tutkimalla ihmisiä ja heidän mielipiteitään sana-asteikkojen avulla. Ihmisten ja mielipiteiden kuvailemiseen on kielessä adjektiiveja suunnaton joukko, ja useinkin tutkija innoissaan ottaa mukaan useita sellaisia adjektiiveja, jotka ovat lähes synonyymeja. Jos tutkija esimerkiksi pyytää vastaajia arvioimaan jotakin tuotetta sana-asteikkojen "mukava", "miellyttävä" ja "kotoisa" avulla, hän saa tulokseksi kolme muuttujaa, jotka vahvasti korreloivat keskenään. Näyttää siltä, että
kaikki nämä kolme (ja ehkä vielä monet muutkin adjektiivit) "heijastavat" jotakin tuotteen tärkeää ominaisuutta, jolle itselleen ei ehkä välttämättä ole kielessä omaa sanaakaan. Faktorianalyysin avulla tällaisia taustamuuttujia voidaan koettaa
löytää.
Taustamuuttujat voidaan analyysissa
hienosäätää, täsmentää (eli
"rotatoida") sellaisiksi, että niiden korrelaatio tulee mahdollisimman
korkeaksi alkuperäisten muuttujien kanssa. Lisäksi voidaan
haettaville faktoreille vielä asettaa se ehto, että ne eivät
saa ollenkaan korreloida keskenään eli graafisesti
esitettyinä ne ovat ikäänkuin suorassa kulmassa
toisiinsa nähden (=ortogonaalinen rotaatio).
Faktorianalyysin avulla on tutkittu niin tuotteita kuin tuotteiden ostajiakin. Tuotteista on pyritty löytämään niiden tärkeimmät ominaisuudet, jotta kutakin niistä voitaisiin muista riippumatta tutkia ja suunnitella. Asiakkaista taas on haluttu löytää sellaisia dimensioita, joiden mukaan asiakaskuntaa voitaisiin segmentoida ja sen jälkeen muodostaa kuhunkin tiettyyn segmenttiin tähtäävä tuotteen variantti. Esimerkiksi Taloustutkimus Oy:n käyttämä ns. Valuegraphics-analyysi perustuu siihen, että on etukäteen, faktorianalyysin avulla, tutkittu tuotteiden ostajien asenteita ja havaittu, että useimmat tuotekehityksen kannalta kiinnostavat asenteet kytkeytyvät kolmeen taustamuuttujaan:
Näitä kolmea faktoria voidaan tämän jälkeen käyttää asiakaskunnan ryhmittelemiseen.
Faktorianalyysia käyttävän tutkijan ongelmaksi usein tulee se, että faktoreita kyllä helposti löytyy tietokoneen avulla, mutta vaikeampi on keksiä mikä olisi löydettyjen faktorien reaalinen merkitys ("nimi") ja mihin niitä voi käyttää?
Periaatteessa ei ole suurta eroa toteavan ja ohjaavan (eli normatiivisen) analyysin metodeissa. Ohjaavassa tutkimuksessa yksi muuttujista on arvostava, esimerkiksi "hyödyllisyys" tai "tyydytys", ja tutkimuksen lopullisena päämääränä on parantaa kohteen tilaa. Kun kaikki arviointi on subjektiivista, on tärkeätä pohtia ja tarkasti määritellä kenen näkökulmaa arvioinnissa sovelletaan.
| Ominaisuus: Käytön helppous | Hyväksyt- tävyys |
|---|---|
| Toiminta on täysin automaattista. | 5 |
| Monet toiminnot ovat automaattisia.
Tuotteen mukana on hyvä opaskirja. |
4 |
| Ei ole automaattitoimintoja. Käsikirja on keskinkertainen. |
3 |
| Kone ei toimi kirjan mukaisesti. | 2 |
| Toiminta on sekavaa. Ei ole kunnollista ohjekirjaa. |
1 |
Tavallinen vaikeus koetettaessa parantaa kohdetta on se, että kohteen ominaisuudet riippuvat toisistaan. Kun jotakin niistä kohennetaan, toiset saattavat kärsiä. Tässä tilanteessa on tarpeen selvittää kyseisten ominaisuuksien välisen suhteen tarkka muoto, mikä voidaan usein tehdä regressioanalyysin avulla.
Esimerkissä vasemmalla on etsitty kahden muuttujan yhteinen
optimi. Siinä on tarkoituksena optimoida rakennuksen
lämpöeriste, jonka paksuus vaikuttaa toisaalta
investointikuluihin, toisaalta lämmityksen kustannuksiin. Molemmille
näille saadaan kuitenkin yhteinen asteikko muuttamalla
investointikulut vuosikustannuksen muotoon, jolloin on helppoa todeta
eristeen mitoituksen optimi. Se on hankintakulujen annuiteetin
(käyrä B) ja vuosittaisten lämmitysmenojen
(käyrä A) summan minimi.
Useiden muuttujien yhteisen optimoinnin metodiikasta on syntynyt erityinen matematiikan haara, operaatioanalyysi, josta löytyy tätä varten mm. lineaarisen ohjelmoinnin menetelmä.
| Tuotteen ominaisuus | Paino |
|---|---|
| Huippunopeus 160 km/h | 40 |
| Helppo ohjata, automaattinen |
40 |
| Muotoilu urheilullinen,
poikkeaa kilpailijoista |
10 |
| Materiaalit kierrätettäviä | 10 |
| Painot yhteensä | 100 |
Monesti painotaulukko pyrkii kasvamaan hankalan laajaksi, minkä estämiseksi voidaan harkita yhdistää lähisukuisia ominaisuuksia faktorianalyysin avulla.
Arvoanalyysi on menetelmä, jossa haetaan yhteinen optimi kaikille merkittäville tuotteen ominaisuuksille. Jos myös hinta tai kustannus on vertailussa mukana, siitä voidaan käyttää nimeä hyötykustannusanalyysi. Se on selkeästi kvantitatiivinen metodi, sillä se vaatii mittaamaan kaikki tarkasteltavat ominaisuudet. Analyysin vaiheet ovat:
| Tuotteen ominaisuus |
Paino- arvo P |
Vaihtoehto 1 | Vaihtoehto 2 | ||
|---|---|---|---|---|---|
| Arvo- sana A |
PxA | Arvo- sana A |
PxA | ||
| Kapasiteetti | 40 | 2 | 80 | 5 | 200 |
| Käytön helppous ja automaattisuus | 40 | 3 | 120 | 4 | 160 |
| Muotoilu | 10 | 5 | 50 | 2 | 20 |
| Materiaalit, kierrätettävyys | 10 | 3 | 30 | 2 | 20 |
| Yhteensä | 100 | -- | 280 | -- | 400 |
Jos arvoanalyysi tehdään siten kuin yllä, eli taulukossa arvioidaan vain hyötyarvoja eikä ollenkaan uhrauksia, on analyysissa lopuksi asetettava vastakkain hyödyt ja uhraukset. Tämä tehdään yksinkertaisesti ottamalla erikseen kunkin vaihtoehdon yllä (punaiseen ruutuun kursivoituna) saama loppuarvosana ja muodostamalla sen ja tuotteen hinnan (tai vastaavan kustannuksen) osamäärä, joka sitten osoittaa edullisimman vaihtoehdon. Kustannuksiin on monesti aihetta lukea sekä hankinta- että vuosikustannukset.
Vaihtoehtoisesti kustannukset voidaan ottaa mukaan jo vertailutauluun omana rivinään, jonka painoarvoksi annetaan 40% tai 50%. Esimerkki tällaisesta taulusta.
| |
24.1. 2005. Alkuperäinen sijainti:
http://www2.uiah.fi/projects/metodi
Kommentit kirjoittajalle: