Tapausten ryhmitteleminen on siirretty sivulle: Luokittelu
Aikasarjan analysoiminen on siirretty sivulle: Kehityksen analysoiminen

Määrien analysoiminen

  1. Erillisten muuttujien analysoiminen
  2. Muuttujien välisten suhteiden analysoiminen
  3. Ohjaava muuttujien analyysi
  In English   En Español   Sisällysluettelosivulle

Jokainen tutkimushanke pyrkii poimimaan tutkimuskohteesta esiin hankkeen kysymyksenasettelussa määriteltyjä asioita. Jotta nämä asiat saataisiin mahdollisimman selvästi näkyviin tutkijan kokoamassa aineistossa ja sitten myös tuloksissa, olisi hyödyllistä jollakin tavalla vähentää aineistoon sisältyvää muuta, häiritsevää tietoutta. Siksi analyysin alkuvaiheena tehdään usein pari valmistelevaa toimenpidettä aineistolle:

Analyysin menetelmät määräytyvät tutkijan työnsä alussa valitseman mallin mukaan, mutta myös sen mukaan, minkä tyyppisellä asteikolla muuttujat on mitattu, katso lukua Tietojen rekisteröiminen. Tämä rajoitus ilmoitetaan alla ko. menetelmän esittelyn yhteydessä.

Tärkein kysymys analyysimetodin valinnassa on, halutaanko analysoida erillisiä muuttujia vai kahden tai useamman muuttujan välisiä suhteita? Vai kiinnostavatko muuttujat vain siksi, että niiden avulla voidaan luokitella tai lajitella tapauksia? Viimeksimainittuja menetelmiä käsitellään luvussa Luokittelu.

Toinen tärkeä kysymys koskee tutkimushankkeen lopullista päämäärää. Onko se tyypiltään "toteava", jolloin halutaan selvittää millainen tutkimuskohteen tila on (tai on ollut); vai halutaanko selvittää millainen kohteen pitäisi olla ja ehkä sitten myös vaikuttaa siihen. Viimeksimainittua "normatiivista" analyysin lajia käsitellään kohdassa Ohjaava muuttujien analyysi.

Erillisten muuttujien analysoiminen

Seuraavassa on lueteltu muutamia tilastoanalyysin menetelmiä, joilla analysoidaan muuttujan vaihtelua erillisenä eli ottamatta huomioon sen mahdollista kytkeytymistä muihin kohteesta ehkä mitattuihin muuttujiin. Ne on järjestetty sen mukaan, minkä tyyppisellä asteikolla muuttuja on mitattu.

- Laatueroasteikot Järjestysasteikot Välimatka-asteikot Suhdelukuasteikot
Käyttökelpoisia aineiston esitystapoja: - - - - - - - - - - luokitteleminen ; graafinen esittäminen - - - - - - - - - -
Käyttökelpoisia keskilukuja: - - - - - - - - - - moodi - - - - - - - - - -
- - - - - - - - - mediaani - - - - - - - -
- - - - - - aritmeettinen keskiarvo - - - -
Käyttökelpoisia hajontalukuja: - - - - - - - - - kvartiilipoikkeama - - - - - - - -
- - - - - - - - - - vaihteluväli - - - - - - - - - -
- - - - - - - - - keskihajonta - - - - - - -

Yhden muuttujan graafinen esittäminen

Histogrammi Yksinkertainen ja havainnollinen kuva muuttujan arvojen jakautumisesta saadaan merkitsemällä kukin arvo lukusuoralle pisteenä; jos arvoja on paljon, kuviota ehkä selventää, jos arvot ensin jaetaan luokkiin.
Arvojen luku kussakin luokassa eli frekvenssi voidaan sitten esittää pylväsdiagrammina eli histogrammina (kuva oik.):

Normaalijakauma Kyselytutkimuksissa (ja usein muutoinkin ihmisiä tutkittaessa) saatujen arvojen jakauma usein (mutta ei suinkaan aina) lähenee ns. Gaussin käyrää eli kellokäyrää (kuva vas).
Tästä jakaumasta käytetään nimeä normaalijakauma. Sille on ominaista, että enintään keskihajonnan etäisyydellä keskiarvosta (kuvassa: M) on aina 68,26 % tapauksista, ja enintään kahden keskihajonnan etäisyydellä on 95,44 % tapauksista.

PiirakkakuvioToisinaan halutaan korostaa ei niinkään muuttujan absoluuttisia arvoja vaan arvojen suhteellista eli prosenttista jakaumaa. Tähän sopiva esitystapa on ympyrädiagrammi (eli piirakkakuvio, oik.):

Keskiluvut

Useissa tapauksissa muuttujan arvojen vaihtelu on tutkimuksen kannalta mielenkiinnotonta, jopa haitallista. Vaihtelu voidaan helposti eliminoida tiivistämällä koko aineisto yhdeksi ainoaksi luvuksi, keskiluvuksi (engl. average), joka useimmiten on jokin seuraavista:

Moodi eli tyyppiarvo on se muuttujan arvo, joita on aineistossa eniten.

Mediaani on se muuttujan arvo, jota pienempiä ja suurempia arvoja on yhtä monta. Mediaani siis katkaisee suuruusjärjestykseen pannun aineiston kahteen yhtä lukuisaan osaan.
Mainittakoon tässä samalla, että ne muuttujan arvot, jotka katkaisevat suuruusjärjestykseen pannun jakauman neljään yhtä lukuisaan osaan, ovat nimeltään kvartiilit. Desiilit taas jakavat aineiston kymmeneen yhtä suureen ryhmään.

(Aritmeettinen) keskiarvo (engl. mean) on muuttujan arvojen summa jaettuna niiden lukumäärällä. Sen symbolina käytetään muuttujan symbolia, jonka yläpuolella on viiva, esimerkiksi muuttujan x keskiarvo on

Keskiarvo

Yleensä tutkija voi valita tunnusluvuksi yllä esitetyistä sen keskiluvun, joka luontevimmin kuvaa muuttujan tyypillistä arvoa. Aritmeettinen keskiarvo on suosituin, mutta se voi antaa väärän kuvan esimerkiksi aineistosta, johon kuuluu yksi suuresti muista poikkeava arvo. Samoin käy, jos jakauma on vino (engl. skewed), kuten kuvassa alla.

Vino jakauma Esimerkiksi kuvassa oikealla on luetteloitu ne minuuttimäärät, jotka eri koehenkilöt käyttivät erään tehtävän suorittamiseen. Nopeimmat selvisivät 5 minuutissa, mutta useimmat (=moodi) tekivät työn 7 minuutissa. Kuvaan on punaisella M-kirjaimella merkitty arvoista keskimmäinen, eli mediaani, joka on suuruudeltaan 11 minuuttia. Kun kuitenkin hitaimman koehenkilön suoritus kesti peräti 34 minuuttia, keskiarvo kohosi 11,98 minuuttiin, mikä ei tässä tapauksessa anna kovinkaan osuvaa kuvaa keskimääräisestä suorituksesta. Tästä havaitaankin, että vinoissa jakaumissa keskiluvun valitseminen vaatii harkintaa. Graafinen esitys on havainnollisempi.
Kuvan jakauma on positiivisesti vino, arvot näet siinä kasaantuvat asteikon pienempään päähän. Vinoudelle löytyy tarvittaessa myös tunnusluku.

Keskiluvun valinnassa on otettava huomioon muuttujan mittaamisessa käytetyn asteikon tyyppi (katso lukua Tietojen rekisteröiminen). Luokitus- eli laatueroasteikolla mitatun muuttujan arvojen keskiluvuksi soveltuu näet ainoastaan moodi, ja järjestysasteikolla ainoastaan joko moodi tai mediaani.

Jos keskiluku on laskettu otoksesta, on lopuksi muistettava myös testata sen tilastollinen merkitsevyys. Tähän sopiva testi on t-testi (selostetaan luvussa Tietojen arvioiminen).

Hajontaluvut

Keskiluvun ohella usein tarvitaan tunnuslukua, joka ilmoittaisi, miten laajalti aineisto hajaantuu keskiluvun molemmin puolin. Tämän tiedon antaa sopiva hajontaluku.

Keskihajonta

Jos kuitenkin keskihajonta lasketaan otoksesta, keskihajonnan symbolina käytetään kirjainta s, ja laskukaava on hieman erilainen:

Otoksen
keskihajonta

Molemmissa kaavoissa n on arvojen lukumäärä ja kohtaan x sijoitetaan vuoronperään kukin muuttujan arvoista. Laskutoimitusta tuskin monikaan tutkija viitsii tehdä, sillä tarvittava algoritmi löytyy jo taskulaskimistakin.
Keskihajonnan neliö on nimeltään varianssi, ja myös sitä usein käytetään hajonnan kuvaamiseen ja etenkin sen merkityksen analysoimiseen.

Jos hajontaluku on laskettu otoksesta, on lopuksi muistettava myös testata sen tilastollinen merkitsevyys. Tähän sopiva testi on t-testi (selostetaan luvussa Tietojen arvioiminen).

Muuttujien välisten suhteiden analysoiminen

Jos kaksi muuttujaa vaihtelee toisiaan jossakin määrin seuraten, sanomme että muuttujilla on kovariaatiota, yhteisvaihtelua, eli muuttujien välillä on assosiaatiota. Esimerkiksi ihmisten pituus ja paino ovat tilastollisesti assosioituneita: vaikka yhdenkään ihmisen paino ei johdu hänen pituudestaan eikä hänen pituutensa aiheudu painosta, niin kuitenkin tavallisesti pitkät ihmiset ovat painavampia kuin lyhyet. Toisaalta aineistossa yleensä on myös poikkeuksia, eli tilastollinen assosiaatio on luonteeltaan stokastinen.

Kun aineistoa analysoimalla siinä havaitaan jokin assosiaatio muuttujien välillä, tämä tilastollinen riippuvuus ei tarkoita sitä, että kumpikaan muuttuja välttämättä kausaalisesti riippuisi tai johtuisi toisesta. Jos esimerkiksi muuttujilla A ja B on voimakas tilastollinen riippuvuus, se voi johtua neljästä vaihtoehtoisesta syystä:

Tutkijan on itse valittava näistä jokin vaihtoehto. Mitkään tilastoanalyysin keinot eivät ulotu osoittamaan yhteyden selitystä. Se on tutkijan haettava omaksumastaan teoriasta tai pääteltävä talonpoikaisjärjellä.

Seuraavassa on lueteltu muutamia tilastoanalyysin menetelmiä, joilla selvitetään kahden tai useamman muuttujan välisiä yhteyksiä. Ne on järjestetty sen mukaan, mitä mittauksen asteikkolajia muuttujat lähinnä vastaavat.

- Laatueroasteikot Järjestysasteikot Välimatka-asteikot Suhdelukuasteikot
Käyttökelpoisia aineiston esitystapoja: - - - - - - - - - - taulukointi ; graafinen esittäminen - - - - - - - - - -
Käyttökelpoisia muuttujain assosiaation mittoja: - - - - - - - - kontingenssikerroin, khiin neliö - - - - - - - -
- - - - järjestyskorrelaatio - - -
- - tulomomenttikorrelaatio, varianssianalyysi
- - regressio, faktorianalyysi

Taulukointi

Kahden tai hieman useammankin muuttujan yhteinen vaihtelu voidaan helposti esittää ristiintaulukoimalla (crosstabulation).
Taulukon etuna on, että siihen mahtuu suurikin aineisto ja tarkat arvot säilyvät. Taulukko voi auttaa etsittäessä alustavasti aineistossa piileviä assosiaatioita muuttujien välillä, eli seuraako yhden muuttujan vaihtelu jollakin tavoin toisen muuttujan vaihtelua. Assosiaation tarkempi muoto on sitten haettava jollakin jäljempänä esitettävistä analyysimenetelmistä.

Taulukointiin vakiintuneita esitystapoja selostetaan sivulla Luokittelu.

Muuttujien graafinen esittäminen

Tuotteita ja esineitä kuvataan tutkimuksessa useinkin piirroksin, jotka jo sinänsä ovat eräänlaisia graafisia esityksiä.
Taloja Usein tutkija haluaa tuoda esille jonkin yleisen piirteen, jonka hän on löytänyt useissa tai kaikissa tutkituissa kohteissa. Tämä voidaan monesti esittää sijoittamalla päällekkäin useita piirroksia. Esimerkiksi kuvasta vasemmalla käy ilmi, että Härnösandin vanhoissa rakennuksissa toistuu sama leveyden ja korkeuden suhde (paksu vinoviiva, Sture Balgårdin tutkimuksesta).

Toisaalta on tilanteita, joissa kohteen ulkonäöllä ei ole väliä, ja tutkija haluaa vain näyttää graafisesti mittaustensa tulokset sekä eri muuttujien väliset yhteydet. Tällöin sopivimman graafisen esitystavan valintaan vaikuttavat muuttujien lukumäärä ja niiden asteikkotyypit, ja ovatko muuttujat jatkuvia.
Ennen muuta tutkijan on ratkaistava, mitä hän haluaa aineistostaan näyttää. Tietenkin on sallittua esittää vain tosia tietoja, mutta mitä niistä korostetaan, sen tutkija saa itse päättää.
Eräs ensimmäisistä kysymyksistä on, onko näytettävä erikseen jokainen havainto vai pikemminkin jokin sääntö, jota havainnot noudattavat.

Pisteitä koordinaatistossa Kaikki havainnot on mahdollista näyttää erillisinä pisteinä koordinaatistossa, jos muuttujia ei ole kahta enempää. Vielä kolmaskin muuttuja ehkä voidaan kuvata esittämällä piste eri väreillä tai symboleilla. Kuvassa oikealla muuttujan z kahta arvoa kuvaavat plusmerkki ja neliö.

Harvoin tutkijaa niinkään kiinnostavat yksittäiset arvoparit, vaan enemmänkin muuttujien vaihtelun säännönmukaisuus. Jo silmämääräinen tarkastelu paljastaa ylläolevassa kuvassa säännönmukaisuuksia, esimerkiksi muuttujan x kasvaessa muuttuja y näyttää lievästi kasvavan. Tällaisten yhteyksien tarkastelua voidaan sitten jatkaa jäljempänä esitettävillä tilastollisen analyysin menetelmillä, esimerkiksi laskemalla muuttujien väliset korrelaatiot.

Muuttujien vaihtelua voidaan korostaa siten, että yhtä tai molempia asteikkoja typistetään eli niistä leikataan pois mielenkiinnoton osuus, tavallisesti alhaalta. Jotta lukija varmasti huomaisi typistämisen, se on hyvä näyttää myös diagrammin pohjaviivastossa.

Histogrammi Jos suhdeasteikolla mitattu muuttuja vaihtelee erityisen laajoissa rajoissa, sille voidaan antaa logaritminen asteikko (esimerkkinä pylväsdiagrammi, vasemmalla).

Jos havaintoja ei ole liikaa, monesti sopiva esitystapa löytyy erilaisista diagrammeista. Edellä yhden muuttujan esittämiseen käytettyä pylväsdiagrammia voidaan soveltaa kolmen, jopa neljänkin muuttujan esittämiseen, jolloin avuksi voidaan ottaa pylväiden leveydet, niiden rasteroinnit, värit ja kolmiulotteisuus (kuva vas.). Pelkästään koristeellisuuden vuoksi ei pitäisi valita kolmiulotteista esitystapaa.

Käyrä voi soveltua arvoparien esittämiseen, kun muuttujat ovat jatkuvia ja kutakin x-arvoa vastaa vain yksi y-arvo.
Käyränä ei pitäisi esittää arvoja, jotka todellisuudessa eivät muodosta muuttujaa. Esimerkiksi jonkin esineen tai kohteen eri ominaisuudet eivät ole saman muuttujan arvoja. Useinhan kootaan ihmisten arvioita jostakin kohteesta esittämällä kyselylomakkeessa sana-asteikkoja esimerkiksi seuraavasti:
Arvioi oman työhuoneesi ominaisuuksia.
Merkitse yksi rasti kullekin riville
valoisa _ _ _ _ _ _ _ pimeä
meluisa _ _ _ _ _ _ _ hiljainen
puhdas _ _ _ _ _ _ _ likainen
suuri _ _ _ _ _ _ _ pieni

Muuttujista koottu profiili Tällöin jokainen adjektiivipari tuottaa oman erillisen muuttujan, joita ei pitäisi yhdistää yhdeksi "profiiliksi" siten kuin kuvassa (vasemmalla), kuten tosin tutkimusraporteissa toisinaan nähdään tehtävän.

Jos kuitenkin halutaan tuoda esiin, että muuttujat jollakin tavalla kuuluvat yhteen, ratkaisuna voisi olla vaikkapa pylväistä koottu diagrammiryhmä (oik.):
Erillisiä muuttujia Jos tutkija todella haluaa selvittää miten läheisesti eri adjektiivit mittaavat samaa asiaa, metodi tähän on faktorianalyysi.

Pylväsdiagrammin kuviointi usein valitaan niin, että se symbolisoi yhtä muuttujista. Esimerkiksi autojen myynnin määrää kuvaavat pylväät muodostetaan pinoamalla päällekkäin tai peräkkäin autojen kuvia. Tämä on asiallinen menettelytapa, mutta sensijaan pylväsdiagrammissa käytetyn symbolikuvion kokoa ei pitäisi varioida, sillä sen tulkinta olisi lukijalle vaikeaa (kuvaako myynnin määrää autokuvion pituus, pinta-ala vai sen näennäinen tilavuus?).

Kaikkia diagrammeja voidaan yhdistellä karttojen ja muiden topologisten esitysten kanssa. Esimerkiksi jonkin suureen vaihtelu maan eri lääneissä usein näytetään kartogrammina siten, että eri alueet täytetään erilaisin värein tai rasterein. Toinen tapa on "karttapiktogrammi", jossa kartalle on sijoiteltu pieniä ympyrä- tai pylväsdiagrammeja. Eri alueiden välisiä yhteyksiä taas usein kuvataan nuolilla, joiden vahvuus ilmoittaa yhteyksien määrän.

Kontingenssi ja korrelaatio

Kahden muuttujan välisen yhteyden voimakkuus voidaan taulukoinnin sekä graafisen esityksen ohella näyttää myös tunnusluvuilla. Tunnusluvun valinta riippuu siitä, minkä tyyppisillä asteikoilla muuttujat on mitattu (katso taulua edellä).

Näiden tunnuslukujen laskukaavoja ei esitetä tässä, sillä laskut ovat työläitä ja tutkija yleensä tekee ne tietokoneella.

(Tulomomentti)korrelaatio, josta käytetään lyhennettä r, kuvaa sitä, miten tarkoin kahden muuttujan välinen tilastollinen yhteys muistuttaa lineaarista riippuvuutta y = ax + b. Jos muuttujien arvot vastaavat yhtälöä aivan tarkoin, korrelaatiokertoimen arvoksi tulee tasan +1 tai -1. Jos sen sijaan r on lähellä nollaa, eli muuttujat eivät mainittavasti korreloi, se merkitsee sitä, että muuttujilla ei ole ainakaan lineaaria riippuvuutta toisistaan. - Korrelaatiokertoimen etumerkillä ei ole väliä, se näet tulee aina samaksi kuin yhtälön kertoimen a etumerkki.

Alla nähdään kolme erilaista aineistoa, joista jokaisessa on kahdesta muuttujasta kootut kahdeksan arvoparia. Jokaisesta aineistosta on myös laskettu siinä vallitseva korrelaatio noiden kahden muuttujan välillä. Ensimmäisessä aineistossa muuttujien välillä ei ole korrelaatiota ja kahdessa muussa korrelaatiot ovat 0,5 ja 1,0.

Vaikka korrelaatiot samoin kuin kontingenssikerroin sellaisenaan kuvaavat vain kahden muuttujan välistä yhteyttä, niitä sopii hyvin käyttää myös useita muuttujia käsittävän aineiston tarkasteluun. Tietokone laskee helposti suurestakin muuttujien joukosta kontingenssi- tai korrelaatiomatriisin, josta nähdään jokaisen mahdollisen muuttujaparin välinen korrelaatio. Tämän jälkeen voidaan sitten jatkaa eniten toisiinsa liittyvien muuttujien analysoimista muilla menetelmillä.

Korrelaatioanalyysin eräänä heikkoutena on, ettei se havaitse muuttujien välillä muita kuin lineaareja riippuvuuksia. Esimerkiksi toisen asteen riippuvuus muotoa y = ax2 + bx + c jäisi siltä huomaamatta. Joitakin uudehkoja tilastoanalyysin tietokoneohjelmia on tosin tässä suhteessa parannettu. Joka tapauksessa tutkija voi aina yrittää hakea korrelaatiomatriisissa näkymättömiä muuttujien yhteyksiä seuraavilla tavoilla:

Jos joidenkin kahden muuttujan korrelaatio (tai kontingenssi) osoittautuu korkeaksi, tutkija voi jatkaa niiden tarkastelua esimerkiksi seuraavasti:

Jos korrelaatio on laskettu otoksesta, on lopuksi muistettava myös testata sen tilastollinen merkitsevyys. Tähän soveltuu t-testi (selostetaan luvussa Tietojen arvioiminen).

Varianssianalyysi

Varianssianalyysissa (engl. ANOVA, ANalysis Of VAriance) tarkastellaan vähintään kahta mittaustulosten ryhmää ja pyritään selvittämään, onko näiden ryhmien välillä tilastollisesti merkitsevää eroa. Nämä ryhmät voivat olla esimerkiksi saman koeasetelman mukaan saatuja eri koeryhmien tuloksia, ja tutkija haluaa selvittää, onko niissä eroa. Ryhmien poikkeaminen toisistaan voidaan havaita siitä, että ryhmien välinen varianssi on suurempi kuin keskimääräinen ryhmän sisäinen varianssi.

Analyysi aloitetaan laskemalla kussakin tapausten ryhmässä tuon ryhmän sisäinen varianssi (within-group variance), ja näiden kaikkien varianssien keskiarvo.
Toisaalta lasketaan kunkin tapausten ryhmän keskiarvo, ja näiden keskiarvojen varianssi (between-groups variance).
Lopuksi tarkastellaan ns. F-lukua, joka on äsken mainittujen kahden luvun suhde eli
= (ryhmien keskiarvojen välinen varianssi) / (ryhmien sisäisten varianssien keskiarvo).
F-lukua verrataan taulukoihin, joihin on laskettu sattuman vaikutuksesta eri todennäköisyyksillä syntyviä F-lukuja. Jos tutkijan saama F on näitä lukuja suurempi, tutkittujen ryhmien välillä on kyseisen tilastollisen merkitsevyystason ero. (Merkitsevyystasot selitetään luvussa Tietojen arvioiminen.)

Regressioanalyysi

Monesti tutkijalla on syytä uskoa, että jokin tietty muuttuja riippuu kausaalisesti yhdestä tai useammasta muusta muuttujasta. Tämä uskomus voi perustua alan vakiintuneeseen teoriaan taikka tavalliseen arkikokemukseen asioiden syistä. Jos tutkija tällöin haluaa ilmaista algebrallisena yhtälönä sen riippuvuussuhteen, jonka mukaisesti seuraus eli selitettävä aineiston mukaan näyttää riippuvan syystä eli selittäjästä, tutkimusmetodiksi soveltuu regressioanalyysi.

Regressioanalyysissa etsitään sitä ensimmäisen asteen yhtälöä, joka mahdollisimman hyvin kuvaa muuttujista saatuja empiirisiä havaintopareja. Tässä yhtälössä saa selittäviä muuttujia olla enemmän kuin yksi. Analyysissa voidaan tutkia myös sellaisia mahdollisia selittäjiä, joiden selityskyvystä eli vaikutuksesta selitettävään ei ole edes hypoteesia. Algoritmi pudottaa tällöin yhtälöstä automaattisesti pois ne selittäjät, joiden selityskyky osoittautuu vähäiseksi.

Regressioanalyysin laskukaava antaa tulokseksi yhtälön

y = a1x1 + a2x2 + a3x3 + ... + b

jossa
y = selitettävä
x1 , x2 jne = selittäjiä
a1 , a2 jne = parametreja
b = vakio.

Analyysi antaa parametreille ja vakiolle ne arvot, joilla yhtälö poikkeaa mahdollisimman vähän selitettävän yksittäisistä empiirisistä arvoista, tarkemmin sanoen näiden poikkeamien neliöiden summa minimoituu. Tästä syystä regressioanalyysin algoritmia nimitetään "pienimmän neliösumman" menetelmäksi.

Jos nyt ylläolevaan yhtälöön sijoitetaan jonkin yksittäistapauksen arvot, yhtälöä on vielä täydennettävä jäännöstermillä j, joka siis sisältää sen yksittäistapausten vaihtelun, jota yhtälö ei kykene selittämään. Havaintojen yksittäistapaukset siis noudattavat kaavaa:

y = a1x1 + a2x2 + a3x3 + ... + b + j

Muutamat uusimmat regressioanalyysiohjelmat sallivat yhtälöön myös muita kuin ensimmäisen asteen muuttujia.

Jos regressioanalyysi on tehty otoksesta, on lopuksi muistettava myös testata saadun yhtälön tilastollinen merkitsevyys. Tähän sopiva testi on t-testi (selostetaan luvussa Tietojen arvioiminen).

Faktorianalyysi

Joskus tutkija on tullut keränneeksi suuren määrän aineistoa lukuisista eri muuttujista jotka osoittautuvat voimakkaasti korreloivan keskenään. Tällöin saattaa herätä ajatus, että näiden tutkittujen muuttujien "takaa" voisi olla löydettävissä muutama harva taustamuuttuja eli faktori joiden vaikutus ilmenee tutkijan keräämässä aineistossa. Faktorianalyysin avulla voidaan tällaisia taustamuuttujia hakea ja saada sitä kautta aineistossa piilevä rakenne selvemmin esiin, samalla kun aineisto tiivistyy murto-osaan alkuperäisestä.

Tyypillisesti faktorianalyysia käytetään aineistoon, joka on saatu tutkimalla ihmisiä ja heidän mielipiteitään sana-asteikkojen avulla. Ihmisten ja mielipiteiden kuvailemiseen on kielessä adjektiiveja suunnaton joukko, ja useinkin tutkija innoissaan ottaa mukaan useita sellaisia adjektiiveja, jotka ovat lähes synonyymeja. Jos tutkija esimerkiksi pyytää vastaajia arvioimaan jotakin tuotetta sana-asteikkojen "mukava", "miellyttävä" ja "kotoisa" avulla, hän saa tulokseksi kolme muuttujaa, jotka vahvasti korreloivat keskenään. Näyttää siltä, että kaikki nämä kolme (ja ehkä vielä monet muutkin adjektiivit) "heijastavat" jotakin tuotteen tärkeää ominaisuutta, jolle itselleen ei ehkä välttämättä ole kielessä omaa sanaakaan. Faktorianalyysin avulla tällaisia taustamuuttujia voidaan koettaa löytää.
Taustamuuttujat voidaan analyysissa hienosäätää, täsmentää (eli "rotatoida") sellaisiksi, että niiden korrelaatio tulee mahdollisimman korkeaksi alkuperäisten muuttujien kanssa. Lisäksi voidaan haettaville faktoreille vielä asettaa se ehto, että ne eivät saa ollenkaan korreloida keskenään eli graafisesti esitettyinä ne ovat ikäänkuin suorassa kulmassa toisiinsa nähden (=ortogonaalinen rotaatio).

Faktorianalyysin avulla on tutkittu niin tuotteita kuin tuotteiden ostajiakin. Tuotteista on pyritty löytämään niiden tärkeimmät ominaisuudet, jotta kutakin niistä voitaisiin muista riippumatta tutkia ja suunnitella. Asiakkaista taas on haluttu löytää sellaisia dimensioita, joiden mukaan asiakaskuntaa voitaisiin segmentoida ja sen jälkeen muodostaa kuhunkin tiettyyn segmenttiin tähtäävä tuotteen variantti. Esimerkiksi Taloustutkimus Oy:n käyttämä ns. Valuegraphics-analyysi perustuu siihen, että on etukäteen, faktorianalyysin avulla, tutkittu tuotteiden ostajien asenteita ja havaittu, että useimmat tuotekehityksen kannalta kiinnostavat asenteet kytkeytyvät kolmeen taustamuuttujaan:

Näitä kolmea faktoria voidaan tämän jälkeen käyttää asiakaskunnan ryhmittelemiseen.

Faktorianalyysia käyttävän tutkijan ongelmaksi usein tulee se, että faktoreita kyllä helposti löytyy tietokoneen avulla, mutta vaikeampi on keksiä mikä olisi löydettyjen faktorien reaalinen merkitys ("nimi") ja mihin niitä voi käyttää?

Ohjaava muuttujien analyysi

Periaatteessa ei ole suurta eroa toteavan ja ohjaavan (eli normatiivisen) analyysin metodeissa. Ohjaavassa tutkimuksessa yksi muuttujista on arvostava, esimerkiksi "hyödyllisyys" tai "tyydytys", ja tutkimuksen lopullisena päämääränä on parantaa kohteen tilaa. Kun kaikki arviointi on subjektiivista, on tärkeätä pohtia ja tarkasti määritellä kenen näkökulmaa arvioinnissa sovelletaan.

Ominaisuus: Käytön helppous Hyväksyt-
tävyys
Toiminta on täysin automaattista. 5
Monet toiminnot ovat automaattisia. 
Tuotteen mukana on hyvä opaskirja.
4
Ei ole automaattitoimintoja.
Käsikirja on keskinkertainen.
3
Kone ei toimi kirjan mukaisesti. 2
Toiminta on sekavaa.
Ei ole kunnollista ohjekirjaa.
1
Analyysi on yksinkertainen, jos tehtävänä on parantaa vain yhtä, tai muutamaa, kohteen ominaisuuksista: on vain saatava selville ominaisuuden kunkin tason hyväksyttävyys. Sitten kun nämä arvioinnit on saatu asianomaisilta henkilöiltä (näiden valinnasta ks. yllä) ne voidaan esittää tauluna kuten oikealla, tai esim. käyränä.

Tavallinen vaikeus koetettaessa parantaa kohdetta on se, että kohteen ominaisuudet riippuvat toisistaan. Kun jotakin niistä kohennetaan, toiset saattavat kärsiä. Tässä tilanteessa on tarpeen selvittää kyseisten ominaisuuksien välisen suhteen tarkka muoto, mikä voidaan usein tehdä regressioanalyysin avulla.

Esimerkissä vasemmalla on etsitty kahden muuttujan yhteinen optimi. Siinä on tarkoituksena optimoida rakennuksen lämpöeriste, jonka paksuus vaikuttaa toisaalta investointikuluihin, toisaalta lämmityksen kustannuksiin. Molemmille näille saadaan kuitenkin yhteinen asteikko muuttamalla investointikulut vuosikustannuksen muotoon, jolloin on helppoa todeta eristeen mitoituksen optimi. Se on hankintakulujen annuiteetin (käyrä B) ja vuosittaisten lämmitysmenojen (käyrä A) summan minimi.

Useiden muuttujien yhteisen optimoinnin metodiikasta on syntynyt erityinen matematiikan haara, operaatioanalyysi, josta löytyy tätä varten mm. lineaarisen ohjelmoinnin menetelmä.

Tuotteen ominaisuus Paino
Huippunopeus 160 km/h 40
Helppo ohjata,
automaattinen
40
Muotoilu urheilullinen,
poikkeaa kilpailijoista
10
Materiaalit kierrätettäviä 10
Painot yhteensä 100
Aina ei ole aikaa tai mahdollisuuksia selvittää täsmällisesti kohteen eri ominaisuuksien välisiä suhteita. Tällöin voidaan ehkä tyytyä laatimaan taulu, kuten oikealla, joka ilmoittaa tuotteelle haluttujen ominaisuuksien välisen painotuksen.

Monesti painotaulukko pyrkii kasvamaan hankalan laajaksi, minkä estämiseksi voidaan harkita yhdistää lähisukuisia ominaisuuksia faktorianalyysin avulla.

Arvoanalyysi

Arvoanalyysi on menetelmä, jossa haetaan yhteinen optimi kaikille merkittäville tuotteen ominaisuuksille. Jos myös hinta tai kustannus on vertailussa mukana, siitä voidaan käyttää nimeä hyötykustannusanalyysi. Se on selkeästi kvantitatiivinen metodi, sillä se vaatii mittaamaan kaikki tarkasteltavat ominaisuudet. Analyysin vaiheet ovat:

  1. Ennen varsinaista analyysia on kullekin tarkasteltavalle ominaisuudelle laadittava hyväksyttävyysasteikko (ks. yllä).
  2. Toiseksi tarvitaan kaikkien arvioitavien ominaisuuksien painot (ks. yllä).
  3. Laaditaan ristiintaulukointi, jossa on toisessa suunnassa arvioitavat ominaisuudet painoineen, toisessa kaikki vertailtavat vaihtoehdot.
  4. Arviointia varten lisätään taulukkoon kunkin arvioitavan tuotevaihtoehdon osalta kaksi saraketta. Ensimmäiseen niistä (alla keltainen) merkitään kyseisen vaihtoehdon saama "arvosana" asteikolla (esim.) 1...5. Toiseen sarakkeeseen (alla: PxA) tulee arvosanan ja sen painoarvon tulo. Lopuksi kaikki nämä tulot kunkin tuotevaihtoehdon osalta lasketaan yhteen (alla punaiseen ruutuun). Korkeimman summan saanut vaihtoehto on paras (mutta ei vielä välttämättä edullisin, ellei ominaisuuksien joukossa ole hintaa mainittu).
    Tuotteen
    ominaisuus
    Paino-
    arvo
    P
    Vaihtoehto 1 Vaihtoehto 2
    Arvo-
    sana
    A
    PxA Arvo-
    sana
    A
    PxA
    Kapasiteetti 40 2 80 5 200
    Käytön helppous ja automaattisuus 40 3 120 4 160
    Muotoilu 10 5 50 2 20
    Materiaalit, kierrätettävyys 10 3 30 2 20
    Yhteensä 100 -- 280 -- 400

    Jos arvoanalyysi tehdään siten kuin yllä, eli taulukossa arvioidaan vain hyötyarvoja eikä ollenkaan uhrauksia, on analyysissa lopuksi asetettava vastakkain hyödyt ja uhraukset. Tämä tehdään yksinkertaisesti ottamalla erikseen kunkin vaihtoehdon yllä (punaiseen ruutuun kursivoituna) saama loppuarvosana ja muodostamalla sen ja tuotteen hinnan (tai vastaavan kustannuksen) osamäärä, joka sitten osoittaa edullisimman vaihtoehdon. Kustannuksiin on monesti aihetta lukea sekä hankinta- että vuosikustannukset.

    Vaihtoehtoisesti kustannukset voidaan ottaa mukaan jo vertailutauluun omana rivinään, jonka painoarvoksi annetaan 40% tai 50%. Esimerkki tällaisesta taulusta.

  In English   En Español   Sisällysluettelosivulle

24.1. 2005. Alkuperäinen sijainti: http://www2.uiah.fi/projects/metodi
Kommentit kirjoittajalle: