Atliekant bet kokį tyrimą, vienas iš svarbiausių žingsnių yra tinkamos tiriamų objektų aibės - populiacijos - pasirinkimas. Jos objektai turi vieną ar keletą tyrėją dominančių požymių, pavyzdžiui, ekonomistą gali dominti visų Lietuvos įmonių pelnas. Statistinių tyrimų nagrinėjama objektų aibė dar vadinama populiacija. Populiacija gali būti ne tik baigtinė, bet ir begalinė. Pavyzdžiui, domina vabzdžiai, kurie gali platinti pavojingas ligas.
Norint įvertinti tiriamą objektų požymį, reikia mokėti jį išmatuoti. Tinkamai parinkti matavimo priemones - tai viena iš svarbesnių eksperimento planavimo problemų. Mokėdami išmatuoti požymį, galima kelti klausimą apie jo reikšmių paplitimą visoje populiacijoje. Paprastai atliekant realius tyrimus požymių reikšmių pasiskirstymo dažniai populiacijoje nežinomi.
Populiacijos elementai į imtį gali būti atrenkami įvairiais būdais. Vienas iš svarbiausių imties parinkimo reikalavimų - imties reprezentatyvumas. Imtis reprezentatyvi, jei ji teisingai atspindi tiriamo kintamojo galimų reikšmių proporcijas populiacijoje. Reprezentatyvumas glaudžiai susijęs su imties didumu. Jeigu imtis apima beveik visą populiaciją, tai ji labai reprezentatyvi.
Didinant imtį, galima padaryti patikimesnes išvadas, bet taip būna ne visada. Apibrėžus populiaciją ir iš jos parinkus imtį, toliau gauti duomenys sisteminami, pavyzdžiui, nustatomas didžiausias tikrintų įmonių pelnas ir pan. Susisteminus duomenis toliau atliekama sudėtingesnė statistinė analizė.
Dažniausiai į imtį elementai patenka atsitiktinai. Todėl ir visi duomenys ir gauti rezultatai taip pat yra atsitiktiniai. Todėl reikia atsitiktinumą skaitiškai įvertinti ir į gautą įvertį atsižvelgti. Populiacijos elementai tyrimui parenkami ne bet kaip, o iš anksto pasirinktu imties sudarymo būdu. Atliekant statistinius tyrimus, domina išvados apie visą populiaciją, todėl galima teigti, kad svarbiausia kiekvienos imties savybė yra jos reprezentatyvumas. Parenkant kiekvienos imties elementus, egzistuoja tam tikras atsitiktinumas.
Imties Sudarymo Metodai
Populiacijos elementai į imtį gali būti atrenkami įvairiais būdais. Vienas iš svarbiausių imties parinkimo reikalavimų - imties reprezentatyvumas. Imtis reprezentatyvi, jei ji teisingai atspindi tiriamo kintamojo galimų reikšmių proporcijas populiacijoje. Reprezentatyvumas glaudžiai susijęs su imties didumu. Jeigu imtis apima beveik visą populiaciją, tai ji labai reprezentatyvi.
Yra įvairių imties sudarymo metodų, kurie skirstomi į tikimybinius ir netikimybinius.
Netikimybinės Imtys
Netikimybinės imtys, kuriose atsitiktinumas yra subjektyvus arba apibrėžtas netiksliai:
- Ekspertinė arba tikslinė imtis: Elementai į imtį įtraukiami atsižvelgus į ekspertų nuomonę. Taip sudarytos imtys yra labai subjektyvios, todėl nelabai galima palyginti keleto taip sudarytų imčių. Imtis sudaro ekspertų parinkti „tipiniai“ populiacijos elementai.
- Kvotinė imtis: Populiacija suskaidoma į dalis pagal kuriuos nors tyrėjų pasirinktus požymius, tarkime, pagal demografinius rodiklius: amžių, lytį, gyvenamąją vietą, tautybę. Kiekvienos grupės narių imama tiek, kad būtų išlaikytos tokios pat proporcijos, kokios yra visoje gyventojų populiacijoje. Tačiau niekas tikrai nežino, kurios ir kiek populiacijos charakteristikų yra svarbios.
- Proginė arba patogioji imtis: Į imtį įtraukiami pirmi pasitaikę populiacijos elementai arba lengviausiai prieinama populiacijos dalis. Sudarant tokią imtį, daug lemia atsitiktinumas, kurio negalima aprašyti paprastais matematiniais modeliais ir kaip nors juos įvertinti. Tokia imtis visiškai nereprezentatyvi.
- Pagavimo, paleidimo ir pakartotinio pagavimo principu pagrįsta imtis: Tai tokia imtis, kai judantys populiacijos elementai (pavyzdžiui, žuvys, paukščiai) pagaunami, pažymimi, paleidžiami ir pakartotinai gaudomi. Imtį sudaro tiesiog pakartotinai pagauti elementai.
Tinkamai taikomas bet kuris iš minėtų metodų gali duoti gerus rezultatus. Tačiau jie nėra tikimybiniai, ir iš netikimybinių imčių gautų įverčių paklaidos negali būti statistiškai įvertintos. Vienintelis būdas įsitikinti, ar tinkami šie metodai, yra rasti tokią situaciją, kuriai esant žinomi visos populiacijos duomenys, ir juos palyginti su tyrimo rezultatais.
Tikimybinės Imtys
Kitoms imtims atsitiktinumas yra griežtai apibrėžtas - kiekvieno elemento galimybė patekti į imtį nusakoma tam tikra tikimybe.
- Sisteminis ėmimas: tai toks ėmimas, kai iš kuria nors tvarka sudaryto populiacijos elementų sąrašo, atsitiktinai pasirinkus pradžią, kiekvienas q-asis elementas yra išrenkamas į imtį.
- Sluoksninė imtis: Visa populiacija suskirstoma į sluoksnius. Renkant paprastąją atsitiktinę keturių elementų imtį iš visos populiacijos, gali atsitikti taip, kad į ją pateks pirmieji keturi mažieji ūkiai, ir pasėlių plotų sumos įvertis bus gerokai mažesnis negu jo tikroji reikšmė. Todėl galima bandyti suskaidyti populiaciją pagal žemės ūkio naudmenas į dvi dalis - į mažuosius bei didžiuosius ūkius - ir kiekvienoje iš šių dalių nepriklausomai viena nuo kitos išrinkti dvi imtis ir įvertinti šiose dalyse grūdinių kultūrų pasėlių plotų sumas atskirai.
- Lizdinė imtis: Visa populiacija suskirstoma į panašias pagal tam tikrą požymį grupes - lizdus (klasterius). Iš visų lizdų aibės paprastosios atsitiktinės imties būdu parenkama dalis lizdų. Iš šio kaimų sąrašo renkama kurios nors rūšies kaimų imtis ir apklausiami visi išrinktų kaimų gyventojai.
- Paprastoji atsitiktinė grąžintinė imtis: Paprastosios atsitiktinės imties išrinkimo būdų, arba schemų, yra daug.
- Nuoseklus išrinkimas.
- Paprastosios atsitiktinės imties išrinkimas, naudojant atsitiktinių skaičių lentelę.
- Imties išrinkimas, naudojant atsitiktinių skaičių generatorių.
Kartais tiriamos populiacijos elementai gali judėti arba, laikui bėgant, kisti. Gali būti, kad populiacijos elementai atsiranda ir išnyksta. Tada sudaryti ėmimo sąrašą sunku, o kartais net neįmanoma. Pvz, tiriamą populiaciją gali sudaryti pacientai, atvykę į greitosios pagalbos ligoninės priimamąjį; užsienio piliečiai, atvykę į Lietuvą per tam tikrą laikotarpį; telefonų skambučiai, ateinantys į telefonų stotį per tam tikrą laikotarpį. Tokioms populiacijoms tirti negalima naudoti tradicinių imčių planų, tokių kaip paprastoji atsitiktinė ar sluoksninė imtis. Net lizdinio ėmimo gali būti neįmanoma taikyti, nes elementai lizde būna trumpiau, negu reikia laiko informacijai iš jų surinkti.
Kaip nustatyti imties dydį?
Imties Paklaidos
Imtys neapima visos populiacijos. Dažniausiai, naudodamiesi imties duomenų aibe, skaitiškai įvertiname nežinomą populiacijos elementą. Skirtumas tarp tikrosios parametro reikšmės ir apskaičiuotosios iš imties duomenų vadinamas atsitiktine imties paklaida. Tarkime, pasirinkome tikimybinį imties sudarymo būdą. Elementai į tokias imtis patenka atsitiktinai. Todėl tuo pačiu metodu sudarę kelias vienodo dydžio tikimybines imtis, galima tikėtis, kad jų elementai nesutaps.
Atsitiktinė paklaida priklauso nuo imties didumo. Kuo didesnė imtis, tuo mažesnė atsitiktinė paklaida. Tačiau pasiekus tam tikrą imties didumą, atsitiktinė paklaida pradeda mažėti labai lėtai. Yra ir kitokių imties paklaidų, iškreipiančių rezultatus, kartu ir statistines išvadas. Tai paklaidos susijusios su “matavimo instrumento” netobulumu vadinamos sistemingosiomis paklaidomis.
Paklaidų stengiamasi išvengti arba bent jau jas sumažinti, atidžiai planuojant ir tvarkingai atliekant tyrimą. Paprastai galima tik įtarti esant šių rūšių sistemingąją paklaidą, bet jos objektyviai įvertinti, skirtingai nuo ėmimo paklaidos, dažniausiai negalima. Imčių teorijoje šios paklaidos nagrinėjamos kaip įvertinio poslinkio šaltinis, t.y.
Sisteminės Paklaidos
Yra ir kitokių imties paklaidų, iškreipiančių rezultatus, kartu ir statistines išvadas. Tai paklaidos susijusios su “matavimo instrumento” netobulumu vadinamos sistemingosiomis paklaidomis.Socialiniuose moksluose nustatant klausimo “neatsakymo laipsnį”, naudojamasi vadinamuoju atsakymo lygiu. Klausimai nevienareikšmiškai suformuluoti, t.y.
Imčiai išrinkti dažnai naudojami ėmimo sąrašai - tiriamos populiacijos elementų sąrašai. Ėmimo sąrašas gali būti netikslus: jis gali būti nepilnas arba (ir) perteklinis, t.y. jame gali trūkti kai kurių tiriamos populiacijos elementų arba gali būti tokių elementų, kurie tiriamai populiacijai nepriklauso. Tokiais atvejais statistiniai įverčiai apibūdina ne tą populiaciją, kurią norime tirti. Pavyzdžiui, visuomenės nuomonės apklausai naudodami telefonų sąrašus, negalėsime ištirti neturinčių telefonų gyventojų dalies. Ėmimo sąraše gali būti ir techninių klaidų. Dėl jų kai kurie populiacijos elementai gali būti tiesiog nepasiekiami. Jų priežastys būna įvairios.
Į imtį išrinktas populiacijos elementas gali būti nepasiekiamas dėl ėmimo sąrašo klaidų, pavyzdžiui, klaidingai nurodyto adreso. Respondentas gali nenorėti dalyvauti apklausoje, o gali ir negalėti (žmogus gali sirgti ir gulėti ligoninėje, atostogauti, būti išvykęs ir pan.). Užpildytą klausimyną klausėjas gali netyčia pamesti arba klausimynas gali būti netinkamas tolesnei analizei dėl jame esančių klaidų.
Neatsakę į apklausą imties elementai dažniausiai skiriasi nuo tų, kurie dalyvavo apklausoje. Pavyzdžiui, atliekant socialinę apklausą gyventojų namuose, sunkiau juose bus rasti aktyvų ir judrų gyvenimą mėgstančius žmones, mažesnių šeimų narius, bet juose dažniau aptinkami pensinio amžiaus žmonės arba mažus vaikus auginančios moterys. Tai klaidos, kurias padaro klausėjas ar respondentas, taip pat tokios klaidos, kurios atsiranda dėl klausimyno trūkumų ar apklausos vykdymo būdo. Tyrimo duomenų kokybei gali turėti įtakos klausėjo kvalifikacija, klausiamojo būdo ypatybės, jo nenoras atsakyti į klausimą, sveikatos būklė. Svarbi klausimyno kokybė. Atsakymui gali turėti įtakos pasirinkta klausimo formuluotė, klausimų pateikimo eilės tvarka. Tai duomenų įvedimo, kodavimo, redagavimo klaidos.
Duomenų Analizės Metodai
Duomenų analizės metodo parinkimas labai priklauso nuo jų prigimties. Populiacijos, kartu ir imties, elementus vienija tiriamasis požymis. Matuodami šį požymį, gauname tam tikrą dydį, kuris kinta kartu su imties nariais. Imties duomenų aibė - kintamojo reikšmių aibė (visų galimų kintamojo reikšmių poaibis). Kiekybiniai kintamieji dar savo ruožtu skirstomi į tolydžiuosius ir diskrečiuosius. Kiekybinis kintamasis vadinamas tolydžiuoju, jei jo reikšmių skirtumas yra kiek norima mažas. Pvz.
Kiekybinis kintamasis vadinamas diskrečiuoju, jei jo reikšmių skirtumas yra ne mažesnis už tam tikrą minimalų pokytį. Pvz. šeimos gausumas, banko klientų skaičius. Kokybinių ir kiekybinių kintamųjų analizės metodai traktuojami skirtingai. Duomenys, kartu ir kintamieji, yra klasifikuojami ir atsižvelgiant į naudotą matavimų skalę.
Kintamieji, kurie matuojami pavadinimų skalėje, vadinami nominaliaisiais kintamaisiais. Pavadinimų skalė dar vadinama nominaliąja, arba klasifikacine skale. Pagal kintamojo reikšmes, gautas naudojant pavadinimų skalę objektus galima tik klasifikuoti, t.y. Rangų skalė dar vadinama tvarkos skale. Ši skalė naudojama tada, kai statistikas gali nustatyti objektų tiriamo požymio, savybės skirtumus ir pagal tai juos išrikiuoti į eilę. Kintamieji, kurie matuojami rangų skalėje, vadinami ranginiais kintamaisiais. Matavimams naudojant šią skalę, objektus galima ne tik klasifikuoti, tvarkyti, bet ir kiekybiškai įvertinti skirtumus tarp klasių. Ši skalė skiriasi nuo intervalų skalės tik tuo, kad joje yra apibrėžta absoliuti atskaitos pradžia, t.y.
Aprašomoji Statistika
Aprašomoji statistika, tai duomenų sisteminimo ir grafinio vaizdavimo metodai. Aprašomoji statistika leidžia koncentruotai užrašyti informaciją, esančią dideliuose duomenų masyvuose. Taigi . Kintamojo reikšmės dažnis - tai skaičius, nusakantis, kiek kartų reikšmė pasikartojo duomenyse . Dažnių daugiakampis gaunamas Dekarto koordinatėse atidėtas dažnių reikšmes sujungus atkarpomis. Grupuotiems duomenims dažniausiai braižoma histograma, t.y. empirinės grupuotų duomenų tankio funkcijos grafikas. Reikalaujama, kad visų stačiakampių plotų suma būtų lygi 1.
Imties vidurkis (empirinis vidurkis) yra visų kintamojo matavimų suma padalinta iš jų skaičiaus . Moda - dažniausiai duomenų aibėje pasikartojusi reikšmė. Jeigu visos reikšmės statistinėje eilutėje pasikartoja vienodai dažnai, sakoma, kad pasiskirstymas neturi modos. Jeigu kelios gretimos variacinės eilutės reikšmės pasirodo vienodu dažniu ir šis dažnis yra didesnis, negu bet kuris kitas dažnis, tai moda yra šių reikšmių vidurkis. Gali būti kelios modos. Modą galima skaičiuoti tiek kiekybiniams tiek ir kokybiniams duomenims.
Mediana yra skaičius, už kurį 50% variacinės eilutės reikšmių yra nedidesnės ir 50% nemažesnės. Tikslesnis medianos apibrėžimas skamba taip: jeigu nelyginis, tai mediana yra variacinės eilutės reikšmė, atitinkanti poziciją. Jeigu stebėjimų skaičius lyginis, tai mediana yra variacinės eilutės reikšmių, atitinkančių pozicijas ir , aritmetinis vidurkis. Kvartiliai dalija variacinę eilutę į keturias “maždaug” lygias dalis. Vienas iš kvartilių radimo metodų skamba taip: sutampa su mediana ir dalija imtį į dvi dalis. Pagrindinės sklaidos charakteristikos yra duomenų aibės plotis, vidutinis nuokrypis, dispersija, standartinis nuokrypis, kvartilių skirtumas ir kitimo koeficientas.
Imties dispersija: . Iš apibrėžimo akivaizdu, kad dispersija visuomet neneigiama. Be to, dispersija lygi nuliui tuo ir tik tuo atveju, kai visi stebėjimai lygūs. Imties standartinis nuokrypis gaunamas, ištraukus kvadratinę šaknį iš dispersijos: . Procentinis kitimo koeficientas: . Čia - imties standartinis nuokrypis. Kitimo koeficientas skaičiuojamas tik santykių skalės kintamiesiems, turintiems teigiamus vidurkius: . Kitimo koeficientas - bedimensinis dydis.
Kokybinės įvairovės indeksas . Čia - kategorijų skaičius, - stebėjimų skaičius, - stebėjimų skaičius - oje kategorijoje ( - osios kategorijos dažnis). Kokybinės įvairovės indeksas kinta nuo 0 (nėra reikšmių sklaidos) iki 1 (maksimali reikšmių sklaida). Dažnių skirstinio formos charakteristikos}- tai histogramos (dažnių daugiakampio) formos charakteristikos. Asimetrijos koeficientas: . Čia yra standartinis nuokrypis, o yra centrinis empirinis 3-os eilės momentas: . Asimetrijos koeficientas - histogramos simetrijos matas. Jeigu , tai histograma turi teigiamą (dešiniąją) asimetriją, jeigu - neigiamą (kairiąją) asimetriją.
Eksceso koeficientas: . Čia yra standartinis nuokrypis, o yra centrinis empirinis 4-os eilės momentas: . Eksceso koeficientas - histogramos lėkštumo matas. Jeigu - dažnių skirstinio grafiko viršūnė yra aukštesnė, o uodegos plonesnės nei normaliosios kreivės. Jeigu - dažnių skirstinio grafiko viršūnė yra žemesne, o uodegos storesnės nei normaliosios kreivės. Normalioji kreivė: funkcijos grafikas. Funkcijos grafikas yra varpo formos ir visas juo apribotas plotas lygus vienetui. Jis yra simetriškas atžvilgiu. Nors pati funkcija apibrėžta su visais , bet toli nuo vidurkio funkcijos reikšmės labai mažos. Intervale plotas, apribotas grafiku, priklauso, nuo , bet nepriklauso nuo ir . Standartizuotoji z-reikšmė: .
Čebyšovo taisyklė: Nemažiau kaip dalis visų stebėjimų patenka į intervalą . Čia imties vidurkis, o imties standartinis nuokrypis. Atkreipiame dėmesį, kad nebūtinai sveikas skaičius. Stačiakampė diagrama grafinis suvestinės (min, , Md, , max) vaizdas. Stačiakampėje diagramoje yra ”dėžė” - stačiakampis, brėžiamas nuo pirmojo kvartilio iki trečiojo kvartilio , padalytas brūkšniu į dvi dalis ties mediana Md. (Kartais dar ‘su pažymimas vidurkio taškas). Nuo stačiakampio šono brėžiami “ūsai”, besitęsiantys iki paskutinės neišsiskiriančios duomenų aibės reikšmės ir didžiausios neišsiskiriančios duomenų aibės reikšmės.
| Imties tipas | Aprašymas | Privalumai | Trūkumai |
|---|---|---|---|
| Atsitiktinė | Kiekvienas populiacijos elementas turi vienodą tikimybę patekti į imtį. | Mažesnė šališkumo rizika. | Gali būti sudėtinga įgyvendinti didelėse populiacijose. |
| Sluoksninė | Populiacija padalijama į sluoksnius, ir iš kiekvieno sluoksnio atrenkama atsitiktinė imtis. | Užtikrina, kad kiekvienas sluoksnis būtų tinkamai atstovaujamas. | Reikia išankstinės informacijos apie populiacijos sluoksnius. |
| Lizdinė | Populiacija padalijama į grupes (lizdus), ir atsitiktinai atrenkami lizdai, įtraukiant visus lizdo elementus į imtį. | Ekonomiškai efektyvi, ypač geografiniu požiūriu. | Gali būti didesnė paklaida, jei lizdai nėra homogeniški. |
| Sisteminga | Elementai atrenkami iš sąrašo kas tam tikrą intervalą. | Paprasta įgyvendinti. | Gali būti šališka, jei sąraše yra periodiškumas. |

Įvairios imties schemos
Išvados
Tinkamas imties dydžio parinkimas ir imties sudarymo metodas yra esminiai norint gauti patikimus ir reprezentatyvius tyrimo rezultatus. Svarbu atsižvelgti į populiacijos ypatumus, tyrimo tikslus ir galimas paklaidas, siekiant užtikrinti tyrimo validumą ir patikimumą.