Šiame straipsnyje nagrinėsime situacijas, kai imties vidurkis yra didesnis už 75% kvantilį, pateiksime pavyzdžius ir paaiškinimus, remiantis statistikos principais.

Stačiakampė diagrama grafinis suvestinės (min, Q1, Md, Q3, max) vaizdas
Pagrindinės Sąvokos
Aprašomoji Statistika
Aprašomoji statistika - tai duomenų sisteminimo ir grafinio vaizdavimo metodai. Aprašomoji statistika leidžia koncentruotai užrašyti informaciją, esančią dideliuose duomenų masyvuose.
Kintamieji ir Skalės
- Pavadinimų skalė (nominalioji arba klasifikacinė skalė): Pagal kintamojo reikšmes, gautas naudojant pavadinimų skalę, objektus galima tik klasifikuoti.
- Rangų skalė (tvarkos skalė): Ši skalė naudojama tada, kai statistikas gali nustatyti objektų tiriamo požymio, savybės skirtumus ir pagal tai juos išrikiuoti į eilę. Kintamieji, kurie matuojami rangų skalėje, vadinami ranginiais kintamaisiais.
Imties Vidurkis
Imties vidurkis (empirinis vidurkis) yra visų kintamojo matavimų suma padalinta iš jų skaičiaus.
Formulė:
Moda
Moda - dažniausiai duomenų aibėje pasikartojusi reikšmė. Jeigu visos reikšmės statistinėje eilutėje pasikartoja vienodai dažnai, sakoma, kad pasiskirstymas neturi modos. Gali būti kelios modos. Modą galima skaičiuoti tiek kiekybiniams tiek ir kokybiniams duomenims.
Mediana
Mediana yra skaičius, už kurį 50% variacinės eilutės reikšmių yra nedidesnės ir 50% nemažesnės. Jeigu n nelyginis, tai mediana yra variacinės eilutės reikšmė, atitinkanti poziciją . Jeigu stebėjimų skaičius lyginis, tai mediana yra variacinės eilutės reikšmių, atitinkančių pozicijas ir , aritmetinis vidurkis.
Kvartiliai
Kvartiliai dalija variacinę eilutę į keturias „maždaug“ lygias dalis. Vienas iš kvartilių radimo metodų skamba taip: sutampa su mediana ir dalija imtį į dvi dalis.
Sklaidos Charakteristikos
Pagrindinės sklaidos charakteristikos yra duomenų aibės plotis, vidutinis nuokrypis, dispersija, standartinis nuokrypis, kvartilių skirtumas ir kitimo koeficientas.
Dispersija
Imties dispersija: Iš apibrėžimo akivaizdu, kad dispersija visuomet neneigiama. Be to, dispersija lygi nuliui tuo ir tik tuo atveju, kai visi stebėjimai lygūs.
Kitimo Koeficientas
Procentinis kitimo koeficientas: . Čia - imties standartinis nuokrypis. Kitimo koeficientas skaičiuojamas tik santykių skalės kintamiesiems, turintiems teigiamus vidurkius: . Kitimo koeficientas - bedimensinis dydis.
Kokybinės Įvairovės Indeksas
Kokybinės įvairovės indeksas: . Čia - kategorijų skaičius, - stebėjimų skaičius, - stebėjimų skaičius - oje kategorijoje ( - osios kategorijos dažnis). Kokybinės įvairovės indeksas kinta nuo 0 (nėra reikšmių sklaidos) iki 1 (maksimali reikšmių sklaida).
Dažnių Skirstinio Formos Charakteristikos
Tai histogramos (dažnių daugiakampio) formos charakteristikos.
Asimetrijos Koeficientas
Asimetrijos koeficientas: . Čia yra standartinis nuokrypis, o yra centrinis empirinis 3-os eilės momentas. Asimetrijos koeficientas - histogramos simetrijos matas. Jeigu , tai histograma turi teigiamą (dešiniąją) asimetriją, jeigu - neigiamą (kairiąją) asimetriją.
Eksceso Koeficientas
Eksceso koeficientas: . Čia yra standartinis nuokrypis, o yra centrinis empirinis 4-os eilės momentas. Eksceso koeficientas - histogramos lėkštumo matas. Jeigu - dažnių skirstinio grafiko viršūnė yra aukštesnė, o uodegos plonesnės nei normaliosios kreivės. Jeigu - dažnių skirstinio grafiko viršūnė yra žemesnė, o uodegos storesnės nei normaliosios kreivės.
Normalioji Kreivė
Normalioji kreivė: funkcijos grafikas. Funkcijos grafikas yra varpo formos ir visas juo apribotas plotas lygus vienetui. Jis yra simetriškas atžvilgiu .
Standartizuotoji Z-Reikšmė
Standartizuotoji z-reikšmė: .
Čebyšovo Taisyklė
Čebyšovo taisyklė: Nemažiau kaip dalis visų stebėjimų patenka į intervalą . Čia imties vidurkis, o imties standartinis nuokrypis.
Stačiakampė Diagrama
Stačiakampė diagrama - grafinis suvestinės (min, , Md, , max) vaizdas. Stačiakampėje diagramoje yra „dėžė“ - stačiakampis, brėžiamas nuo pirmojo kvartilio iki trečiojo kvartilio , padalytas brūkšniu į dvi dalis ties mediana Md. Nuo stačiakampio šono brėžiami „ūsai“, besitęsiantys iki paskutinės neišsiskiriančios duomenų aibės reikšmės ir didžiausios neišsiskiriančios duomenų aibės reikšmės.
Imties Metodai
Statistikoje naudojami įvairūs imties metodai, siekiant reprezentatyviai atspindėti populiaciją. Štai keletas pagrindinių:
- Kvotinė imtis: Atsižvelgus į populiacijos sandarą, iš anksto numatomos imties elementų kvotos.
- Sluoksninė imtis: Visa populiacija suskirstoma į sluoksnius (stratus).
- Lizdinė imtis: Visa populiacija suskirstoma į panašias pagal tam tikrą požymį grupes - lizdus (klasterius). Iš visų lizdų aibės paprastosios atsitiktinės imties būdu parenkama dalis.
Kada Vidurkis Didesnis Už 75% Kvantilį?
Situacija, kai vidurkis yra didesnis už 75% kvantilį, rodo, kad duomenų pasiskirstymas yra asimetriškas į dešinę (teigiama asimetrija). Tai reiškia, kad yra reikšmių, kurios yra žymiai didesnės už medianą ir trečiąjį kvartilį, todėl jos padidina vidurkį.
Pavyzdys: Įmonės atlyginimai. Tarkime, kad įmonėje didžioji dalis darbuotojų gauna mažesnius atlyginimus, tačiau keli vadovai ar specialistai gauna labai didelius atlyginimus. Tokiu atveju vidutinis atlyginimas bus didesnis už 75% kvantilį, nes dideli atlyginimai „patemps“ vidurkį aukštyn.
Praktinis Pavyzdys
Įmonėje vidutinis atlyginimas yra 500 Eur, mediana - 400 Eur, tačiau 15% įmonės darbuotojų dirba po 3 val. per mėnesį. Įstatymas reikalauja skelbti 25% kvantilį ir 75% kvantilį. Dar vienas planuojamas skelbti rodiklis - statistinis nuokrypis - parodo, kaip atlyginimų reikšmės nutolusios nuo vidutinio atlyginimo. Kuo mažesnis nuokrypis, tuo atlyginimai yra arčiau vidutinio atlyginimo. Pastarasis rodiklis parodo, ar bendrovėje dideli atlyginimų skirtumai.
Šis pavyzdys iliustruoja, kad vidurkis gali būti didesnis už 75% kvantilį dėl didelių atlyginimų skirtumų įmonėje. Tai svarbu žinoti analizuojant socialinius ir ekonominius duomenis.
Statistinė (parametrinė) hipotezė
Bet koks teiginys apie populiacijos parametro(ų) reikšmę(es) vadinamas parametrine hipoteze. Statistinę parametrinę hipotezę sudaro du alternatyvūs teiginiai apie galimas parametro reikšmes. Čia - parametrinė hipotezė (nulinė hipotezė), o - alternatyva (alternatyvioji hipotezė). Alternatyvos skiriamos į dvipuses: ir vienpuses: (arba ).
Pirmos Rūšies Klaida Tikrinant Hipotezes
Pirmos rūšies klaida tikrinant hipotezes: atmetame , o ji teisinga.
Ryšys Tarp Kritinės Srities Ir Reikšmingumo Lygmens
Kriterijaus galia - tai tikimybė atmesti hipotezę , kai ji klaidinga: atmetame , o klaidinga , o .
Lietuvos Kontekstas
Jeigu įmonėje yra daugiau kaip trys darbuotojai, skelbiamas atlyginimų vidurkis. „Sodra“ paaiškina, kad įmonės atlyginimų mediana nustatoma išrikiuojant atlyginimus didėjančia ar mažėjančia tvarka ir paėmus šioje eilutėje pačiame viduryje esančią reikšmę. Įstatyme kalbama apie kvantilius, nors dažniau minimi yra kvartiliai.
Kvantilis, anot „Sodros“, tai imtis, gaunama atlyginimų reikšmių aibę padalinus į keturias dalis.
Lentelė: Skirtumas tarp Vidurkio ir Kvantilių
| Rodiklis | Apibrėžimas | Pavyzdys |
|---|---|---|
| Vidurkis | Visų reikšmių suma padalinta iš jų skaičiaus | Atlyginimų vidurkis įmonėje |
| Mediana | Reikšmė, skirianti duomenų aibę į dvi lygias dalis | Atlyginimų mediana įmonėje |
| 75% Kvantilis | Reikšmė, už kurią yra 75% duomenų | Atlyginimų 75% kvantilis įmonėje |