Vad är en kvartil?
En kvartil är en statistisk term som beskriver en indelning av observationer i fyra definierade intervaller baserat på värdena på data och hur de jämför med hela observationsuppsättningen.
Förstå kvartiler
För att förstå kvartilen är det viktigt att förstå medianen som ett mått på central tendens. Median i statistik är mittvärdet för en uppsättning siffror. Det är den punkt där exakt hälften av uppgifterna ligger under och över det centrala värdet.
Med tanke på en uppsättning med 13 nummer skulle medianen vara det sjunde numret. De sex siffrorna som föregår detta värde är de lägsta siffrorna i datan, och de sex siffrorna efter medianen är de högsta siffrorna i den angivna datauppsättningen. Eftersom medianen inte påverkas av extrema värden eller outliers i fördelningen föredras den ibland framför medelvärdet.
Medianen är en robust uppskattning av platsen men säger ingenting om hur informationen på endera sidan av dess värde sprids eller sprids. Det är där kvartilen går in. Kvartilen mäter spridningen av värden över och under medelvärdet genom att dela upp fördelningen i fyra grupper.
Key Takeaways
- Kvartilen mäter spridningen av värden över och under medelvärdet genom att dela upp fördelningen i fyra grupper. En kvartil delar upp data i tre punkter - en nedre kvartil, median och övre kvartil - för att bilda fyra grupper av datamängden. Kvartiler används för att beräkna interkvartilområdet, som är ett mått på variationen runt medianen.
Hur kvartiler fungerar
Precis som medianen delar upp data i hälften så att 50% av mätningen ligger under medianen och 50% ligger ovanför den, så delar kvartilen upp data i kvartal så att 25% av mätningen är mindre än den nedre kvartilen, 50 % är mindre än medelvärdet och 75% är mindre än den övre kvartilen.
En kvartil delar upp data i tre punkter - en nedre kvartil, median och övre kvartil - för att bilda fyra grupper av datamängden. Den nedre kvartilen eller den första kvartilen betecknas som Q1 och är det mellersta numret som faller mellan det minsta värdet på datamängden och median. Den andra kvartilen, Q2, är också median. Den övre eller tredje kvartilen, betecknad som Q3, är den centrala punkten som ligger mellan medianen och det högsta antalet fördelningar.
Nu kan vi kartlägga de fyra grupperna som bildas från kvartilerna. Den första gruppen med värden innehåller det minsta antalet upp till Q1; den andra gruppen inkluderar Q1 till medianen; den tredje uppsättningen är median till Q3; den fjärde kategorin omfattar Q3 till den högsta datapunkten för hela uppsättningen.
Varje kvartil innehåller 25% av de totala observationerna. I allmänhet är uppgifterna ordnade från minsta till största:
- Första kvartilen: den lägsta 25% av siffrorna Andra kvartilen: mellan 25, 1% och 50% (upp till medianen) Tredje kvartilen: 51% till 75% (över medianen) Fjärde kvartilen: den högsta 25% av siffrorna
Kvartilexempel
Låt oss arbeta med ett exempel. Antag att fördelningen av mattepoäng i en klass på 19 studenter i stigande ordning är:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Markera först medianen Q2, som i detta fall är det tionde värdet: 75.
Q1 är den centrala punkten mellan den minsta poängen och medianen. I detta fall faller Q1 mellan den första och den femte poängen: 68.
Q3 är mittvärdet mellan Q2 och den högsta poängen: 84..
Nu när vi har våra kvartiler, låt oss tolka deras antal. En poäng på 68 (Q1) representerar den första kvartilen och är den 25: e percentilen. 68 är medianen för den nedre halvan av poänguppsättningen i tillgängliga data, dvs medianen för poängen från 59 till 75.
Q1 berättar att 25% av poängen är mindre än 68 och 75% av klassens poäng är större. Q2 (medianen) är den 50: e percentilen och visar att 50% av poängen är mindre än 75, och 50% av poängen är över 75. Slutligen avslöjar Q3, den 75: e percentilen, att 25% av poängen är större och 75% är mindre än 84.
Särskilda överväganden
Om datapunkten för Q1 är längre bort från median än Q3 är från median, kan vi säga att det finns en större spridning mellan de mindre värdena i datauppsättningen än bland de större värdena. Samma logik gäller om Q3 är längre bort från Q2 än Q1 är från median.
Alternativt, om det finns ett jämnt antal datapunkter, kommer medianen att vara medelvärdet av de två mellersta siffrorna. I vårt exempel ovan, om vi hade 20 elever i stället för 19, kommer median av deras poäng att vara det aritmetiska genomsnittet för det tionde och elfte talet.
Kvartiler används för att beräkna interkvartilområdet, vilket är ett mått på variationer runt medianen. Interkvartilområdet beräknas helt enkelt som skillnaden mellan den första och tredje kvartilen: Q3 - Q1. I själva verket är det intervallet för den mellersta halvan av data som visar hur spridd informationen är.
För stora datauppsättningar har Microsoft Excel en QUARTILE-funktion för att beräkna kvartiler.
