Vad är det Winsorized medelvärde?
Winsoriserat medelvärde är en metod för medelvärde som initialt ersätter de minsta och största värdena med observationerna närmast dem. Detta görs för att begränsa effekten av onormala extrema värden, eller outliers, på beräkningen. Efter att ha ersat värdena används sedan aritmetisk medelformel för att beräkna det vinnande medelvärdet.
Formeln för det vinsteriserade medelvärdet är
Winsoriserat medelvärde = Nxn… xn + 1 + xn + 2… xn där: n = Antalet största och minsta datapunkter som ska ersättas av observationen
Vinnoriserade medel uttrycks på två sätt. Ett "k n " winsoriserat medelvärde avser ersättningen av 'k' minsta och största observationer, där 'k' är ett heltal. Ett "X%" -vinsteriserat medelvärde innebär att ersätta en given procentandel av värden från båda ändarna av data.
Hur man beräknar Winsorized medelvärde
Det vinsteriserade medelvärdet beräknas genom att ersätta de minsta och största datapunkterna, sedan summera alla datapunkter och dela summan med det totala antalet datapunkter.
Vad berättar Winsorized dig?
Det vinsteriserade medelvärdet är mindre känsligt för outliers eftersom det kan ersätta dem med mindre extrema värden. Det är, det är mindre mottagligt för konturer jämfört med medelvärdet. Men om en distribution har fett svansar, kommer effekten av att ta bort de högsta och lägsta värdena i distributionen att ha lite inflytande på grund av det stora antalet variationer i fördelningstalen.
Key Takeaways
- En medelvärdesmetod som inkluderar att ersätta de minsta och största värdena med observationerna som är närmast dem. Mindre känsliga för outliers eftersom det kan ersätta dem med mindre extrema värden. tenderar att vara nära.
Exempel på hur man använder Winsorized medelvärde
Man kan beräkna det vinnande medelvärdet för följande datauppsättning: 1, 5, 7, 8, 9, 10, 14. I detta exempel antar vi att det vinnande medelvärdet är i första ordningen, vi ersätter de minsta och största värdena med deras närmaste observationer.
Datasatsen visas nu på följande sätt: 5, 5, 7, 8, 9, 10, 10. Om man tar ett aritmetiskt medelvärde för den nya uppsättningen ger man ett winsoriserat medelvärde på 7, 7, eller (5 + 5 + 7 + 8 + 9 + 10 + 10) dividerat med 7.
Eller tänk på ett 20% vinnarvärde som tar topp 10% och botten 10% och ersätter dem med nästa närmaste värde. Vi kommer att vinna över följande datauppsättning: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. De två minsta och största datapunkter, eller 10%, kommer att ersättas med deras nästa närmaste värde. Således är den nya datamängden: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Vinnarna medelvärde är 33, 9, eller summan av data (678) dividerat med det totala antalet datapunkter (20).
Skillnaden mellan Winsorized medelvärde och trimmad medelvärde
Det vinsteriserade medelvärdet inkluderar modifiering av datapunkter, medan det trimmade medelvärdet innebär att ta bort datapunkter. Det är vanligt att det vinsteriserade medelvärdet och det trimmade medlet är nära.
Begränsningar av användning av Winsorized medelvärde
En viktig nackdel för vinsteriserade medel är att de introducerar partiskhet i datauppsättningen. Visst sett är datauppsättningen idealiskt mindre partisk efter modifieringen än om utskott hade lämnats i.
Läs mer om Winsorized medelvärde
För relaterad insikt, om skillnaderna mellan viktiga medelberäkningar.
