Vad är en T-distribution?
T-distributionen, även känd som studentens t-distribution, är en typ av sannolikhetsfördelning som liknar normalfördelningen med dess klockform men har tyngre svansar. T-fördelningar har större chans för extrema värden än normala fördelningar, därav de fetare svansarna.
Key Takeaways
- T-fördelningen är en kontinuerlig sannolikhetsfördelning av z-poängen när den uppskattade standardavvikelsen används i nämnaren snarare än den verkliga standardavvikelsen. T-fördelningen, liksom normalfördelningen, är klockformad och symmetrisk, men den har tyngre svansar, vilket innebär att det tenderar att producera värden som faller långt från dess medelvärde. T-test används i statistik för att uppskatta betydelse.
Vad säger en T-distribution dig?
Svansens tyngd bestäms av en parameter för T-fördelningen som kallas frihetsgrader, med mindre värden som ger tyngre svansar, och med högre värden gör T-fördelningen liknar en standardnormfördelning med ett medelvärde på 0 och en standardavvikelse på 1. T-distribution är också känd som "Student's T Distribution."
Den blå regionen illustrerar ett två-svansat hypotestest. CKTaylor
När ett prov av n-observationer tas från en normalt fördelad population med medel M och standardavvikelse D, kommer provmedlet, m och provstandardavvikelsen, d, att skilja sig från M och D på grund av provets slumpmässighet.
En z-poäng kan beräknas med populationens standardavvikelse som Z = (m - M) / {D / sqrt (n)}, och detta värde har normalfördelning med medelvärdet 0 och standardavvikelse 1. Men när detta z- poängen beräknas med hjälp av den uppskattade standardavvikelsen, vilket ger T = (m - M) / {d / sqrt (n)}, skillnaden mellan d och D gör att fördelningen till en T-fördelning med (n - 1) grader av frihet snarare än normalfördelningen med medelvärde 0 och standardavvikelse 1.
Exempel på hur man använder en T-distribution
Ta följande exempel för hur t-distributioner används i statistisk analys. Kom först ihåg att ett konfidensintervall för medelvärdet är ett intervall av värden, beräknade från data, som är avsedda att fånga ett ”populationsmedelvärde”. Detta intervall är m + - t * d / sqrt (n), där t är ett kritiskt värde från T-fördelningen.
Till exempel är ett konfidensintervall på 95% för den genomsnittliga avkastningen av Dow Jones Industrial Average under de 27 handelsdagarna före 9/11/2001 -0, 33%, (+/- 2, 055) * 1, 07 / sqrt (27), vilket ger en (ihållande) medelavkastning som ett antal mellan -0, 75% och + 0, 09%. Siffran 2.055, mängden standardfel att justera efter, hittas från T-distributionen.
Eftersom T-distributionen har fetare svansar än en normalfördelning, kan den användas som en modell för ekonomisk avkastning som uppvisar överskott av kurtos, vilket möjliggör en mer realistisk beräkning av Value at Risk (VaR) i sådana fall.
Skillnaden mellan en T-distribution och en normalfördelning
Normala fördelningar används när befolkningsfördelningen antas vara normal. T-distributionen liknar normalfördelningen, bara med fetare svansar. Båda antar en normalt fördelad befolkning. T-fördelningar har högre kurtos än normala fördelningar. Sannolikheten för att få värden mycket långt ifrån medelvärdet är större med en T-fördelning än en normalfördelning.
Begränsningar av att använda en T-distribution
T-fördelningen kan skeva exaktheten relativt normalfördelningen. Bristerna uppstår endast när det finns behov av perfekt normalitet. Skillnaden mellan att använda en normal och T-distribution är emellertid relativt liten.
