Normalfördelningsformeln är baserad på två enkla parametrar - medel- och standardavvikelse - som kvantifierar egenskaperna hos en given datasats. Medan medelvärdet indikerar det "centrala" eller medelvärdet för hela datasatsen, indikerar standardavvikelsen "spridningen" eller variationen av datapunkter runt det genomsnittliga värdet.
Tänk på följande två datasätt:
Dataset 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Dataset 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
För Dataset1, medelvärde = 10 och standardavvikelse (stddev) = 0
För Dataset2, medelvärde = 10 och standardavvikelse (stddev) = 2, 83
Låt oss plotta dessa värden för DataSet1:
På liknande sätt för DataSet2:
Den röda horisontella linjen i båda ovanstående diagram indikerar ”medelvärdet” eller medelvärdet för varje datasats (10 i båda fallen). De rosa pilarna i den andra grafen indikerar spridningen eller variationen av datavärden från medelvärdet. Detta representeras av standardavvikelsevärde på 2, 83 i fall av DataSet2. Eftersom DataSet1 har alla värden samma (som 10 vardera) och inga variationer, är stddev-värdet noll, och därför är inga rosa pilar tillämpliga.
Stddev-värdet har några betydande och användbara egenskaper som är extremt användbara vid dataanalys. För en normalfördelning är datavärdena symmetriskt fördelade på endera sidan av medelvärdet. För alla normalt distribuerade datasätt, plottar graf med stddev på horisontell axel och nr. av datavärden på vertikal axel erhålls följande graf.
Egenskaper för en normal distribution
- Normalkurvan är symmetrisk om medelvärdet; Medlet är i mitten och delar upp området i två halvor; Den totala ytan under kurvan är lika med 1 för medelvärde = 0 och stdev = 1; Fördelningen beskrivs fullständigt med dess medelvärde och stddev
Som framgår av diagrammet ovan representerar stddev följande:
- 68, 3% av datavärden ligger inom 1 standardavvikelse från medelvärdet (-1 till +1) 95, 4% av datavärdena ligger inom 2 standardavvikelser för medelvärdet (-2 till +2) 99, 7% av datavärdena ligger inom 3 standardavvikelser av medelvärdet (-3 till +3)
Området under den klockformade kurvan indikerar, när den mäts, den önskade sannolikheten för ett visst intervall:
- mindre än X: - t.ex. sannolikheten för att datavärden är mindre än 70 större än X - t.ex. sannolikheten för att datavärden är större än 95 mellan X 1 och X 2 - t.ex. sannolikheten för datavärden mellan 65 och 85
där X är ett värde av intresse (exempel nedan).
Plottning och beräkning av området är inte alltid bekvämt, eftersom olika datasätt har olika medelvärden och stddev-värden. För att underlätta en enhetlig standardmetod för enkla beräkningar och tillämpbarhet på verkliga problem infördes standardomvandlingen till Z-värden, som utgör en del av Normal Distribution Table.
Z = (X - medelvärde) / stddev, där X är den slumpmässiga variabeln.
I grund och botten tvingar denna omvandling medelvärdet och stddev att standardiseras till 0 respektive 1, vilket möjliggör att en standarddefinierad uppsättning Z-värden (från normalfördelningstabellen) används för enkla beräkningar. En snap-shot av standard z-värdetabellen som innehåller sannolikhetsvärden är som följer:
z |
0, 00 |
0, 01 |
0, 02 |
0, 03 |
0, 04 |
0, 05 |
0, 06 |
0, 0 |
0.00000 |
0, 00399 |
0, 00798 |
0, 01197 |
0, 01595 |
0, 01994 |
… |
0, 1 |
0, 0398 |
0, 04380 |
0, 04776 |
0, 05172 |
0, 05567 |
0, 05966 |
… |
0, 2 |
0, 0793 |
0, 08317 |
0, 08706 |
0, 09095 |
0, 09483 |
0, 09871 |
… |
0, 3 |
0, 11791 |
0, 12172 |
0, 12552 |
0, 12930 |
0, 13307 |
0, 13683 |
… |
0, 4 |
0, 15542 |
0, 15910 |
0, 16276 |
0, 16640 |
0, 17003 |
0, 17364 |
… |
0, 5 |
0, 19146 |
0, 19497 |
0, 19847 |
0, 20194 |
0, 20540 |
0, 20884 |
… |
0, 6 |
0, 22575 |
0, 22907 |
0, 23237 |
0, 23565 |
0, 23891 |
0, 24215 |
… |
0, 7 |
0, 25804 |
0, 26115 |
0, 26424 |
0, 26730 |
0, 27035 |
0, 27337 |
… |
... |
… |
… |
… |
… |
… |
… |
… |
För att hitta sannolikheten relaterad till z-värdet på 0.239865, avrunda det först till 2 decimaler (dvs. 0, 24). Kontrollera sedan för de två första signifikanta siffrorna (0, 2) i raderna och för den minst signifikanta siffran (kvarvarande 0, 04) i kolumnen. Det kommer att leda till ett värde av 0, 09483.
Här finns en komplett normalfördelningstabell med precision upp till 5 decimaler för sannolikhetsvärden (inklusive de för negativa värden).
Låt oss se några exempel på verkliga livet. Höjden på individer i en stor grupp följer ett normalt fördelningsmönster. Antag att vi har en uppsättning av 100 individer vars höjder registreras och medelvärdet och stddev beräknas till 66 respektive 6 tum.
Här är några exempelfrågor som enkelt kan besvaras med tabellen z-värde:
- Vad är troligt att en person i gruppen är 70 tum eller mindre?
Frågan är att hitta det kumulativa värdet på P (X <= 70), dvs i hela datasatsen 100, hur många värden kommer att vara mellan 0 och 70.
Låt oss först konvertera X-värde på 70 till motsvarande Z-värde.
Z = (X - medelvärde) / stddev = (70-66) / 6 = 4/6 = 0.66667 = 0, 67 (runda till 2 decimaler)
Vi måste nu hitta P (Z <= 0.67) = 0. 24857 (från z-tabellen ovan)
dvs det är en 24, 857% sannolikhet för att en individ i gruppen kommer att vara mindre än eller lika med 70 tum.
Men vänta - ovanstående är ofullständig. Kom ihåg att vi letar efter sannolikheten för alla möjliga höjder upp till 70 dvs. från 0 till 70. Ovanstående ger dig bara delen från medelvärde till önskat värde (dvs. 66 till 70). Vi måste inkludera den andra halvan - från 0 till 66 - för att komma fram till rätt svar.
Eftersom 0 till 66 representerar halvdelen (dvs ett extremt till medelvägsmedelvärde) är dess sannolikhet helt enkelt 0, 5.
Därför är den korrekta sannolikheten för att en person är 70 tum eller mindre = 0.24857 + 0.5 = 0. 74857 = 74.857%
Grafiskt (genom att beräkna området) är det dessa två summerade regioner som representerar lösningen:
- Vad är sannolikheten för att en person är 75 tum eller högre?
dvs Hitta kompletterande kumulativ P (X> = 75).
Z = (X - medelvärde) / stddev = (75-66) / 6 = 9/6 = 1, 5
P (Z> = 1, 5) = 1- P (Z <= 1, 5) = 1 - (0, 5 + 0, 43319) = 0, 06681 = 6, 681%
- Vad är sannolikheten för att en person befinner sig mellan 52 tum och 67 tum?
Hitta P (52 <= X <= 67).
P (52 <= X <= 67) = P = P (-2, 33 <= Z <= 0, 17)
= P (Z <= 0, 17) –P (Z <= -0, 233) = (0, 5 + 0, 56749) - (.40905) =
Denna normala fördelningstabell (och z-värden) finner vanligtvis användning för alla sannolikhetsberäkningar på förväntade kursrörelser på aktiemarknaden för aktier och index. De används i intervallbaserad handel, identifierar upp- eller nedtrender, support- eller motståndsnivåer och andra tekniska indikatorer baserade på normala distributionskoncept för medel- och standardavvikelse.
Jämför investeringskonton × Erbjudandena som visas i denna tabell kommer från partnerskap från vilka Investopedia erhåller ersättning. Leverantörens namn Beskrivningrelaterade artiklar
Handel med grundutbildning
Hypotestest i finans: koncept och exempel
Riskhantering
Optimera din portfölj med normal distribution
Teknisk analys Grundutbildning
Den linjära regressionen av tid och pris
Riskhantering
Användningar och gränser för flyktighet
Finansiell analys
Hur man beräknar Value at Risk (VaR) i Excel
Verktyg för grundläggande analys
Förstå volatilitetsmätningar
PartnerlänkarRelaterade villkor
Konfidensintervall Definition Konfidensintervall, i statistik, avser sannolikheten för att en populationsparameter kommer att falla mellan två inställda värden. mer Riskhantering i finans I den finansiella världen är riskhantering processen för identifiering, analys och acceptans eller mildring av osäkerhet i investeringsbeslut. Riskhantering sker närhelst en investerare eller fondförvaltare analyserar och försöker kvantifiera potentialen för förluster i en investering. mer Förstå Spot Rate Treasury Curve Spot rate Treasury-kurvan definieras som en avkastningskurva konstruerad med hjälp av Treasury-spoträntor snarare än avkastning. Priskursskattekurvan kan användas som riktmärke för prissättning av obligationer. mer Gini-index Definition Gini-index är ett statistiskt mått på distribution som ofta används som en mätare av ekonomisk ojämlikhet. mer Capital Asset Pricing Model (CAPM) Capital Asset Pricing Model är en modell som beskriver förhållandet mellan risk och förväntad avkastning. mer Förstå harmoniskt medelvärde Det harmoniska medelvärdet är ett medelvärde som används i finansiering till genomsnittliga multiplar som pris-inkomstkvoten. Mer