Innehållsförteckning
- Formeln för korrelation
- Vanliga misstag med korrelation
- Hitta korrelation i Excel
Korrelation mäter det linjära förhållandet mellan två variabler. Genom att mäta och relatera variansen för varje variabel ger korrelation en indikation på relationens styrka. Eller för att uttrycka det på ett annat sätt, korrelation svarar på frågan: Hur mycket förklarar variabel A (den oberoende variabeln) variabel B (den beroende variabeln)?
Key Takeaways
- Korrelation är den statistiska linjära korrespondensen mellan variationer mellan två variabler. I ekonomi används korrelation i flera analysfaser inklusive beräkningen eller portföljstandardavvikelsen. Beräkningskorrelation kan vara tidskrävande, men mjukvara som Excel gör det enkelt att beräkna.
Formeln för korrelation
Korrelation kombinerar flera viktiga och relaterade statistiska begrepp, nämligen varians och standardavvikelse. Varians är spridningen av en variabel runt medelvärdet, och standardavvikelsen är kvadratroten av varians.
Formeln är:
Eftersom korrelation vill bedöma det linjära förhållandet mellan två variabler, är det som verkligen krävs att se vilken mängd samvariation dessa två variabler har, och i vilken utsträckning den samvariationen återspeglas av standardavvikelserna för varje variabel individuellt.
Vanliga misstag med korrelation
Det enskilt vanligaste misstaget är att antaga att en korrelation som närmar sig +/- 1 är statistiskt signifikant. En läsning som närmar sig +/- 1 ökar definitivt chansen för faktisk statistisk betydelse, men utan ytterligare test är det omöjligt att veta. Den statistiska testen av en korrelation kan bli komplicerad av flera orsaker; det är inte alls enkelt. Ett kritiskt antagande om korrelation är att variablerna är oberoende och att förhållandet mellan dem är linjärt. I teorin skulle du testa dessa påståenden för att avgöra om en korrelationsberäkning är lämplig.
Kom ihåg att korrelation mellan två variabler INTE innebär att A orsakade B eller vice versa.
Det näst vanligaste misstaget är att glömma att normalisera data till en gemensam enhet. Om man beräknar en korrelation på två betor, är enheterna redan normaliserade: beta är själva enheten. Men om du vill korrelera aktier är det viktigt att du normaliserar dem till procent avkastning och inte aktiekursförändringar. Detta händer alltför ofta, även bland investerare.
För korrespondens mellan aktier ställer du i huvudsak två frågor: Vad är avkastningen under ett visst antal perioder, och hur korrelerar den avkastningen med en annan värdepappers avkastning under samma period? Detta är också anledningen till att korrelera aktiekurser är svårt: Två värdepapper kan ha en hög korrelation om avkastningen är dagliga procent förändringar under de senaste 52 veckorna, men en låg korrelation om avkastningen är månatliga förändringar under de senaste 52 veckorna. Vilken är bättre"? Det finns verkligen inget perfekt svar, och det beror på testets syfte.
Hitta korrelation i Excel
Det finns flera metoder för att beräkna korrelation i Excel. Det enklaste är att få två datasätt sida vid sida och använda den inbyggda korrelationsformeln:
Detta är ett bekvämt sätt att beräkna en korrelation mellan bara två datamängder. Men vad händer om du vill skapa en korrelationsmatris över en rad datauppsättningar? För att göra detta måste du använda Excel's plugin för dataanalys. Plugin kan hittas på fliken Data under Analysera.
Välj avkastningstabellen. I det här fallet är våra kolumner titlade, så vi vill markera rutan "Etiketter i första raden", så Excel vet att behandla dessa som titlar. Sedan kan du välja att mata ut på samma ark eller på ett nytt ark.
När du trycker på enter görs data automatiskt. Du kan lägga till lite text och villkorlig formatering för att rensa upp resultatet.
