Vad är summan av fyrkanter?
Summan av kvadrater är en statistisk teknik som används i regressionsanalys för att bestämma spridningen av datapunkter. I en regressionsanalys är målet att bestämma hur väl en dataserie kan anpassas till en funktion som kan hjälpa till att förklara hur dataserien genererades. Summan av rutorna används som ett matematiskt sätt att hitta den funktion som bäst passar (varierar minst) från data.
Formeln för summan av fyrkanter är
För en uppsättning X med n-objekt: Summen av kvadrater = i = 0∑n (Xi −X) 2 var: Xi = Den ith-posten i setX = Medelvärdet för alla objekt i uppsättningen (Xi −X) = Avvikelsen för varje objekt från medelvärdet
Summan av rutorna kallas också variation.
Vad berättar summan av rutorna?
Summan av kvadrater är ett mått på avvikelse från medelvärdet. I statistik är medelvärdet medelvärdet av en uppsättning siffror och är det mest använda måttet på central tendens. Det aritmetiska medelvärdet beräknas helt enkelt genom att summera värdena i datauppsättningen och dividera med antalet värden.
Låt oss säga att slutkurserna för Microsoft (MSFT) under de senaste fem dagarna var 74, 01, 74, 77, 73, 94, 73, 61 och 73, 40 i amerikanska dollar. Summan av de totala priserna är $ 369, 73 och medel- eller genomsnittspriset för läroboken skulle således vara $ 369, 73 / 5 = $ 73, 95.
Men att känna medelvärdet för en mätuppsättning räcker inte alltid. Ibland är det bra att veta hur mycket variation det finns i en uppsättning mätningar. Hur långt ifrån varandra de enskilda värdena är från medelvärdet kan ge viss inblick i hur passande observationerna eller värdena är för den regressionsmodell som skapas.
Om en analytiker till exempel vill veta om aktiekursen för MSFT rör sig i takt med priset på Apple (AAPL), kan han lista upp observationsuppsättningarna för båda aktiernas process under en viss period, säga 1, 2, eller 10 år och skapa en linjär modell med var och en av observationerna eller mätningarna registrerade. Om förhållandet mellan båda variablerna (dvs. priset på AAPL och priset för MSFT) inte är en rak linje, finns det variationer i datauppsättningen som måste granskas.
I statistik talar, om linjen i den linjära modellen som skapats inte passerar alla värdemätningar, är en del av variationen som har observerats i aktiekurserna oförklarlig. Summan av rutor används för att beräkna huruvida ett linjärt samband finns mellan två variabler, och eventuella oförklarade variationer benämns restsumman av kvadrater.
Summan av kvadrater är summan av variationens kvadrat, där variation definieras som spridningen mellan varje enskilt värde och medelvärdet. För att bestämma summan av rutorna kvadreras avståndet mellan varje datapunkt och raden för bästa passning och summeras sedan. Linjen med bästa passform minimerar detta värde.
Hur man beräknar summan av fyrkanter
Nu kan du se varför mätningen kallas summan av kvadratavvikelser eller summan av kvadrater för kort. Med hjälp av vårt MSFT-exempel ovan kan summan av rutor beräknas som:
- SS = (74, 01 - 73, 95) 2 + (74, 77 - 73, 95) 2 + (73, 94 - 73, 95) 2 + (73, 61 - 73, 95) 2 + (73, 40 - 73, 95) 2 SS = (0, 06) 2 + (0, 82) 2 + (- 0, 01) 2 + (-0, 34) 2 + (-0, 55) 2 SS = 1, 0942
Att lägga till summan av avvikelserna ensam utan kvadrat kommer att resultera i ett tal lika med eller nära noll eftersom de negativa avvikelserna nästan perfekt kommer att kompensera de positiva avvikelserna. För att få ett mer realistiskt antal måste summan av avvikelser vara kvadratiska. Summan av kvadrater kommer alltid att vara ett positivt tal eftersom kvadratet för valfritt antal, oavsett om det är positivt eller negativt, alltid är positivt.
Exempel på hur man använder summan av fyrkanter
Baserat på resultaten från MSFT-beräkningen indikerar en hög summa kvadrater att de flesta av värdena är längre bort från medelvärdet, och det finns därför stor variation i uppgifterna. En låg summa kvadrater avser låg variation i uppsättningen av observationer.
I exemplet ovan visar 1.0942 att variationen i aktiekursen för MSFT under de senaste fem dagarna är mycket låg och investerare som vill investera i aktier som kännetecknas av prisstabilitet och låg volatilitet kan välja MSFT.
Key Takeaways
- Summan av kvadrater mäter avvikelsen hos datapunkter bort från medelvärdet. Ett högre summa av kvadratresultat indikerar en stor grad av variation i datauppsättningen, medan ett lägre resultat indikerar att data varierar avsevärt från medelvärdet.
Begränsningar för att använda summan av fyrkanter
Att fatta ett investeringsbeslut om vilket aktie du ska köpa kräver många fler observationer än de som anges här. En analytiker kan behöva arbeta med många års data för att med högre säkerhet veta hur hög eller låg variationen i en tillgång är. När fler datapunkter läggs till i uppsättningen blir summan av kvadrater större när värdena sprids mer.
De mest använda variationerna är standardavvikelsen och variansen. För att beräkna endera av de två mätvärdena måste summan av rutorna först beräknas. Variansen är medelvärdet av summan av kvadrater (dvs. summan av rutorna dividerat med antalet observationer). Standardavvikelsen är kvadratroten av variationen.
Det finns två metoder för regressionsanalys som använder summan av kvadrater: den linjära minsta kvadratmetoden och den icke-linjära minsta kvadratmetoden. Minst kvadratmetoden hänvisar till det faktum att regressionsfunktionen minimerar summan av kvadraterna för variansen från de faktiska datapunkterna. På detta sätt är det möjligt att rita en funktion som statistiskt ger den bästa passningen för data. Observera att en regressionsfunktion kan antingen vara linjär (en rak linje) eller icke-linjär (en böjd linje).
