Varians är ett mått på spridningen mellan siffror i en datamängd. Variansen mäter hur långt varje nummer i uppsättningen är från medelvärdet.
Med hjälp av ett datauppsättningsschema kan vi observera vad som är linjärt förhållande mellan olika datapunkter eller siffror. Vi gör detta genom att rita en regressionslinje, som försöker minimera avståndet för varje enskild datapunkt från själva linjen. I diagrammet nedan är datapunkterna de blå prickarna, den orange linjen är regressionslinjen och de röda pilarna är avståndet från observerade data och regressionslinjen.
Bild av Julie Bang © Investopedia 2020
När vi beräknar en varians, frågar vi, med tanke på förhållandet mellan alla dessa datapunkter, hur mycket avstånd förväntar vi oss vid nästa datapunkt? Detta "avstånd" kallas feltermen, och det är vad variansen mäter.
I sig är variansen inte ofta användbar eftersom den inte har en enhet, vilket gör det svårt att mäta och jämföra. Men kvadratroten av varians är standardavvikelsen, och det är både praktiskt som en mätning.
Beräkna variation i Excel
Att beräkna varians i Excel är enkelt om du redan har angett datauppsättningen i programvaran. I exemplet nedan kommer vi att beräkna variationen på 20 dagars avkastning i den mycket populära börshandlade fonden (ETF) med namnet SPY, som investerar i S&P 500.
- Formeln är = VAR.S (välj data)
Anledningen till att du vill använda VAR.S och inte VAR.P (som är en annan formel som erbjuds) är att du ofta inte har hela datapopulationen att mäta. Om vi till exempel hade alla avkastningar i SPY ETF: s historia i vår tabell, skulle vi kunna använda populationsmätningen VAR.P, men eftersom vi bara mäter de senaste 20 dagarna för att illustrera konceptet kommer vi att använda VAR.S.
Som ni ser berättar det beräknade variansvärdet på.000018674 oss lite om datauppsättningen, av sig själv. Om vi fortsatte med kvadratroten detta värde för att få standardavvikelsen för avkastning, skulle det vara mer användbart.
