Vad är linjär regression?
Linjär regression är ett dataplan som visar det linjära förhållandet mellan en oberoende och en beroende variabel. Det används vanligtvis för att visuellt visa styrkan i relationen och spridningen av resultat - allt för att förklara beteendet hos den beroende variabeln.
Säg att vi ville testa styrkan i förhållandet mellan mängden glass som äts och fetma. Vi skulle ta den oberoende variabeln, mängden glass, och relatera den till den beroende variabeln, fetma, för att se om det fanns ett samband. Med tanke på en regression är en grafisk visning av detta förhållande, ju lägre variationen i data, desto starkare är relationen och desto strammare passar regressionslinjen.
Key Takeaways
- Linjär regression modellerar förhållandet mellan en beroende och oberoende variabel (er). Regressionsanalys kan uppnås om variablerna är oberoende, det inte finns någon heteroscedasticitet, och feltermerna för variabler korreleras inte. Modellering av linjär regression i Excel är lättare med Dataanalysverktygspaket.
Viktiga överväganden
Det finns några kritiska antaganden om din datauppsättning som måste vara sanna för att fortsätta med en regressionsanalys:
- Variablerna måste vara verkligen oberoende (med hjälp av ett Chi-square-test). Uppgifterna får inte ha olika felvariationer (detta kallas heteroskedasticitet (även stavat heteroscedasticitet)). Villkoren för varje variabel måste vara okorrelerade. Om inte, betyder det att variablerna är seriellt korrelerade.
Om dessa tre saker låter komplicerade är de det. Men effekten av att ett av dessa överväganden inte är sant är en partisk uppskattning. I huvudsak skulle du felaktigt förhållandet du mäter.
Skickar ut en regression i Excel
Det första steget i att köra regressionsanalys i Excel är att dubbelkontrollera att det gratis Excel-plugin-dataanalysverktygspaket är installerat. Detta plugin gör det enkelt att beräkna en rad statistik. Det krävs inte att kartlägga en linjär regressionslinje, men det gör att statistiktabeller blir enklare. För att verifiera om det är installerat, välj "Data" från verktygsfältet. Om "Dataanalys" är ett alternativ är funktionen installerad och redo att användas. Om det inte är installerat kan du begära det här alternativet genom att klicka på Office-knappen och välja "Excel-alternativ".
Med hjälp av Data Analys ToolPak är det bara några klick att skapa en regressionsutgång.
Den oberoende variabeln går i X-intervallet.
Med tanke på S&P 500-avkastningen, säg att vi vill veta om vi kan uppskatta styrkan och förhållandet mellan Visa (V) -avkastningen. Visa (V) -beståndet returnerar data kolumn 1 som den beroende variabeln. S&P 500 returnerar datafolket kolumn 2 som den oberoende variabeln.
- Välj "Data" från verktygsfältet. Menyn "Data" visar. Välj "Dataanalys". Dialogrutan Dataanalys - analysverktyg visas. Från menyn väljer du "Regression" och klickar på "OK". I regressdialogrutan klickar du på rutan "Ange Y-intervall" och väljer beroende variabeldata (Visa (V)) returnerar). Klicka på rutan "Input X Range" och välj oberoende variabeldata (S&P 500 returnerar). Klicka på "OK" för att köra resultaten.
Tolk resultaten
Med hjälp av dessa data (samma från vår R-kvadratartikel) får vi följande tabell:
R2-värdet, även känt som bestämningskoefficienten, mäter variationen i den beroende variabeln som förklaras av den oberoende variabeln eller hur väl regressionsmodellen passar uppgifterna. R2-värdet sträcker sig från 0 till 1, och ett högre värde indikerar en bättre passning. P-värdet, eller sannolikhetsvärdet, sträcker sig också från 0 till 1 och indikerar om testet är signifikant. Till skillnad från R2-värdet är ett mindre p-värde gynnsamt eftersom det indikerar en korrelation mellan de beroende och oberoende variablerna.
Kartlägga en regression i Excel
Vi kan kartlägga en regression i Excel genom att markera data och kartlägga dem som en spridningsdiagram. För att lägga till en regressionsrad väljer du "Layout" på menyn "Diagramverktyg". I dialogrutan väljer du "Trendlinje" och sedan "Linjär trendlinje". För att lägga till R 2- värdet, välj "Fler trendlinjealternativ" från "Trendlinje-menyn. Slutligen väljer du" Visa R-kvadratvärde på diagrammet ". Det visuella resultatet summerar relationens styrka, om än på bekostnad av att inte ge lika mycket detalj som tabellen ovan.
