Vad är en inflationsfaktor för varianter?
Variation inflation fVariance inflation factor (VIF) är ett mått på mängden multikollinearitet i en uppsättning av flera regressionsvariabler. Matematiskt är VIF för en regressionsmodellvariabel lika med förhållandet mellan den totala modellvariansen och variansen för en modell som endast inkluderar den enda oberoende variabeln. Detta förhållande beräknas för varje oberoende variabel. En hög VIF indikerar att den tillhörande oberoende variabeln är mycket kollinär med de andra variablerna i modellen.
Key Takeaways
- En variansinflationsfaktor (VIF) ger ett mått på multikollinearitet bland de oberoende variablerna i en multipel regressionsmodell. Detektering av multikollinearitet är viktigt eftersom det inte reducerar modellens förklarande kraft, men minskar den statistiska betydelsen av de oberoende variablerna. En stor VIF på en oberoende variabel indikerar ett mycket kollinärt förhållande till de andra variablerna som bör övervägas eller justeras för i strukturen för modellen och valet av oberoende variabler.
Förstå en inflationsfaktor för variation
En multipel regression används när en person vill testa effekten av flera variabler på ett visst resultat. Den beroende variabeln är det resultat som hanteras av de oberoende variablerna, som är ingångarna i modellen. Multikollinearitet existerar när det finns ett linjärt samband, eller korrelation, mellan en eller flera av de oberoende variablerna eller ingångarna. Multikollinearitet skapar ett problem i den multipla regressionen, eftersom eftersom ingångarna alla påverkar varandra, är de faktiskt inte oberoende, och det är svårt att testa hur mycket kombinationen av de oberoende variablerna påverkar den beroende variabeln eller resultatet i regressionsmodellen.. I statistiska termer kommer en multipel regressionsmodell där det finns hög multikollinearitet göra det svårare att uppskatta förhållandet mellan var och en av de oberoende variablerna och den beroende variabeln. Små förändringar i de data som används eller i strukturen i modellekvationen kan ge stora och oberäknade förändringar i de uppskattade koefficienterna för de oberoende variablerna.
För att se till att modellen är korrekt specificerad och fungerar korrekt finns det tester som kan köras med avseende på multikollinearitet. Variationsinflationsfaktor är ett sådant mätverktyg. Genom att använda variansinflationsfaktorer kan man identifiera svårighetsgraden hos eventuella multikollinearitetsproblem så att modellen kan justeras. Variationsinflationsfaktor mäter hur mycket beteende (varians) för en oberoende variabel påverkas eller uppblåsas av dess interaktion / korrelation med de andra oberoende variablerna. Variationsinflationsfaktorer tillåter ett snabbt mått på hur mycket en variabel bidrar till standardfelet i regressionen. När det finns betydande multikollinearitetsproblem kommer variationen i inflationsfaktorn att vara mycket stor för de berörda variablerna. Efter att dessa variabler har identifierats kan flera metoder användas för att eliminera eller kombinera kollinära variabler, lösa multikollinearitetsproblemet.
Medan multikollinearitet inte minskar en modells totala prediktiva kraft, kan den ge uppskattningar av regressionskoefficienterna som inte är statistiskt signifikanta. På ett sätt kan det betraktas som en slags dubbelräkning i modellen. När två eller flera oberoende variabler är nära besläktade eller mäter nästan samma sak, redovisas den underliggande effekten som de mäter två gånger (eller mer) över variablerna, och det blir svårt eller omöjligt att säga vilken variabel som verkligen påverkar oberoende variabel. Detta är ett problem eftersom målet med många ekonometriska modeller är att testa exakt denna typ av statistiska samband mellan de oberoende variablerna och den beroende variabeln.
Om till exempel en ekonom vill testa om det finns ett statistiskt signifikant samband mellan arbetslösheten (som en oberoende variabel) och inflationstakten (som den beroende variabeln). Inklusive ytterligare oberoende variabler som är relaterade till arbetslösheten, sådana nya inledande arbetslösa anspråk, skulle sannolikt införa multikollinearitet i modellen. Den övergripande modellen kan visa en stark, statistiskt tillräcklig förklaringskraft men kan inte identifiera om effekten främst beror på arbetslösheten eller de nya initiala arbetslösa anspråk. Detta är vad VIF skulle upptäcka, och det skulle föreslå eventuellt att en av variablerna släpps ur modellen eller hitta något sätt att konsolidera dem för att fånga deras gemensamma effekt, beroende på vilken specifik hypotes forskaren är intresserad av att testa.
