Vad är multikollinearitet?
Multikollinearitet är förekomsten av höga interkorrelationer bland oberoende variabler i en multipel regressionsmodell. Multikollinearitet kan leda till sneda eller vilseledande resultat när en forskare eller analytiker försöker bestämma hur väl varje oberoende variabel kan användas mest effektivt för att förutsäga eller förstå den beroende variabeln i en statistisk modell. I allmänhet kan multikollinearitet leda till större konfidensintervall och mindre pålitliga sannolikhetsvärden för de oberoende variablerna. Det vill säga att de statistiska slutsatserna från en modell med multikollinearitet kanske inte är tillförlitliga.
Förstå multikollinearitet
Statistiska analytiker använder flera regressionsmodeller för att förutsäga värdet på en specificerad beroende variabel baserat på värdena för två eller flera oberoende variabler. Den beroende variabeln benämns ibland resultatet, mål eller kriterium. Ett exempel är en multivariat regressionsmodell som försöker förvänta sig avkastning på aktier baserat på artiklar som pris / vinst-förhållanden, börsvärde, tidigare resultat eller andra data. Lageravkastningen är den beroende variabeln och de olika bitarna med finansiella data är de oberoende variablerna.
Key Takeaways
- Multikollinearitet är ett statistiskt koncept där oberoende variabler i en modell är korrelerade. Multikollinearitet bland oberoende variabler kommer att resultera i mindre pålitliga statistiska slutsatser. Det är bättre att använda oberoende variabler som inte är korrelerade eller upprepade när man bygger flera regressionsmodeller som använder två eller flera variabler.
Multikollinearitet i en multipel regressionsmodell indikerar att kollinära oberoende variabler är relaterade på något sätt, även om förhållandet kanske eller inte är avslappnat. Exempelvis kan tidigare resultat vara relaterade till börsvärde, eftersom aktier som har utvecklats bra tidigare har ökat marknadsvärden. Med andra ord kan multikollinearitet existera när två oberoende variabler är mycket korrelerade. Det kan också hända om en oberoende variabel beräknas från andra variabler i datauppsättningen eller om två oberoende variabler ger liknande och repetitiva resultat.
Ett av de vanligaste sätten att eliminera problemet med multikollinearitet är att först identifiera kollinära oberoende variabler och sedan ta bort alla utom en. Det är också möjligt att eliminera multikollinearitet genom att kombinera två eller flera kollinära variabler till en enda variabel. Statistisk analys kan sedan genomföras för att studera förhållandet mellan den specificerade beroende variabeln och endast en enda oberoende variabel.
Exempel på multikollinearitet
För investeringar är multikollinearitet ett vanligt övervägande när man utför teknisk analys för att förutsäga sannolika framtida kursrörelser för ett värdepapper, till exempel en aktie eller en råvaruframtid. Marknadsanalytiker vill undvika att använda tekniska indikatorer som är kollinära genom att de bygger på mycket likartade eller relaterade insatsvaror; de tenderar att avslöja liknande förutsägelser om den beroende variabeln av prisrörelse. I stället måste marknadsanalys baseras på markant olika oberoende variabler för att säkerställa att de analyserar marknaden ur olika oberoende analytiska synpunkter.
Noterad teknisk analytiker John Bollinger, skapare av Bollinger Bands-indikatorn, konstaterar att "en kardinalregel för framgångsrik användning av teknisk analys kräver att man undviker multikollinearitet mellan indikatorer."
För att lösa problemet undviker analytiker att använda två eller flera tekniska indikatorer av samma typ. Istället analyserar de en säkerhet med en typ av indikator, till exempel en momentindikator och gör sedan separat analys med hjälp av en annan typ av indikator, till exempel en trendindikator.
Ett exempel på ett potentiellt multikollinearitetsproblem är att utföra teknisk analys endast med hjälp av flera liknande indikatorer, såsom stokastik, relativ styrkaindex (RSI) och Williams% R, som alla är momentumindikatorer som förlitar sig på liknande input och sannolikt kommer att producera liknande resultat. I det här fallet är det bättre att ta bort alla utom en av indikatorerna eller hitta ett sätt att slå samman flera av dem till bara en indikator, samtidigt som du lägger till en trendindikator som troligen inte kommer att vara mycket korrelerad med momentumindikatorn.
