Vad är ett två-tailed test?
I statistik är ett två-svansat test en metod där det kritiska området för en distribution är tvåsidig och testar om ett prov är större än eller mindre än ett visst värdeintervall. Det används i nollhypotestestning och -testning för statistisk betydelse. Om provet som testas faller inom något av de kritiska områdena, accepteras den alternativa hypotesen istället för nollhypotesen. Det två-svansade testet får sitt namn från att testa området under båda svansarna i en normalfördelning, även om testet kan användas i andra icke-normala distributioner.
Key Takeaways
- I statistik är ett två-svansat test en metod där det kritiska området för en distribution är tvåsidig och testar om ett prov är större än eller mindre än ett visst värden. Det används i nollhypotestestning och testning för statistisk signifikans. Om provet som testas faller inom något av de kritiska områdena, accepteras den alternativa hypotesen istället för nollhypotesen. Genom konventionen används två-svansade tester för att bestämma betydelse på 5% -nivån, vilket betyder varje sida av distributionen reduceras till 2, 5%.
Var noga med att notera om ett statistiskt test är en- eller tvåfärgat, eftersom det i hög grad kommer att påverka modellens tolkning.
Två-tailed test för betydelse. Investopedia
Så fungerar ett två-tailed test
Ett grundläggande begrepp för inferensstatistik är hypotestestningen, som körs för att avgöra om ett påstående är sant eller inte, med tanke på en populationsparameter. En testning som är programmerad för att visa om genomsnittet för ett prov är betydligt större än och betydligt mindre än medelvärdet för en population kallas ett två-tailed test.
Ett två-svansat test är utformat för att undersöka båda sidor av ett specifikt dataområde som anges av den involverade sannolikhetsfördelningen. Sannolikfördelningen bör representera sannolikheten för ett specifikt resultat baserat på förutbestämda standarder. Detta kräver inställning av en gräns som anger de högsta (eller övre) och lägsta (eller nedre) accepterade variabla värden som ingår i intervallet. Alla datapunkter som finns över den övre gränsen eller under den nedre gränsen betraktas utanför acceptområdet och i ett område som kallas avvisningsområdet.
Det finns ingen iboende standard vad gäller antalet datapunkter som måste finnas inom acceptområdet. I fall där precision krävs, såsom vid framställning av farmaceutiska läkemedel, kan en avvisningsgrad på 0, 001% eller mindre införas. I fall där precisionen är mindre kritisk, såsom antalet livsmedel i en produktpåse, kan en avvisningsgrad på 5% vara lämplig.
Ett exempel på ett två-tailed test
Som ett hypotetiskt exempel kan du föreställa dig att en ny börsmäklare (XYZ) hävdar att hans mäklaravgift är lägre än din nuvarande aktiemäklares (ABC). Uppgifter tillgängliga från ett oberoende forskningsföretag indikerar att medel- och standardavvikelsen för alla ABC-mäklarkunder är $ 18 respektive $ 6.
Ett prov på 100 kunder av ABC tas och mäklare avgifter beräknas med de nya kurserna för XYZ mäklare. Om urvalets medelvärde är $ 18, 75 och standardavvikelsen för provet är $ 6, kan någon slutsats göras om skillnaden i den genomsnittliga mäklaren mellan ABC och XYZ-mäklare?
- H 0: Null hypotes: medelvärde = 18H 1: Alternativ hypotes: medelvärde <> 18 (Detta är vad vi vill bevisa.) Avvisningsregion: Z <= - Z 2.5 och Z> = Z 2.5 (antagande av 5% signifikansnivå, dela 2, 5 vardera på vardera sidan).Z = (provmedelvärde - medelvärde) / (std-dev / sqrt (antal prover)) = (18, 75-18) / (6 / (sqrt (100)) = 1, 25
Detta beräknade Z-värde faller mellan de två gränserna definierade av: - Z 2, 5 = -1, 96 och Z 2, 5 = 1, 96.
Detta drar slutsatsen att det inte finns tillräckliga bevis för att dra slutsatsen att det finns någon skillnad mellan kurserna för din befintliga mäklare och den nya mäklaren. Alternativt leder p-värdet = P (Z <-1, 25) + P (Z> 1, 25) = 2 * 0, 1056 = 0, 2112 = 21, 12%, vilket är större än 0, 05 eller 5%, till samma slutsats.
Särskilda överväganden: Slumpmässig provtagning
Ett test med två halar kan också användas praktiskt under vissa produktionsaktiviteter i ett företag, till exempel med produktion och förpackning av godis på en viss anläggning. Om produktionsanläggningen utser 50 godis per påse som mål, med en acceptabel fördelning på 45 till 55 godis, anses varje påse som finns med ett belopp under 45 eller över 55 inom avvisningsområdet
För att bekräfta att förpackningsmekanismerna är korrekt kalibrerade för att möta den förväntade utgången, kan ett slumpmässigt prov tas för att bekräfta noggrannhet. För att förpackningsmekanismerna ska betraktas som korrekta önskas i genomsnitt 50 godis per påse med en lämplig distribution. Dessutom måste antalet påsar som faller inom avvisningsområdet falla inom gränsen för sannolikhetsfördelning som anses vara acceptabel som en felhastighet.
Om en oacceptabel avvisningsfrekvens upptäcks, eller ett genomsnitt avviker för långt från det önskade medelvärdet, kan justeringar av anläggningen eller tillhörande utrustning krävas för att korrigera felet. Regelbunden användning av testmetoder med två halar kan bidra till att produktionen håller sig inom gränserna på lång sikt.
Två-Tailed versus En-Tailed Test
När ett hypotestest upprättas för att visa att provmedlet skulle vara högre eller lägre än populationens medelvärde, kallas detta ett en-tailed test. Det en-svansade testet får sitt namn från att testa området under ett av svansen (sidorna) i en normalfördelning. När man använder ett enstansat test testar en analytiker möjligheten för förhållandet i en riktning av intresse och bortser helt från möjligheten till en relation i en annan riktning.
Om provet som testas faller inom det ensidiga kritiska området kommer den alternativa hypotesen att accepteras i stället för nollhypotesen. Ett test med en hala är också känt som en riktningshypotes eller riktningstest.
