Lineær regressionsanalyse
Nedenfor er data for skatter i procent af BNP og
Gini-koefficienten for OECD-lande. Vi vil lave en lineær regressionsanalyse for
at teste følgende hypotese. Et højt skatteniveau fører til en større
økonomisk omfordeling i et land og dermed en lavere Gini-koefficient.
Skatteniveau
er uafhængig variabel og Gini-koefficient er afhængig variabel. Dvs.
Gini-koefficienten afhænger af skatteniveauet, under forventning om at et højt
skatteniveau skaber mere økonomisk lighed.
Vi starter
vores analyse med et punktdiagram over vores data. Vi markerer vores data.
Begge søjler og kun tallene. Og vi vælger derefter indsæt og vælger
XY-punktdiagram.
Herefter
indsætter vi en tendenslinje i punktdiagrammet.
Vi vælger
flere indstillinger.
Herefter
vælger vi vis ligning i diagram og vis R-kvadreret værdi i diagram.
Vi kan nu begynde at fortolke
vores lineær regression.
Fortolkning af regressionen
Ovenfor ses en lineær
regressionsanalyse af Gini-koefficienten og skatteniveauet i en række
OECD-lande (hvert punkt er et land – ikke alle lande har et navnemærke).
Undersøgelsen ser på om der er en sammenhæng mellem skatteniveauet i et land og
dets Gini-koefficient.
R-i-anden (R²)
R²-værdien er 0,494. Dette kan
fortolkes som at 49,4% af Gini-koefficienten kan forklares vha. skatteniveauet.
R²-værdien fortæller hvor godt regressionslinjen passer med punkterne. Hvis R²
var 1 ville alle punkterne ligge på linjen.
Formel og hældning
Regressionslinjens formel er
y=-0,0053x+0,5002. Her er det især hældningen der er interessant. Den kan fortolkes
som at for hver 1 procentpoint forøgelse af skatteprocenten (x) vil
Gini-koefficienten (y) falde med 0,0053 point. Fx vil en stigning i skatten fra
30 til 40 procent af BNP medføre et fald i Gini-koefficienten på 0,053.
Den grafiske analyse
Udover at se på R²-værdien er det
væsentligt at se på fordelingen af punkterne. Især de yderliggende
punkter har stor betydning for tendenslinjen og R²-værdien. Hvis blot Mexico og
Tyrkiet fjernes vil det markant sænke R²-værdien og ændre tendenslinjen. Yderpunkter
kan skabe en illusion om en sammenhæng, som muligvis ikke er til stede