top of page

Lineær regressionsanalyse

 

Nedenfor er data for skatter i procent af BNP og Gini-koefficienten for OECD-lande. Vi vil lave en lineær regressionsanalyse for at teste følgende hypotese. Et højt skatteniveau fører til en større økonomisk omfordeling i et land og dermed en lavere Gini-koefficient.

Regressionsanalyse1.jpg

Skatteniveau er uafhængig variabel og Gini-koefficient er afhængig variabel. Dvs. Gini-koefficienten afhænger af skatteniveauet, under forventning om at et højt skatteniveau skaber mere økonomisk lighed.

 

 

Vi starter vores analyse med et punktdiagram over vores data. Vi markerer vores data. Begge søjler og kun tallene. Og vi vælger derefter indsæt og vælger XY-punktdiagram.

Regressionsanalyse2.jpg
Regressionsanalyse3.jpg

Herefter indsætter vi en tendenslinje i punktdiagrammet.

Regressionsanalyse4.jpg

Vi vælger flere indstillinger.

Regressionsanalyse5.jpg

Herefter vælger vi vis ligning i diagram og vis R-kvadreret værdi i diagram.

Regressionsanalyse6.jpg

Vi kan nu begynde at fortolke vores lineær regression.

 

 

Fortolkning af regressionen

Regressionsanalyse7.jpg

Ovenfor ses en lineær regressionsanalyse af Gini-koefficienten og skatteniveauet i en række OECD-lande (hvert punkt er et land – ikke alle lande har et navnemærke). Undersøgelsen ser på om der er en sammenhæng mellem skatteniveauet i et land og dets Gini-koefficient.

R-i-anden (R²)

 

R²-værdien er 0,494. Dette kan fortolkes som at 49,4% af Gini-koefficienten kan forklares vha. skatteniveauet. R²-værdien fortæller hvor godt regressionslinjen passer med punkterne. Hvis R² var 1 ville alle punkterne ligge på linjen.

 

 

Formel og hældning

 

Regressionslinjens formel er y=-0,0053x+0,5002. Her er det især hældningen der er interessant. Den kan fortolkes som at for hver 1 procentpoint forøgelse af skatteprocenten (x) vil Gini-koefficienten (y) falde med 0,0053 point. Fx vil en stigning i skatten fra 30 til 40 procent af BNP medføre et fald i Gini-koefficienten på 0,053.

 

 

Den grafiske analyse

 

Udover at se på R²-værdien er det væsentligt at se på fordelingen af punkterne. Især de yderliggende punkter har stor betydning for tendenslinjen og R²-værdien. Hvis blot Mexico og Tyrkiet fjernes vil det markant sænke R²-værdien og ændre tendenslinjen. Yderpunkter kan skabe en illusion om en sammenhæng, som muligvis ikke er til stede

bottom of page