De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

Regressie-analyse Casus:

Verwante presentaties


Presentatie over: "Regressie-analyse Casus:"— Transcript van de presentatie:

1 Regressie-analyse Casus: ‘Alle hens aan dek!’ Beschadiging boorden en oevers van vaarwegen door binnenvaartschepen Probleem: Boorden en oevers raken steeds vaker beschadigd door vrachtschepen en pleziervaart Opdracht: Breng de oorzaken in kaart en geef beleidsadvies

2 Beschadiging meetbaar maken: indicator is golfslag gemeten aan oever of boord
Golfslag is een zogenaamde ratiovariabele: het kent een absoluut nulpunt (geen golfslag (=0 cm)) en de schaal kent gelijke afstanden (afstand tussen 10cm en 20cm is gelijk aan afstand tussen 40cm en 50cm) Keuze voor ratiovariabele is niet voor niets: men wil de oorzaken van de beschadiging achterhalen met regressie-analyse

3 Waarom regressie-analyse?
1. Is relatief eenvoudig! 2. Men kan de zelfstandige (oorzakelijke) invloed van een variabele meetbaar maken, rekening houdend met de invloed van andere variabelen 3. Verschillende ‘soorten’ variabelen kunnen worden ingevoerd als mogelijke oorzaken 4. Sterkte van invloed kan variëren 5. Is robuust: uitkomsten leveren niet snel onzin op als aan de mathematische assumpties niet voldaan wordt 6. Eenvoudig (zelf) uit te voeren

4 Wat vooraf gaat aan regressie-analyse:
Standaardprocedure voor het meten van de golfslag: objectief, herhaalbaar, controleerbaar Studie naar mogelijke oorzaken beschadiging : literatuur raadplegen, eventuele simulatie met schaalmodellen, deskundigen raadplegen Meetbaar maken van de oorzaken (operationaliseren) Dataverzameling: een aselecte steekproef van boten op willekeurig gekozen vaarwegen Wel relatief groot aantal zeker >50 maar liefst meer!

5 1. Waarom regressie-analyse: eenvoudig!
Enkelvoudige regressie-analyse: Gedaante: Y=a + bX Casus ‘Alle Hens aan dek!’: Golfslag (Y) = beginwaarde (a) + b * snelheid boot Beginwaarde (a): als boot stil ligt (dobbert) wat is dan de golfslag? (zal ongeveer 0 zijn) b = de richtingscoëfficiënt Wat gebeurt er met de golfslag als boot 1 km/u harder vaart (zal > 0 zijn) Aanname: de relatie tussen golfslag en snelheid is lineair: met elke snelheidstoename van 1 km/u zal de golfslag STEEDS met dezelfde factor (namelijk b) toenemen

6

7 Regressie lijn ‘Foute’ regressie lijn Relatie tussen golfslag (in meters) en snelheid (in kilometers per uur) Merk op dat er geen boten zijn met snelheid <4 km/u 20 kilometer meer snelheid  0,20 meter hogere golf  b=0,20/20= 0.01 : als snelheid met 1 km/u toeneemt, wordt golf 0.01 meter hoger (1 cm)

8 SPSS tabel regressie-analyse
a = .074 (7 cm golfslag als boot dobbert, echter geen waarneming daarvan voor dus niet te veel waarde aan hechten! b = .010 (1 cm hogere golf als 1 km/u meer snelheid) Beta= .62 (maximaal 1, geeft sterkte aan  hier dus sterk Sig: ‘beruchte’ significantie: hoe groot is kans dat relatie tussen golfslag en snelheid in Nederland niet bestaat?

9 Andere schaaleenheid voor golf: nu in centimeters Wat veranderd is b (was 0.01) Rest blijft hetzelfde!

10 2. Waarom regressie-analyse: de oorzakelijke invloed van een variabele rekening houdend met andere variabelen (‘het beruchte controleren voor’) Meervoudige regressie-analyse: Gedaante: Y=a + b1X1 + b2X2 + … bnXn Wat is controleren voor? Vaak te moeilijk gevonden, komt weinig in kranten terecht. Uitzondering: NRC, criminaliteit onder asielzoekers. Dat ligt inderdaad hoger dan onder Nederlanders. Komt dat door het feit dat ze geen Nederlander zijn? Nee, onder controle van opleiding en inkomen is er geen verschil!! Dat betekent dat een asielzoeker vermoedelijk net min crimineel is als een Nederlander als deze zelfde opleiding en inkomen heeft.

11 ‘Technisch’ gaat controleren voor als volgt:
Bereken het verschil in criminaliteit tussen asielzoekers en Nederlanders bij inkomen 0 en opleiding 0 en bereken ook verschil bij inkomen 1 en opleiding 1 …. Verschil bij inkomen x en opleiding x en bereken het gemiddelde van deze verschillen Casus alle ‘Hens aan dek!’’: Mogelijk beschadigen boten bestuurd door vrouwen minder de boorden van vaarwegen.

12 Beleidsadvies: laat boten besturen door vrouwen
Boten bestuurd door vrouwen veroorzaken gemiddeld 22,2 centimeter minder golfslag!! Beleidsadvies: laat boten besturen door vrouwen Probleem 1: lijkt niet haalbaar Probleem2: is zeker dat het ‘vrouw zijn’ de verklaring vormt? Alternatieve verklaring: ‘vrouwen varen langzamer dan mannen’ b voor vrouwen is en niet significant dus zeer wel mogelijk toeval

13 Bereken bij elke snelheid verschil tussen golfslag bestuurd door vrouwen en boten bestuurd door mannen en reken gemiddelde verschil uit. Is zo goed als nul  Beleidsadvies: probeer snelheid van boten bestuurd door mannen te matigen!

14 Cases ‘Alle Hens aan dek’: men weet niet welke factoren een rol spelen, men heeft slechts vaag vermoeden. Meervoudige STEPWISE regressie analyse: Laat regressieanalyse via een proces van factoren opnemen en weer weglaten zoeken naar een model met significante invloeden. Stel men heeft de volgende factoren: Geslacht afstand boot/oever Snelheid diepgang

15

16

17 Cases ‘Alle Hens aan dek’: men heeft gefundeerd vermoeden welke factoren een rol spelen
Meervoudige ENTER regressie analyse: Regressieanalyse neemt alle factoren in 1 keer op Stel men heeft de volgende factoren: vijf bladenschroef afstand boot/oever Snelheid diepgang

18

19 3. Waarom regressie-analyse: je kunt de invloed van nominale en ordinale variabelen bepalen
Nominale variabele: cijfers drukken slechts uit dat er andere categorie bedoeld wordt Voorbeeld: type boot: vrachtschip (1), plezierjacht (2), roeiboot (3), raceboot (4) Ordinale variabele: cijfers drukken uit dat categorieën in vaste volgorde staan Voorbeeld: stroming vaarwater: zeer sterke stroming (5), sterke stroming (4), matige stroming (3), zwakke stroming (2) en zeer strakke stroming (1)

20 Interpretatie: een raceboot maakt gemiddeld golven die 43,282 centimeter hoger zijn dan bij een roeiboot

21 Interpretatie: een raceboot maakt gemiddeld golven die 39,088 centimeter hoger zijn dan bij een roeiboot ongeacht de afstand tot de oever

22 Interpretatie: bij een sterke stroming zijn de golven die door boten (ongeacht type, ongeacht snelheid, ongeacht afstand) gemiddeld 2,812 centimeter hoger dan bij zeer zwakke stroming.

23 4. Waarom regressie-analyse: je kunt de invloed van factoren laten variëren
Stel dat het vermoeden bestaat dat het verwoestende effect van snelheid vooral sterk is als de boot dicht bij de oever vaart. Dit is iets ander dan veronderstellen dat een hogere snelheid en een korte afstand tot de oever hogere golven veroorzaakt. Veronderstellen dat de invloed van snelheid varieert al naar gelang de afstand tot de oever heet interactie in regressie-termen (interferentie in natuurkunde)

24 In de meeste simpele vorm bestaat interactie uit het schatten van twee modellen: het effect van snelheid midden in de vaarweg en het effect van snelheid dicht bij de kant Interpretatie: als men dicht bij de oever vaart, dan wordt de golf (gemeten aan oever) gemiddeld 1,963 centimeter hoger met 1 km/u meer Als men meer in het midden van de vaarweg vaart dan 0,618 centimeter per 1 km/u !!!

25 Beter is het om zogenaamde interactieterm te gebruiken
Beter is het om zogenaamde interactieterm te gebruiken. Deze geeft verschil aan in effect van snelheid in het midden en dichtbij de kant Interpretatie: als men dichtbij de oever vaart dan wordt de golf (gemeten aan oever) gemiddeld 1,963 centimeter hoger met 1 km/u meer Als men meer in het midden vaart dan 1,346 centimeter per 1 km/u minder!!!. Voordeel t.o.v. simpele vorm: toets of verschil op toeval berust

26 Nog beter is het om interactieterm te gebruiken met afstand tot oever niet in de klassen midden en dichtbij maar in centimeters. Interpretatie: als men zeer dicht bij de over vaart, wordt de golf (gemeten aan oever) gemiddeld 3,297 centimeter hoger met 1 km/u meer Dit effect neemt af met 0.05 centimeter met elke centimeter dat men meer naar het midden gaat. Bijvoorbeeld 200 cm meer naar het midden: 200 * = 1 centimeter minder hoge golf per 1 km/u (blijft nog over) . Dus 7 meter uit de kant en effect snelheid is weg!! (700 * 0.005)=3,5 centimeter minder.

27 5. Waarom regressie-analyse: techniek is robuust maar heeft assumpties
Deze worden lopen kans ernstig geschonden te worden als: waarnemingen niet onafhankelijk zijn Stel bijvoorbeeld dat er maar op drie plaatsen in Nederland boten zijn geobserveerd relaties niet lineair Stel bijvoorbeeld dat snelheid niet lineair oploopt met golfslag belangrijke factoren vergeten zijn Snelheid niet opgenomen in model aantal waarneming gering zijn (<100) Maar 50 boten en daar zitten een paar ‘vreemde’ observaties bij

28 Valt gelukkig in de praktijk vaak mee:
Voor clustering van waarnemingen is er oplossing (Multi-level analyse) Niet lineaire relaties kunnen ook in regressie-analyse gemodelleerd worden Als men belangrijke factor over het hoofd ziet, dan moet deze wel sterk samenhangen met de factoren waaraan men wel heeft gedacht Bij n>100 leveren enkele ‘vreemde’ observaties doorgaans geen problemen op

29 Casus: ‘Alle hens aan dek!’ Beschadiging boorden en oevers van vaarwegen door binnenvaartschepen Probleem: Boorden en oevers raken steeds vaker beschadigd door vrachtschepen en pleziervaart Opdracht: Breng de oorzaken in kaart en geef beleidsadvies

30 Rapport bevat: Paragraaf over probleemanalyse en de onderzoeksvragen
Paragraaf over de dataverzameling Paragraaf over de analyses (inclusief verantwoording assumpties) Paragraaf over resultaten & terugkoppeling naar vragen Analyses gaan over de oorzaken van beschadiging Hier met meervoudige regressieanalyse en wel toetsing van theoretisch model

31 Rapport bevat volgende tabel
Voorspellen van golfslag gemeten in centimeters b-coefficient significantie Snelheid (in km/u) Afstand tot oever (in centimeters) Snelheid * afstand oever Diepgang (in centimeters) Type boot: Roeiboot Vrachtschip Plezierboot raceboot Vrouw 3 -0.01 -0.005 0.05 Ref 2 1 0.00 0.001 0.56 0.007 0.23 0.34 0.45 0.98 Verklaarde variantie 89%

32 Rapport bevat volgende conclusies en beleidsadviezen:
De toenemende beschadiging komt zeer waarschijnlijk doordat: Boten te hard varen Boten te dicht op de oever varen Boten te veel diepgang hebben Type boot doet er niet toe Maakt niet uit of man of vrouw boot bestuurd Advies: Start campagne om snelheid te verminderen maar leg vooral de nadruk of de afstand tot de oever, immers de meeste winst valt te halen uit de afstand tot de oever. Als die namelijk groter wordt reduceert dat de golfslag zeer sterk. Als men de afstand tot de oever uit de campagne laat, dan moet je een erg sterke reductie van de snelheid proberen te bewerkstelligen wat waarschijnlijk niet mogelijk is.

33 Ter illustratie: stel de gemiddelde diepgang is 200 centimeter, de gemiddelde snelheid is 20 km/u en boot vaart op 200 centimeter afstand van oever. Regressie vergelijking= snelheid * 3 + diepgang * afstand oever * snelheid * afstand oever * (type boot en geslacht niet van belang) Golfslag (in centimeters) is dan 20 km/u * * * * 200 * = – 2 – 20 = 48 centimeter. Om reductie van 21 cm te krijgen bij zelfde snelheid is een afstand van 300 centimeter voldoende – 300 * – 20 * 300 * = 27. Wil men dezelfde reductie met snelheid en gelijkblijvende afstand tot oever dan : ? * * * ? * 200 * = 27  ? = 9,5 km/u!! (10,5km/u reductie)

34 Regressie-analyse (Einde)


Download ppt "Regressie-analyse Casus:"

Verwante presentaties


Ads door Google