Regressie-analyse Casus:

Slides:



Advertisements
Verwante presentaties
Statistische uitspraken over onbekende populatiegemiddelden
Advertisements

Hoe snel is geluid? Aan het einde van de les moet je in staat zijn om:
Kan je de betekenis van de afkortingen in s = v x t benoemen
Themaweek Water Sectie Techniek.
Snelheid Hoe kan ik rekenen.
Het verschil tussen momentane en gemiddelde snelheid.
Fasen van onderzoek Onderzoeksplan bureauwerk Dataverzameling
Snelheid Hoe kan ik rekenen.
Snelheid.
Rekenen met snelheid Een probleem oplossen
Deel 1 Het gevolg van krachten
Componenten van een algoritme Variabelen en hun Inhoud Instructies Sekwenties (van instructies) Selecties (tussen instructies) Herhalingen (van instructies)
Snelheid.
Niet-rechtlijnige beweging Vr.1
Differentiëren en integreren
vwo B Samenvatting Hoofdstuk 1
De grafiek van een lineair verband is ALTIJD een rechte lijn.
Inferentie voor regressie
1212 /n Metingen aan de hoogte van een toren  D  wordt gemeten met onzekerheid S  =0.1 o. Vraag 1: Op welke afstand D moet je gaan staan om H zo nauwkeurig.
Krachten en hun effecten
3.4 Reken met constante snelheid
Bewegen Hoofdstuk 3 Beweging Ing. J. van de Worp.
Voorspellende analyse
Hoofdstuk 1 Basisvaardigheden.
Methodologie & Statistiek I Verband tussen twee variabelen 3.1.
De schaal Hoe bereken je die?.
Beweging - Inhoud Inleiding Plaats en tijd Eenparige beweging
Opdracht 1 37 o a) 1,00 cm = 5,0 N ^ c) De lengte van F span is 5,25 cm 1,00 cm = 5 N ^ 5,25 cm = 26,5 N ^ d) De lengte van F voorwerp is 6,49 cm 1,00.
Waarom heb ik hiervoor gekozen? Ik heb op de Rotterdamse haven gevaren en ik wou er zelf ook meer over weten.
Rekenen 10 januari.
Programma collegeweek 6
REKENLAND Schoolkamp op Texel.
Stopafstand = reactieafstand + remweg
Klas 2 m en herhaling voor klas 3 m
Ons zonnestelsel op schaal
Pascal, Lars en Gaby. WAT, WANNEER EN HOE? Eerste dag van de themaweek Verschillende opgaven Gemaakt door Lars.
Schaalberekeningen Hoofdstuk 1 Australië.
Cursus Regressie-analyse Rijkswaterstaat, 13 februari ASSUMPTIES (1)
Rekenen 17 januari.
Tijd, afstand, snelheid.
Cursus Regressie-analyse Rijkswaterstaat, 13 februari Enkelvoudige regressie-analyse Transparanten beschikbaar gesteld door Dr. B. Pelzer.
Handelingsplannen.
P&O Bedrijfsbeleid: Het patrouilleringsplan voor Kortrijk Raes Thomas Smets Jasper Van Roost Joris De Roose Eline.
soorten beweging groot- en eenheden de formule soorten diagrammen .
6 stappen in Risico management
Gecijferdheid 2 (Meten 1 – ME144X) week 3 Powerpoints staan op med.hro.nl/houmj/Klas_1BCEHI_Inductief/
onderzoeksvraag Soorten onderzoeksvragen Exploratieve onderzoeksvraag
Rotterdam, 00 januari 2007 Kijken naar kinderen Bijeenkomst 3 kwartaal 3.
FOKKE en SUKKE helpen bij het veldwerk. Gebruik van een statistisch pakket SPSS Opslaan en bewerken data –selecteren –wegen –hercoderen –Ontwerpen van.
Onderzoeksplan en onderzoeksmodel Een kort resumé vorige colleges
Vandaag: Restant les 3 Verhoudingen
Herhalen schaal Schaal is een verhouding.
Thema 1 Wie ben ik?.
SCHAAL in toepassingssituaties
Rekenen.
Metend rekenen 5de leerjaar.
TECHNISCHE FICHE : De schaal berekenen.
Kinematica (bewegingsleer)
Rekenen Verbanden les 3: Rekenen met tabellen 1 Verbanden les 5: Rekenen met grafieken, diagrammen en tabellen.
Hoofdstuk 31 Verbanden - basis. Hoofdstuk 31 Verbanden - basis.
Hoe snel is geluid? Aan het einde van de les moet je in staat zijn om:
Sociale problematiek/crisisinterventies
SCHAAL in toepassingssituaties
soorten beweging groot- en eenheden de formule soorten diagrammen .
Werken met kaarten.
Voorspellende analyse
En oppervlakte van ruimtefiguren
Hoofdstuk 12 schaal. Hoofdstuk 12 schaal Paragraaf 12.1 Schaalverdeling.
Transcript van de presentatie:

Regressie-analyse Casus: ‘Alle hens aan dek!’ Beschadiging boorden en oevers van vaarwegen door binnenvaartschepen Probleem: Boorden en oevers raken steeds vaker beschadigd door vrachtschepen en pleziervaart Opdracht: Breng de oorzaken in kaart en geef beleidsadvies

Beschadiging meetbaar maken: indicator is golfslag gemeten aan oever of boord Golfslag is een zogenaamde ratiovariabele: het kent een absoluut nulpunt (geen golfslag (=0 cm)) en de schaal kent gelijke afstanden (afstand tussen 10cm en 20cm is gelijk aan afstand tussen 40cm en 50cm) Keuze voor ratiovariabele is niet voor niets: men wil de oorzaken van de beschadiging achterhalen met regressie-analyse

Waarom regressie-analyse? 1. Is relatief eenvoudig! 2. Men kan de zelfstandige (oorzakelijke) invloed van een variabele meetbaar maken, rekening houdend met de invloed van andere variabelen 3. Verschillende ‘soorten’ variabelen kunnen worden ingevoerd als mogelijke oorzaken 4. Sterkte van invloed kan variëren 5. Is robuust: uitkomsten leveren niet snel onzin op als aan de mathematische assumpties niet voldaan wordt 6. Eenvoudig (zelf) uit te voeren

Wat vooraf gaat aan regressie-analyse: Standaardprocedure voor het meten van de golfslag: objectief, herhaalbaar, controleerbaar Studie naar mogelijke oorzaken beschadiging : literatuur raadplegen, eventuele simulatie met schaalmodellen, deskundigen raadplegen Meetbaar maken van de oorzaken (operationaliseren) Dataverzameling: een aselecte steekproef van boten op willekeurig gekozen vaarwegen Wel relatief groot aantal zeker >50 maar liefst meer!

1. Waarom regressie-analyse: eenvoudig! Enkelvoudige regressie-analyse: Gedaante: Y=a + bX Casus ‘Alle Hens aan dek!’: Golfslag (Y) = beginwaarde (a) + b * snelheid boot Beginwaarde (a): als boot stil ligt (dobbert) wat is dan de golfslag? (zal ongeveer 0 zijn) b = de richtingscoëfficiënt Wat gebeurt er met de golfslag als boot 1 km/u harder vaart (zal > 0 zijn) Aanname: de relatie tussen golfslag en snelheid is lineair: met elke snelheidstoename van 1 km/u zal de golfslag STEEDS met dezelfde factor (namelijk b) toenemen

Regressie lijn ‘Foute’ regressie lijn Relatie tussen golfslag (in meters) en snelheid (in kilometers per uur) Merk op dat er geen boten zijn met snelheid <4 km/u 20 kilometer meer snelheid  0,20 meter hogere golf  b=0,20/20= 0.01 : als snelheid met 1 km/u toeneemt, wordt golf 0.01 meter hoger (1 cm)

SPSS tabel regressie-analyse a = .074 (7 cm golfslag als boot dobbert, echter geen waarneming daarvan voor dus niet te veel waarde aan hechten! b = .010 (1 cm hogere golf als 1 km/u meer snelheid) Beta= .62 (maximaal 1, geeft sterkte aan  hier dus sterk Sig: ‘beruchte’ significantie: hoe groot is kans dat relatie tussen golfslag en snelheid in Nederland niet bestaat?

Andere schaaleenheid voor golf: nu in centimeters Wat veranderd is b (was 0.01) Rest blijft hetzelfde!

2. Waarom regressie-analyse: de oorzakelijke invloed van een variabele rekening houdend met andere variabelen (‘het beruchte controleren voor’) Meervoudige regressie-analyse: Gedaante: Y=a + b1X1 + b2X2 + … bnXn Wat is controleren voor? Vaak te moeilijk gevonden, komt weinig in kranten terecht. Uitzondering: NRC, criminaliteit onder asielzoekers. Dat ligt inderdaad hoger dan onder Nederlanders. Komt dat door het feit dat ze geen Nederlander zijn? Nee, onder controle van opleiding en inkomen is er geen verschil!! Dat betekent dat een asielzoeker vermoedelijk net min crimineel is als een Nederlander als deze zelfde opleiding en inkomen heeft.

‘Technisch’ gaat controleren voor als volgt: Bereken het verschil in criminaliteit tussen asielzoekers en Nederlanders bij inkomen 0 en opleiding 0 en bereken ook verschil bij inkomen 1 en opleiding 1 …. Verschil bij inkomen x en opleiding x en bereken het gemiddelde van deze verschillen Casus alle ‘Hens aan dek!’’: Mogelijk beschadigen boten bestuurd door vrouwen minder de boorden van vaarwegen.

Beleidsadvies: laat boten besturen door vrouwen Boten bestuurd door vrouwen veroorzaken gemiddeld 22,2 centimeter minder golfslag!! Beleidsadvies: laat boten besturen door vrouwen Probleem 1: lijkt niet haalbaar Probleem2: is zeker dat het ‘vrouw zijn’ de verklaring vormt? Alternatieve verklaring: ‘vrouwen varen langzamer dan mannen’ b voor vrouwen is 2.463 en niet significant dus zeer wel mogelijk toeval

Bereken bij elke snelheid verschil tussen golfslag bestuurd door vrouwen en boten bestuurd door mannen en reken gemiddelde verschil uit. Is zo goed als nul  Beleidsadvies: probeer snelheid van boten bestuurd door mannen te matigen!

Cases ‘Alle Hens aan dek’: men weet niet welke factoren een rol spelen, men heeft slechts vaag vermoeden. Meervoudige STEPWISE regressie analyse: Laat regressieanalyse via een proces van factoren opnemen en weer weglaten zoeken naar een model met significante invloeden. Stel men heeft de volgende factoren: Geslacht afstand boot/oever Snelheid diepgang

Cases ‘Alle Hens aan dek’: men heeft gefundeerd vermoeden welke factoren een rol spelen Meervoudige ENTER regressie analyse: Regressieanalyse neemt alle factoren in 1 keer op Stel men heeft de volgende factoren: vijf bladenschroef afstand boot/oever Snelheid diepgang

3. Waarom regressie-analyse: je kunt de invloed van nominale en ordinale variabelen bepalen Nominale variabele: cijfers drukken slechts uit dat er andere categorie bedoeld wordt Voorbeeld: type boot: vrachtschip (1), plezierjacht (2), roeiboot (3), raceboot (4) Ordinale variabele: cijfers drukken uit dat categorieën in vaste volgorde staan Voorbeeld: stroming vaarwater: zeer sterke stroming (5), sterke stroming (4), matige stroming (3), zwakke stroming (2) en zeer strakke stroming (1)

Interpretatie: een raceboot maakt gemiddeld golven die 43,282 centimeter hoger zijn dan bij een roeiboot

Interpretatie: een raceboot maakt gemiddeld golven die 39,088 centimeter hoger zijn dan bij een roeiboot ongeacht de afstand tot de oever

Interpretatie: bij een sterke stroming zijn de golven die door boten (ongeacht type, ongeacht snelheid, ongeacht afstand) gemiddeld 2,812 centimeter hoger dan bij zeer zwakke stroming.

4. Waarom regressie-analyse: je kunt de invloed van factoren laten variëren Stel dat het vermoeden bestaat dat het verwoestende effect van snelheid vooral sterk is als de boot dicht bij de oever vaart. Dit is iets ander dan veronderstellen dat een hogere snelheid en een korte afstand tot de oever hogere golven veroorzaakt. Veronderstellen dat de invloed van snelheid varieert al naar gelang de afstand tot de oever heet interactie in regressie-termen (interferentie in natuurkunde)

In de meeste simpele vorm bestaat interactie uit het schatten van twee modellen: het effect van snelheid midden in de vaarweg en het effect van snelheid dicht bij de kant Interpretatie: als men dicht bij de oever vaart, dan wordt de golf (gemeten aan oever) gemiddeld 1,963 centimeter hoger met 1 km/u meer Als men meer in het midden van de vaarweg vaart dan 0,618 centimeter per 1 km/u !!!

Beter is het om zogenaamde interactieterm te gebruiken Beter is het om zogenaamde interactieterm te gebruiken. Deze geeft verschil aan in effect van snelheid in het midden en dichtbij de kant Interpretatie: als men dichtbij de oever vaart dan wordt de golf (gemeten aan oever) gemiddeld 1,963 centimeter hoger met 1 km/u meer Als men meer in het midden vaart dan 1,346 centimeter per 1 km/u minder!!!. Voordeel t.o.v. simpele vorm: toets of verschil op toeval berust

Nog beter is het om interactieterm te gebruiken met afstand tot oever niet in de klassen midden en dichtbij maar in centimeters. Interpretatie: als men zeer dicht bij de over vaart, wordt de golf (gemeten aan oever) gemiddeld 3,297 centimeter hoger met 1 km/u meer Dit effect neemt af met 0.05 centimeter met elke centimeter dat men meer naar het midden gaat. Bijvoorbeeld 200 cm meer naar het midden: 200 * -0.005= 1 centimeter minder hoge golf per 1 km/u (blijft nog 2.297 over) . Dus 7 meter uit de kant en effect snelheid is weg!! (700 * 0.005)=3,5 centimeter minder.

5. Waarom regressie-analyse: techniek is robuust maar heeft assumpties Deze worden lopen kans ernstig geschonden te worden als: waarnemingen niet onafhankelijk zijn Stel bijvoorbeeld dat er maar op drie plaatsen in Nederland boten zijn geobserveerd relaties niet lineair Stel bijvoorbeeld dat snelheid niet lineair oploopt met golfslag belangrijke factoren vergeten zijn Snelheid niet opgenomen in model aantal waarneming gering zijn (<100) Maar 50 boten en daar zitten een paar ‘vreemde’ observaties bij

Valt gelukkig in de praktijk vaak mee: Voor clustering van waarnemingen is er oplossing (Multi-level analyse) Niet lineaire relaties kunnen ook in regressie-analyse gemodelleerd worden Als men belangrijke factor over het hoofd ziet, dan moet deze wel sterk samenhangen met de factoren waaraan men wel heeft gedacht Bij n>100 leveren enkele ‘vreemde’ observaties doorgaans geen problemen op

Casus: ‘Alle hens aan dek!’ Beschadiging boorden en oevers van vaarwegen door binnenvaartschepen Probleem: Boorden en oevers raken steeds vaker beschadigd door vrachtschepen en pleziervaart Opdracht: Breng de oorzaken in kaart en geef beleidsadvies

Rapport bevat: Paragraaf over probleemanalyse en de onderzoeksvragen Paragraaf over de dataverzameling Paragraaf over de analyses (inclusief verantwoording assumpties) Paragraaf over resultaten & terugkoppeling naar vragen Analyses gaan over de oorzaken van beschadiging Hier met meervoudige regressieanalyse en wel toetsing van theoretisch model

Rapport bevat volgende tabel Voorspellen van golfslag gemeten in centimeters b-coefficient significantie Snelheid (in km/u) Afstand tot oever (in centimeters) Snelheid * afstand oever Diepgang (in centimeters) Type boot: Roeiboot Vrachtschip Plezierboot raceboot Vrouw 3 -0.01 -0.005 0.05 Ref 2 1 0.00 0.001 0.56 0.007 0.23 0.34 0.45 0.98 Verklaarde variantie 89%

Rapport bevat volgende conclusies en beleidsadviezen: De toenemende beschadiging komt zeer waarschijnlijk doordat: Boten te hard varen Boten te dicht op de oever varen Boten te veel diepgang hebben Type boot doet er niet toe Maakt niet uit of man of vrouw boot bestuurd Advies: Start campagne om snelheid te verminderen maar leg vooral de nadruk of de afstand tot de oever, immers de meeste winst valt te halen uit de afstand tot de oever. Als die namelijk groter wordt reduceert dat de golfslag zeer sterk. Als men de afstand tot de oever uit de campagne laat, dan moet je een erg sterke reductie van de snelheid proberen te bewerkstelligen wat waarschijnlijk niet mogelijk is.

Ter illustratie: stel de gemiddelde diepgang is 200 centimeter, de gemiddelde snelheid is 20 km/u en boot vaart op 200 centimeter afstand van oever. Regressie vergelijking= snelheid * 3 + diepgang * 0.05 + afstand oever * -0.01 + snelheid * afstand oever * -0.005. (type boot en geslacht niet van belang) Golfslag (in centimeters) is dan 20 km/u * 3 + 200 * 0.05 + 200 * -0.01 + 20 * 200 * -0.005 = 60 + 10 – 2 – 20 = 48 centimeter. Om reductie van 21 cm te krijgen bij zelfde snelheid is een afstand van 300 centimeter voldoende. 60 + 10 – 300 * -0.01 – 20 * 300 * -0.005 = 27. Wil men dezelfde reductie met snelheid en gelijkblijvende afstand tot oever dan : ? * 3 + 200 * 0.05 + 200 * -0.01 + ? * 200 * -0.005 = 27  ? = 9,5 km/u!! (10,5km/u reductie)

Regressie-analyse (Einde)