Voorspellende analyse

Slides:

Advertisements

Verwante presentaties

Beschrijvende en inferentiële statistiek

Advertisements

Statistische uitspraken over onbekende populatiegemiddelden

Vierde bijeenkomst Kleinste kwadraten methode Lineaire regressie

Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.

Toetsen van verschillen tussen twee of meer groepen

De omvang van een steekproef bepalen

Inleiding tot inferentie

10. Verkoopvoorspelling en Budgettering

De wisselschakeling..

Vergelijkbaarheid historische studies

Hoofdstuk 10 Onderzoeken met SPSS en MS Excel

Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.

Het vergelijken van twee populatiegemiddelden: Student’s t-toets

Statistiek Niveua 3 Kerntaak 5 Blz. 81.

Blogs Annette Ficker Tim Oosterwijk Opdrachtgever: Matthieu Jonckheere

vwo D Samenvatting Hoofdstuk 9

vwo C Samenvatting Hoofdstuk 13

Opdracht 2. premisse: het Nederlandse over in contexten waarin het vertaald wordt door about is een instantiatie van de focus-of- attention sense incorrecte.

vwo A Samenvatting Hoofdstuk 14

De grafiek van een lineair verband is ALTIJD een rechte lijn.

Gegevensverwerving en verwerking

Meervoudige lineaire regressie

Inferentie voor regressie

Continue kansverdelingen

Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.

H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.

Hoofdstuk 9 Verbanden, correlatie en regressie

Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.

Eenvoudige data-analyse: beschrijvende statistische

variabelen vaststellen

Voorspellende analyse

Eenvoudige data-analyse: beschrijvende statistische

Hoofdstuk 11 Kwantitatieve gegevens analyseren Methoden en technieken van onderzoek, 5e editie, Mark Saunders, Philip Lewis, Adrian Thornhill, Marije.

Populatiegemiddelden: recap

Statistiek voor Historici

Methodologie & Statistiek I Verband tussen twee variabelen 3.1.

havo A Samenvatting Hoofdstuk 3

H1 Experimenteel onderzoek

Workshop ISC – Overstromingen Bepalen van de hoogste waterlijn door een statistische benadering met omhullende curven Voorbeeld: het Loire-estuarium Thierry.

H4 Differentiëren.

H2 Lineaire Verbanden.

Hoofdstuk 4 – Gegevens analyseren

ANW - inductie & deductie

Partiële r² Predictie van y gebaseerd op z alleen

Vergelijkingen oplossen

Cursus Regressie-analyse Rijkswaterstaat, 13 februari ASSUMPTIES (1)

Verbanden JTC’07.

Inleiding in de statistiek voor de gedragswetenschappen

Cursus Regressie-analyse Rijkswaterstaat, 13 februari Enkelvoudige regressie-analyse Transparanten beschikbaar gesteld door Dr. B. Pelzer.

Baarde en de goede Hoofdstuk 11: Data-analyse

Cursus Regressie-analyse Rijkswaterstaat, 13 februari

Gereedschapskist vlakke meetkunde

Plancyclus, les 4  Actualiteit  Vragen naar aanleiding van vorige les  Vragen over hoofdstuk 4 en 5  Observeren met een plan; het verschil tussen observeren.

Verschillende grafieken en formules

Wiskunde G3 Samenvatting H2: Parabolen

Grafische vergelijking meetmethoden

Het doel en de grondbeginselen van statistiek in klinische onderzoeken

Hoofdstuk 3 Lineaire formules en vergelijkingen

Wat zegt een steekproef?

Afronden Hoe moet je statistisch afronden? nr gehalte (mg /100g) 1

Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.

Het voorspellen van agressie tijdens de behandeling van forensisch psychiatrische patiënten a.d.h.v. DE hcr-20.

Eenvoudige data-analyse: beschrijvende statistische

De grafiek van een lineair verband is ALTIJD een rechte lijn.

De omvang van een steekproef bepalen

Toetsen van verschillen tussen twee of meer groepen

Voorspellende analyse

Hoofdstuk 10 Onderzoeken met SPSS en MS Excel

Voorspelling van criminele carrières door 2-dimensionale extrapolatie

Transcript van de presentatie:

Voorspellende analyse Hoofdstuk 19 Voorspellende analyse bij marktonderzoek

Voorspellen begrijpen Voorspelling: een uitspraak over wat er naar verwachting in de toekomst zal gebeuren op basis van ervaringen uit het verleden of voorafgaande observatie.

Voorspellen begrijpen Twee methoden Twee methoden van voorspellen Extrapolatie: bij extrapolatie gebruik je een ervaring uit het verleden als middel om de toekomst te voorspellen. Voorspellend model: in een voorspellend model zijn de omstandigheden opgenomen die naar verwachting een rol spelen en de factor of variabelen beïnvloeden die je wilt voorspellen.

Voorspellen begrijpen Bepalen hoe ‘goed’ je voorspelling is Ongeacht de voorspellingsmethode wil je altijd beoordelen hoe goed je voorspelling is, ofwel hoe goed je methode is in het doen van die voorspellingen. Als je vergelijkt hoe ver de voorspelde waarden afliggen van de feitelijke of waargenomen waarden, doe je een analyse van residuen.

Enkelvoudige regressieanalyse Een voorspellende analysetechniek waarbij één variabele wordt gebruikt om het niveau van een andere variabele te voorspellen met de formule voor de rechte lijn. Aan regressie ligt een rechtlijnig verband ten grondslag en het is een krachtig voorspellend model.

Enkelvoudige regressieanalyse

Enkelvoudige regressieanalyse Basisprocedures bij enkelvoudige regressieanalyse Onafhankelijke variabele: de variabele die wordt gebruikt om de afhankelijke variabele te voorspellen en deze heet x in de regressieformule. Afhankelijke variabele: de variabele die wordt voorspeld en deze heet gewoonlijk y in de regressievergelijking voor een rechte lijn. Het kleinstekwadratencriterium: een manier om te garanderen dat de rechte lijn die door de punten in het spreidingsdiagram loopt, zo is gepositioneerd dat de verticale afstanden van de verschillende punten tot de lijn zo klein mogelijk zijn.

Enkelvoudige regressieanalyse Basisprocedures bij enkelvoudige regressieanalyse Het is bij regressieanalyse niet voldoende om alleen de waarden voor a en b te berekenen, omdat de twee waarden nog moeten worden getoetst op statistische significantie. Het feit dat de lijn (slechts) de beste benadering is van de punten betekent dat we rekening moeten houden met een bepaalde hoeveelheid fouten als we de lijn voor onze voorspelling gebruiken. Standaardfout van de schatting: analoog aan de standaardfout van het gemiddelde die je hebt gebruikt om een populatiegemiddelde op basis van een steekproef te schatten.

Enkelvoudige regressieanalyse Basisprocedures bij enkelvoudige regressieanalyse Om voorspellingen te doen moet je betrouwbaarheidsintervallen rond de regressielijn berekenen.

Meervoudige regressieanalyse Meervoudige regressieanalyse is een uitbreiding van enkelvoudige regressieanalyse in zoverre dat er meer dan één onafhankelijke variabele wordt gebruikt in de regressievergelijking. Een onderliggend conceptueel model: in een algemeen conceptueel model zijn onafhankelijke en afhankelijke variabelen opgenomen waarbij wordt aangegeven hoe ze met elkaar in verband staan.

Meervoudige regressieanalyse

Meervoudige regressieanalyse Meervoudige regressieanalyse: een uitbreiding van enkelvoudige regressieanalyse in zoverre dat er meer dan één onafhankelijke variabele wordt gebruikt in de regressievergelijking.

Meervoudige regressieanalyse Basisvooronderstellingen bij meervoudige regressieanalyse: De regressielijn verandert in een regressie-vlak. De R-waarde, ook wel de determinatiecoëfficiënt genoemd, is een handige maat voor de sterkte van het hele lineaire verband. De vooronderstelling van onafhankelijkheid: betekent dat de onafhankelijke variabelen statistisch onafhankelijk van elkaar moeten zijn en dus niet mogen correleren. Variance inflation factor (VIF): is een getal en als vuistregel geldt dat zolang de VIF kleiner is dan 10 multicollineariteit geen probleem is.

Meervoudige regressieanalyse

Meervoudige regressieanalyse

Meervoudige regressieanalyse Speciale toepassingen van meervoudige regressieanalyse: Een ‘dummy’ als onafhankelijke variabele gebruiken Gestandaardiseerde bèta’s: gebruiken om het belang van de onafhankelijke variabelen te vergelijken Meervoudige regressieanalyse als screenings-instrument gebruiken

Stapsgewijze meervoudige regressie Als de onderzoeker meervoudige regressie als screeningsinstrument gebruikt of anderszins te maken heeft met een groot aantal onafhankelijke variabelen in het conceptuele model die met meervoudige regressie moeten worden getoetst, is het soms een taaie klus om het aantal onafhankelijke variabelen terug te brengen. Bij stapsgewijze meervoudige regressie wordt de (ene) onafhankelijke variabele die statistisch significant is en de meeste variantie in de afhankelijke variabele verklaart vastgesteld en in de meervoudige regressievergelijking ingevoerd. Vervolgens wordt de statistisch significante onafhankelijke variabele die het meest bijdraagt aan de verklaring van de overblijvende onverklaarde variantie in de afhankelijke variabele vastgesteld en in de vergelijking ingevoerd. Alle niet-significante onafhankelijken worden geëlimineerd.

Twee waarschuwingen omtrent regressieanalyse Regressieanalyse is niets meer dan een statistisch instrument waarbij een lineair verband wordt voorondersteld tussen twee variabelen. Je moet regressieanalyse niet toepassen om dingen te voorspellen die buiten de grenzen van de data liggen die je voor het regressiemodel hebt gebruikt.