Voorspellende analyse

Slides:

Advertisements

Verwante presentaties

Beschrijvende en inferentiële statistiek

Advertisements

Statistische uitspraken over onbekende populatiegemiddelden

Vierde bijeenkomst Kleinste kwadraten methode Lineaire regressie

Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.

Toetsen van verschillen tussen twee of meer groepen

De omvang van een steekproef bepalen

Inleiding tot inferentie

10. Verkoopvoorspelling en Budgettering

Vergelijkbaarheid historische studies

Hoofdstuk 10 Onderzoeken met SPSS en MS Excel

Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van SPSS Guido Valkeneers.

Het vergelijken van twee populatiegemiddelden: Student’s t-toets

Help! Statistiek! Doorlopende serie laagdrempelige lezingen,

Statistiek Niveua 3 Kerntaak 5 Blz. 81.

Blogs Annette Ficker Tim Oosterwijk Opdrachtgever: Matthieu Jonckheere

vwo D Samenvatting Hoofdstuk 9

vwo C Samenvatting Hoofdstuk 13

vwo A Samenvatting Hoofdstuk 14

De grafiek van een lineair verband is ALTIJD een rechte lijn.

Gegevensverwerving en verwerking

Meervoudige lineaire regressie

Inferentie voor regressie

1212 /n Metingen aan de hoogte van een toren  D  wordt gemeten met onzekerheid S  =0.1 o. Vraag 1: Op welke afstand D moet je gaan staan om H zo nauwkeurig.

Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde.

H4 Marktonderzoek Verschillende informatiebehoeften in verschillende fasen: Analyse fase Strategische fase Implementatie fase Evaluatie fase.

Hoofdstuk 9 Verbanden, correlatie en regressie

Voorspellende analyse

Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.

Eenvoudige data-analyse: beschrijvende statistische

variabelen vaststellen

Voorspellende analyse

Eenvoudige data-analyse: beschrijvende statistische

Hoofdstuk 11 Kwantitatieve gegevens analyseren Methoden en technieken van onderzoek, 5e editie, Mark Saunders, Philip Lewis, Adrian Thornhill, Marije.

Populatiegemiddelden: recap

Statistiek voor Historici

Methodologie & Statistiek I Verband tussen twee variabelen 3.1.

havo A Samenvatting Hoofdstuk 3

H1 Experimenteel onderzoek

Workshop ISC – Overstromingen Bepalen van de hoogste waterlijn door een statistische benadering met omhullende curven Voorbeeld: het Loire-estuarium Thierry.

H2 Lineaire Verbanden.

Hoofdstuk 4 – Gegevens analyseren

De steekproefuitkomsten generaliseren naar de populatie

Partiële r² Predictie van y gebaseerd op z alleen

Hoofdstuk X Het correlatievraagstuk & SPSS toepassing

Cursus Regressie-analyse Rijkswaterstaat, 13 februari ASSUMPTIES (1)

Inleiding in de statistiek voor de gedragswetenschappen

Cursus Regressie-analyse Rijkswaterstaat, 13 februari Enkelvoudige regressie-analyse Transparanten beschikbaar gesteld door Dr. B. Pelzer.

Baarde en de goede Hoofdstuk 11: Data-analyse

Cursus Regressie-analyse Rijkswaterstaat, 13 februari

Gereedschapskist vlakke meetkunde

Hoorcollege 1: efficiëntie en complexiteitsontwikkeling.

Hoorcollege 1: efficiëntie en complexiteitsontwikkeling.

Nut en noodzaak van het ruismodel  NHV Tijdreeksanalyse discussiemiddag  Koen van der Hauw  1 oktober 2015 Enkele praktische ervaringen.

Wiskunde G3 Samenvatting H2: Parabolen

Het doel en de grondbeginselen van statistiek in klinische onderzoeken

Hoofdstuk 3 Lineaire formules en vergelijkingen

Wat zegt een steekproef?

Grafiek van lineaire formule

Afronden Hoe moet je statistisch afronden? nr gehalte (mg /100g) 1

Toegepast rekenen HEO Lijnen.

Hoofdstuk 16 De steekproefuitkomsten generaliseren naar de populatie en hypothesen over percentages en gemiddelden toetsen.

Keuzevoorlichting havo wiskunde AB.

Het voorspellen van agressie tijdens de behandeling van forensisch psychiatrische patiënten a.d.h.v. DE hcr-20.

Eenvoudige data-analyse: beschrijvende statistische

De grafiek van een lineair verband is ALTIJD een rechte lijn.

De omvang van een steekproef bepalen

Toetsen van verschillen tussen twee of meer groepen

Tellen met kaarten.

Hoofdstuk 10 Onderzoeken met SPSS en MS Excel

Voorspelling van criminele carrières door 2-dimensionale extrapolatie

Transcript van de presentatie:

Voorspellende analyse Hoofdstuk 19 Voorspellende analyse bij marktonderzoek

Voorspellen begrijpen Voorspelling: een uitspraak over wat er naar verwachting in de toekomst zal gebeuren op basis van ervaringen uit het verleden of voorafgaande observatie.

Voorspellen begrijpen Twee methoden Twee methoden van voorspellen Extrapolatie: bij extrapolatie gebruik je een ervaring uit het verleden als middel om de toekomst te voorspellen. Voorspellend model: in een voorspellend model zijn de omstandigheden opgenomen die naar verwachting een rol spelen en de factor of variabelen beïnvloeden die je wilt voorspellen.

Voorspellen begrijpen Bepalen hoe ‘goed’ je voorspelling is Ongeacht de voorspellingsmethode wil je altijd beoordelen hoe goed je voorspelling is, ofwel hoe goed je methode is in het doen van die voorspellingen. Als je vergelijkt hoe ver de voorspelde waarden afliggen van de feitelijke of waargenomen waarden, doe je een analyse van residuen.

Enkelvoudige regressieanalyse Een voorspellende analysetechniek waarbij één variabele wordt gebruikt om het niveau van een andere variabele te voorspellen met de formule voor de rechte lijn. Aan regressie ligt een rechtlijnig verband ten grondslag en het is een krachtig voorspellend model.

Enkelvoudige regressieanalyse

Enkelvoudige regressieanalyse Basisprocedures bij enkelvoudige regressieanalyse Onafhankelijke variabele: de variabele die wordt gebruikt om de afhankelijke variabele te voorspellen en deze heet x in de regressieformule. Afhankelijke variabele: de variabele die wordt voorspeld en deze heet gewoonlijk y in de regressievergelijking voor een rechte lijn. Het kleinstekwadratencriterium: een manier om te garanderen dat de rechte lijn die door de punten in het spreidingsdiagram loopt, zo is gepositioneerd dat de verticale afstanden van de verschillende punten tot de lijn zo klein mogelijk zijn.

Enkelvoudige regressieanalyse Basisprocedures bij enkelvoudige regressieanalyse Het is bij regressieanalyse niet voldoende om alleen de waarden voor a en b te berekenen, omdat de twee waarden nog moeten worden getoetst op statistische significantie. Het feit dat de lijn (slechts) de beste benadering is van de punten betekent dat we rekening moeten houden met een bepaalde hoeveelheid fouten als we de lijn voor onze voorspelling gebruiken. Standaardfout van de schatting: analoog aan de standaardfout van het gemiddelde die je hebt gebruikt om een populatiegemiddelde op basis van een steekproef te schatten.

Enkelvoudige regressieanalyse Basisprocedures bij enkelvoudige regressieanalyse Om voorspellingen te doen moet je betrouwbaarheidsintervallen rond de regressielijn berekenen.

Meervoudige regressieanalyse Meervoudige regressieanalyse is een uitbreiding van enkelvoudige regressieanalyse in zoverre dat er meer dan één onafhankelijke variabele wordt gebruikt in de regressievergelijking. Een onderliggend conceptueel model: in een algemeen conceptueel model zijn onafhankelijke en afhankelijke variabelen opgenomen waarbij wordt aangegeven hoe ze met elkaar in verband staan.

Meervoudige regressieanalyse

Meervoudige regressieanalyse Meervoudige regressieanalyse: een uitbreiding van enkelvoudige regressieanalyse in zoverre dat er meer dan één onafhankelijke variabele wordt gebruikt in de regressievergelijking.

Meervoudige regressieanalyse Basisvooronderstellingen bij meervoudige regressieanalyse: De regressielijn verandert in een regressie-vlak. De R-waarde, ook wel de determinatiecoëfficiënt genoemd, is een handige maat voor de sterkte van het hele lineaire verband. De vooronderstelling van onafhankelijkheid: betekent dat de onafhankelijke variabelen statistisch onafhankelijk van elkaar moeten zijn en dus niet mogen correleren. Variance inflation factor (VIF): is een getal en als vuistregel geldt dat zolang de VIF kleiner is dan 10 multicollineariteit geen probleem is.

Meervoudige regressieanalyse

Meervoudige regressieanalyse

Meervoudige regressieanalyse Speciale toepassingen van meervoudige regressieanalyse: Een ‘dummy’ als onafhankelijke variabele gebruiken Gestandaardiseerde bèta’s: gebruiken om het belang van de onafhankelijke variabelen te vergelijken Meervoudige regressieanalyse als screenings-instrument gebruiken

Stapsgewijze meervoudige regressie Als de onderzoeker meervoudige regressie als screeningsinstrument gebruikt of anderszins te maken heeft met een groot aantal onafhankelijke variabelen in het conceptuele model die met meervoudige regressie moeten worden getoetst, is het soms een taaie klus om het aantal onafhankelijke variabelen terug te brengen. Bij stapsgewijze meervoudige regressie wordt de (ene) onafhankelijke variabele die statistisch significant is en de meeste variantie in de afhankelijke variabele verklaart vastgesteld en in de meervoudige regressievergelijking ingevoerd. Vervolgens wordt de statistisch significante onafhankelijke variabele die het meest bijdraagt aan de verklaring van de overblijvende onverklaarde variantie in de afhankelijke variabele vastgesteld en in de vergelijking ingevoerd. Alle niet-significante onafhankelijken worden geëlimineerd.

Twee waarschuwingen omtrent regressieanalyse Regressieanalyse is niets meer dan een statistisch instrument waarbij een lineair verband wordt voorondersteld tussen twee variabelen. Je moet regressieanalyse niet toepassen om dingen te voorspellen die buiten de grenzen van de data liggen die je voor het regressiemodel hebt gebruikt.