Vierde bijeenkomst Kleinste kwadraten methode Lineaire regressie Twijfel en zekerheid Vierde bijeenkomst Kleinste kwadraten methode Lineaire regressie
Kleinste kwadraten methode (lineair verband)
Uit de twee verkregen vergelijkingen Bereken je v0 en a. - Uit de twee verkregen vergelijkingen Bereken je v0 en a.
Lineaire regressie Stel, je meet een variabele y als functie van een gekozen variabele x. Tussen deze twee variabelen is een lineair verband volgens y = ax + b, waarbij a en b constantes zijn. Je voert een aantal metingen uit, waarbij je een aantal waarden van y meet bij verschillende waarden van x:
De beste rechte lijn?
Van elk meetpunt wordt het kwadraat van de afwijking Ten opzichte van de lijn bepaald. De lijn, die het meest waarschijnlijke verband geeft, is de lijn waarbij de som van die kwadraten het kleinst is. In wezen is dit dus een bewerking van de kleinste kwadratenmethode.
Achtereenvolgens worden berekend: Voor de correlatiecoëfficiënt geldt weer: De richtingscoëfficiënt a en het snijpunt met de y-as b worden nu berekend met:
Het probleem van de postbode Veronderstel dat de tijd t die een postbode nodig heeft om zijn wijk te lopen afhangt van zijn voorbereidingstijd to , de tijd voor het bezorgen van een poststuk tb en de hoeveelheid post die hij moet bezorgen a. Neem aan dat to en tp bij benadering constant zijn. Er geldt dan natuurlijk t = tb a + to. De postbode meet gedurende vijf dagen de tijd die hij voor zijn wijk nodig heeft. De resultaten vind je in onderstaande tabel: Bepaal to en tb met behulp van lineaire regressie. aantal poststukken tijd (minuten) 678 378 752 401 593 358 832 480 712 390
Open Excel (Office 2007) Tik in cel A1 “aantal poststukken” en in cel B1 “tijd (minuten)”. Tik in de cellen A2 t/m A6 het aantal poststukken van elke meting: zorg voor een oplopende volgorde in aantal. Tik in de cellen B2 t/m B6 de verschillende tijden van de metingen. Selecteer de cellen B2 t/m B6 door te slepen. Ga naar het tabblad “Invoegen” , kies “Spreiding” en onder “Spreiding” de eerste mogelijkheid. Klik rechts op de ontstane grafiek en kies “Gegevens selecteren” en klik daar op “Bewerken”. Klik in het vak onder “Reeks X-waarden” en selecteer door slepen de cellen A2 t/m A6. Klik op OK en nogmaals op OK. Ga op een punt in de grafiek staan en klik rechts. Kies “Trendlijn toevoegen”. In het blad dat nu opent staat is “lineair”al actief. Vink onderaan de twee onderste opties (vergelijking, R2) aan en vul bij “voorspelling terug” 593 in.
Open Excel (Office 2003) Tik in cel A1 “aantal poststukken” en in cel B1 “tijd (minuten)”. Tik in de cellen A2 t/m A6 het aantal poststukken van elke meting: zorg voor een oplopende volgorde in aantal. Tik in de cellen B2 t/m B6 de verschillende tijden van de metingen. Selecteer de cellen B2 t/m B6 door te slepen. Ga naar het tabblad “Invoegen” , kies “grafiek”, kies “Spreiding” en onder “Spreiding” de eerste mogelijkheid. Klik rechts op de ontstane grafiek en kies “Gegevens selecteren” en klik daar op “Bewerken”. Klik in het vak onder “Reeks X-waarden” en selecteer door slepen de cellen A2 t/m A6. Klik op OK en nogmaals op OK. Ga op een punt in de grafiek staan en klik rechts. Kies “Trendlijn toevoegen”. In het blad dat nu opent, staat “lineair”al actief. Vink onderaan de twee onderste opties (vergelijking, R2) aan en vul bij “voorspelling terug” 593 in.
Het resultaat
Niet-lineaire regressie In wezen doe je dat in Excel op dezelfde manier als lineaire regressie. Je kiest eigenlijk alleen een andere functie bij het instellen van de trendlijn. In de volgende dia vind je een (chemisch) voorbeeld over de reactiesnelheid van de reactie van magnesium met zoutzuur:
zoutzuurconcentratie reactiesnelheid 0,1 0,00293 0,2 0,01106 0,5 0,07217 1,0 0,25710 2,0 0,82271 Het verschil is dat je een andere wiskundig verband moet kiezen bij “Trendlijn toevoegen”. Speel eens met De verschillende keuzes.
Opdrachten 18, 19 en 20