Computervaardigheden Computervaardigheden en Programmatie Universiteit Antwerpen Computervaardigheden Hoofdstuk 2 — Statistiek en Grafieken Statistiek en Grafieken
Computervaardigheden en Programmatie Universiteit Antwerpen Inhoud Statististiek Sorteren en tellen COUNTIF, COUNTA, IF Controles en Robuustheid Gemiddelde, afwijking, mediaan en kwartielen AVERAGE, STDDEV, MEDIAN, MIN, MAX, QUARTILE Frequentiedistributie FREQUENCY ( array formule !! ) Grafieken Histogram en Box-plot Basisvaardigheden Maak Zip-file Statistiek en Grafieken
Survival guide Essentieel Belangrijk Nuttig Groeperen en comprimeren (Zip) van een verschillende bestanden Definities van functies opzoeken via de HELP functie Geneste functie-oproepen (meerdere functies binnen 1 cel) Variërende celinhoud afhankelijk van een conditie (a.h.v. IF) Sorteren Tellen a.h.v. een enkelvoudig criterium (COUNTIF, COUNTA) Gemiddelde en standaardafwijking van een reeks getallen Histogram aanmaken (meerdere datareeksen) Datareeks voor functie opstellen en visualiseren Belangrijk Interne controles in een rekenblad inbouwen Min, max, mediaan, 1ste en 3de kwartiel van een reeks getallen Box-plot aanmaken Nuttig Tellen a.h.v. een meervoudig criterium (IF, COUNTIF) ARRAY formules, o.a. om frequentiedistributie te bepalen
Sorteren A B C D 1 datum soort spanwijdte gewicht 2 11/nov/92 baardvleermuis 19 4 3 15/nov/95 baardvleermuis 19 4 … 6 4/nov/00 grootoorvleermuis 20 4 … … … … Importeer "observaties1.txt" (via web-site) Bewaar als "vleermuis.xls" Sorteer achtereenvolgens op datum - soort / soort - datum / ... Selecteer alle data + Menu: Data/Sort… Kies gewenste kolommen + My Data Range Has … Header Row Los op door slim te sorteren: Hoeveel observaties zijn er ? Hoeveel soorten zijn er ? In welke jaren zijn er observaties ?
Tellen (Enkelvoudig Criterium) Maak een nieuw blad: "Tellingen" Maak een kolom "soort": vul de vier soortnamen in Maak een kolom "aantal" gebruik functie "COUNTIF" om te tellen zoek op via "Help" A B C D 1 soort aantal 2 baardvleermuis 27 3 franjestaart 13 4 grootoorvleermuis 27 5 watervleermuis 59 =COUNTIF(observaties1!B$2:B$127;A2)
interne controles in je rekenblad Bouw voldoende interne controles in je rekenblad Bereken resultaat via verschillende methodes subtotalen en totalen Resultaat verschillend ? Foutmelding Test de Controles Maak bewust fouten. Komt er een foutmelding ?
Controle Maak een nieuwe rij: "TOTAAL" met som van aantallen Gebruik IF: controleer of TOTAAL gelijk is aan 126 Wat als we nieuwe observaties toevoegen ? Gebruik COUNTA: tel aantal niet lege cellen IF ? COUNTA ? zie help Test de controles: verander de namen van enkele vleermuissoorten =IF(B6=126; "OK"; "FOUT") A B C D 1 soort aantal 2 baardvleermuis 27 3 franjestaart 13 4 grootoorvleermuis 27 5 watervleermuis 59 6 TOTAAL 126 OK =IF(B6=COUNTA(observaties1!B$2:B$127); “OK"; "FOUT")
Gebruik namen als je verwacht dat formules zullen veranderen Robuustheid Voeg extra rij toe aan observaties 29/nov/04 franjestaart 25 7 Wat moet je allemaal aanpassen ? Gebruik namen als je verwacht dat formules zullen veranderen
Robuustheid via Namen Selecteer observaties1!B$2:B$128 Geef deze cellen een naam “soorten" Menu: Insert/Name/Define ... Vervang "observaties1!B$2:B$128" door “soorten“ in je formules. A B C D 1 soort aantal 2 baardvleermuis 27 3 franjestaart 13 4 grootoorvleermuis 27 5 watervleermuis 59 6 TOTAAL 126 OK =COUNTIF(soorten;A2) =IF(B6=COUNTA(soorten); "OK"; "FOUT")
Histogram
Maak Histogram (1/3) Selecteer kolommen met data, incl. kolomtitels Start "Create Chart Wizard" Menu: Insert/Chart… Selecteer gewenste type Probeer “Press and Hold”
Maak Histogram (2/3) Manipuleer data Manipuleer 1 rij data
Maak Histogram (3/4) Fijnregeling uitzicht grafiek Definieer uitvoer "As new sheet:"
Tellen (dubbel criterium) 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 baardvle 1 1 1 2 1 1 2 3 3 2 3 4 3 franjesta 0 0 0 0 0 0 0 1 2 2 2 4 2 watervle 0 0 0 0 0 1 3 5 8 9 10 12 11 grootoo 2 2 1 0 2 2 1 2 3 2 3 4 3 Hoe produceer je zo'n tabel ? In observaties: maak aparte kolom "soortEnJaar" Vul kolom met unie van jaar en soort COUNTIF om te tellen Details ?? stapsgewijs op volgend blad
Stapsgewijs Ga naar blad "observaties1" E1 = kolomtitel "soortEnJaar" E2 = unie kolom soort en datum YEAR(A2) TEXT(YEAR(A2);"0")) CONCATENATE(B2; TEXT(YEAR(A2);"0")) Zie help voor uitleg Doe “Fill Down” voor resterende cellen in kolom Definieer naam "SoortEnJaar“ voor E2:Exxx Maak nieuw blad "TellingSoortPerJaar" B1: vul in 1992 Menu: Edit/Fill/Series… Series in: Rows; Type: Linear Step value: 1; Stop value: 2004 Vul soorten in in A2:A5 A2 =COUNTIF(soortEnJaar; CONCATENATE(A2;B1)) Zet $ en Fill Down/Fill Right Controle via subtotalen !!
Maak Histogram (1/2) Selecteer A2:N5 Start Chart wizard Chart type: Colum Chart subtype: Clustered Column Stap 2 >> Series zie je 4 vleermuissoorten ? Category (X) Axis Labels =TellingenSoortPerJaar!$B$1:$N$1 Stap3: Opties >> Titles Category (X) Axis: "Jaar" Value (Y) Axis: "Aantal" Stap4: As new sheet in naam naar keuze Dubbelklik grijze achtergrond Format Plot Area: Patterns/Area/None
Maak Histogram (2/2)
Karakterisering van Observaties Computervaardigheden en Programmatie Universiteit Antwerpen Karakterisering van Observaties 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 baardvle 1 1 1 2 1 1 2 3 3 2 3 4 3 franjesta 0 0 0 0 0 0 0 1 2 2 2 4 2 watervle 0 0 0 0 0 1 3 5 8 9 10 12 11 grootoo 2 2 1 0 2 2 1 2 3 2 3 4 3 Hoe vat je die observaties samen ? voor elke soort: gemiddelde (AVERAGE) en afwijking (STDEV) baardvleermuis en grootoorvleermuis zijn hetzelfde ! vervang aantal baardvleermuizen in 2004 door 40 i.p.v. 4 gemiddelde en standaardafwijking zijn gevoelig voor extremen ! Statistiek en Grafieken
Mediaan/Kwartiel Mediaan Kwartiel Minimum/Maximum Sorteer waarnemingen Middelste observatie van n observaties n is oneven: op positie (n+1)/2 n is even: gemiddelde van posities (n/2) en (n+2)/2 Kwartiel 1rste kwartiel: observatie op 1/4 3de kwartiel: observatie op 3/4 Minimum/Maximum Functies: MIN, MAX, MEDIAN, QUARTILE
Berekenen van Karakteristieken =QUARTILE($B2:$N2;3) =QUARTILE($B2:$N2;1) =MIN($B2:$N2) A B C D E F ... 14 karakteristieken q1 min med max q3 15 baardvleermuis 1 1 2 4 3 16 franjestaart 0 0 0 4 2 17 grootoorvleermuis 2 0 2 4 3 18 watervleermuis 0 0 3 12 19 =MEDIAN($B5:$N5) =MAX($B5:$N5)
Box-plot (1/2) selecteer karakteristieken Start "Create Chart" Wizard incl. kolomtitels normaal A13:F17 Start "Create Chart" Wizard Step 1: Chart Type Line Chart / Line with Markers Step 2: Data Range Series in Columns Step 2: Series Verifieer 5 series (min, q1, med, q3, max) Step4: Select As Sheet in Naam naar keuze Dubbelklik 1 lijn: Format Data Series: Options: Drop lines: off High-Low Lines: on Up-Down bars: on Voor elke lijn: dubbelklik: Format Data Series: Patterns: Line: none Marker: Custom (keuze) black no color size: (keuze) pts
Box-plot (2/2)
Frequentiedistributie (1/2) Maak nieuw blad "Frequenties" Bereken minimum en maximum spanwijdte minimum = 18; maximum = 28 Maak verticale kolom: getallen tussen 18 en 28 vul een cel met 18 Menu: Edit/Fill/Series... Series in "Columns" / Type "Linear" / Step Value "1" / Stop Value "28" Definieer "spanwijdtes" alle observaties voor spanwijdte
Frequentiedistributie (2/2) Selecteer cellen naast serie Berekeken frequentie van observaties in interval ]x, x+1] =FREQUENCY(spanwijdteAlle;A1:A11) ARRAY formule Druk op ctrl + shift + enter Maak kolomtitels spanbreedte & frequentie
Frequentiedistributie (histogram)
Maak zip-bestand Exporteer de frequentiedistributie "comma delimited" bestand Naam: <studentennummer.csv> Bewaar het rekenblad Creëer via bestuursomgeving (windows) een .zip bestand Naam: <studentennummer.zip> Dit is een gecomprimeerd bestand ! Zo moet je je examen afgeven
Computervaardigheden en Programmatie Universiteit Antwerpen Conclusie Statistiek Sorteren tellen, controles en robuustheid Gemiddelde, afwijking, mediaan en kwartielen Frequentiedistributie Grafieken Histogram, box-plot Basisvaardigheden Maak zip-file Huiswerk frequentiedistributie voor gewicht + histogram frequentiedistributie *per soort* voor spanwijdte + box plot Statistiek en Grafieken