De presentatie wordt gedownload. Even geduld aub

De presentatie wordt gedownload. Even geduld aub

28-7-2014Presentatietitel: aanpassen via Beeld, Koptekst en voettekst 1 Universiteit Twente meets SG Twickel Zoeken in grote tekstbestanden Mariëlle Stoelinga.

Verwante presentaties


Presentatie over: "28-7-2014Presentatietitel: aanpassen via Beeld, Koptekst en voettekst 1 Universiteit Twente meets SG Twickel Zoeken in grote tekstbestanden Mariëlle Stoelinga."— Transcript van de presentatie:

1 Presentatietitel: aanpassen via Beeld, Koptekst en voettekst 1 Universiteit Twente meets SG Twickel Zoeken in grote tekstbestanden Mariëlle Stoelinga Universitair Docent Informatica Universiteit Twente

2 © ontwikkeld door Marielle Stoelinga 2 Agenda: wat doen we vandaag?  Iets over mijzelf en de universiteit  Gastles:  zoeken in grote tekstbestanden  wiskunde zonder getallen  Inhoud  uitleg (10 min)  opdrachten + oplossingen (30 min)  Terugblik  samenvatting  werkt het echt?  Als ik praat, dan zijn jullie stil  Bij vragen: vinger opsteken  Opdrachten (straks!) in groepjes van 2

3 © ontwikkeld door Marielle Stoelinga Onderwijs testtechnieken software modelleertalen afstudeerscripties vandaag: 1 st jaars vak Onderzoek bedenken nieuwe wiskunde beter besturen robots beter/sneller testen software Management team wetenschappers projectleider onderzoek buitenlandse congressen UT: na VWO of HBO; Saxion: lectoren 1. Marielle Universiteit Twente:

4 © ontwikkeld door Marielle Stoelinga 4 2. Gastles: zoeken in grote tekstbestanden Wiskunde ontmoet Taalkunde Wat gaan we doen?  snel & efficiënt zoeken  wiskunde zonder getallen  1 ste -jaars vak universiteit Hoe gaan we te werk? 1.Uitleg  waarom zoeken in grote tekstbestanden  methode 1: dom zoeken  methode 2: slim zoeken 2. Opdrachten  bespreking oplossingen 3. Samenvatting

5 © ontwikkeld door Marielle Stoelinga 5 Zoeken in grote tekstbestanden: waarom? Iemand een idee waarom zoeken reuze handig is ?

6 © ontwikkeld door Marielle Stoelinga 6 Zoeken in grote tekstbestanden: waarom? Personen zoeken op Facebook Google:100 miljoen zoektermen per dag Conclusie: zoeken moet snel en efficient zijn Zoeken in grote tekstbestanden: waarom? Twitter: zoektermen per dag Moet zeer up-to-date zijn Google:100 miljoen zoektermen per dag

7 © ontwikkeld door Marielle Stoelinga 7 Zoeken in grote tekstbestanden: waarom?  Woordzoekers oplossen  Van links naar rechts  Geen $$$, wel leuk ananan ascoca cocada kokosa nanasc ananas cacao cocacola kokos pinacolada

8 © ontwikkeld door Marielle Stoelinga a s a s a n n a n a s a n a s a n n a s n a s a s a n a n a a n a s a n a s a n n a s n a s a s a n n a n a s a n a s a n n a s n a s a s a n a n a a n a a s a n a s a n n a s n a s a s a n n a n a s a n a s a n n a s n a s a s a n s n a a n a s a n a s a n n a s n a s a s a n n a n a s a n a s a n n a s n a a a a a n n a s n a s a s a n a n a a n a s a n a s a n n a s n a s a s a n n a a n a s a n a s a n n a s n a s a s a n a n a a n a s a n a s a n n a s n a s a s a n n a n a s a n a s a n n a s n a s a s a n a n a a n a s a n a s a n a n a s n a s a s a n n a n a s a n a s a n n a s n a s a s a n a n a a n a s a n a s a n n a s n a s a s a n n a n a s a n a s a n a a a a n a s n a a n n s a s n a n a n a n a n a s n a s a n a s a n n a s n a s a s a n n a n a a n s a n a s n a s n a s a s a n a n a a n a s a n s a n n a s n a s a s a n n a a n a s a n a s a n n a s n a s a s a n a n a a n a s a n a s a n n a s n a s a s a n n a n a s a n a s a n n a s n a s a s a n a n a a n a s a n a s a n n a a s a n a s a s a n n a n a s a n a s a n n a s n a a n a s a n a s a n a s a 8 Zoeken in grote bestanden: hoe ZOEK ananas IN

9 © ontwikkeld door Marielle Stoelinga 9 Zoeken in grote bestanden: hoe s a s a n a n a n a s a n a s a n n a s n a Methode 1: dom zoeken a n a n a s  Mensen zien woorden ineens  Computers kunnen alleen letter voor letter zoeken a n a n a s Yesss!

10 © ontwikkeld door Marielle Stoelinga 10 Zoeken in grote bestanden: hoe kan het slimmer? s a s a n a n a n a s a n a s a n n a s n a foute letter Je ziet hier al een gedeelte van het goede woord. Dat kunnen we slim gebruiken! Hoe kunnen we slimmer zoeken?

11 © ontwikkeld door Marielle Stoelinga Zoeken in grote bestanden: hoe kan het slimmer? Methode 2: slim zoeken  Gebruik een diagram  Lees letters uit tekst en volg de pijlen  “Happy” bereikt = woord gevonden  Geen “happy” bereikt = woord komt niet voor n,s aananaanananana Tot nu toe gelezen letters vh woord a s n,s a s a na na s n a Foute letters: Met n of s terug naar begin Slim: ananan Goede letters naar :

12 © ontwikkeld door Marielle Stoelinga Terminologie: wat is wat? n,s aananaanananana a s n,s a s a na na s n a “Bolletje” Toestand Engels: state Pijl (toestands)overgang / transitie Engels: transition label letter Diagram automaat graaf met labels

13 © ontwikkeld door Marielle Stoelinga Opdrachten:  opdracht 1,2,4:  in groepjes van 2  5 minuten werken  dan bespreken  opdracht 3:  klassikaal

14 © ontwikkeld door Marielle Stoelinga Opdracht 1: n,s aananaanananana a s n,s a s a na na 1234 s 0 n a 5  Zoek het woord ananas in onderstaande tekst  Maak gebruik van het diagram  Schrijf onder iedere letter de positie in het diagram waar je bent nadat je de letter gelezen hebt sasaansanansaananasaaa

15 © ontwikkeld door Marielle Stoelinga 15 Opdracht 2:  Maak zelf het diagram voor het woord cacao  Letters: c,a,o ccacaccaca a, o ca ca o c a cacao Oplossing: Dus:  Begin met goede woord  Schrijf gelezen letters bij elke positie  Maak pijlen voor foute letters  Controleer of je, bij elke positie, alle letters hebt a,o o c o c

16 © ontwikkeld door Marielle Stoelinga 16 Opdracht 3 (klassikaal):  Maak een diagram dat uitzoekt of een tekst  OF het woord “pen”  OF het woord “nep”  OF allebei bevat  Letters: e,p,n e ppepen p a p en e e n ne nep e n e n e p n p

17 © ontwikkeld door Marielle Stoelinga 17 Opdracht 4:  Maak een diagram dat uitzoekt of een tekst 3 (of meer) a’s bevat  De a’s hoeven niet achter elkaar te staan  bv: a b b a b c c a b bevat 3 a’s  Letters: a,b,c 1 a2 a’s b,c aa a 3 a’s Oplossing: b,c 0 a‘s

18 © ontwikkeld door Marielle Stoelinga 18 Terugblik Samenvatting  Zoeken in teksten is belangrijk  bv Google, Twitter, Facebook, MS Word  Met diagrammen kun je efficient zoeken in teksten  Is dit wiskunde?  Slimme / snelle methoden om problemen op te lossen  Niet altijd met getallen  Gebruikt Google dit echt?  Google houdt methoden geheim  Andere toepassingen (bv grep in Linux) gebruiken het zeker

19 Presentatietitel: aanpassen via Beeld, Koptekst en voettekst 19 Bedankt voor jullie aandacht & tot ziens! UT begeleidt ook profielwerkstukken


Download ppt "28-7-2014Presentatietitel: aanpassen via Beeld, Koptekst en voettekst 1 Universiteit Twente meets SG Twickel Zoeken in grote tekstbestanden Mariëlle Stoelinga."

Verwante presentaties


Ads door Google