Download de presentatie
De presentatie wordt gedownload. Even geduld aub
GepubliceerdMartina Coppens Laatst gewijzigd meer dan 10 jaar geleden
1
Positioning: ervaring met testcorpus 1 Ellen Rusman Jan van Bruggen April 2005
2
Apencorpus Documentselectie Splitsen Opschonen spelfouten redundante teksten Identieke teksten HTML-code diacritische tekens plaatjes witte ruimte Aantal documenten
3
Tools: Concordance
5
TextStat
6
Stoppen en stemmen Stoplijst Methodiek Apencorpus Oracle + Volkskrant Stemmen
7
Analyses Parameters uitproberen SVD Queries Interne consistentie documenten over soort X Validiteit documentcorrelaties vergelijking met beoordelaars
8
Resultaten Eigenschappen corpus aantal documenten aantal termen aantal dimensies hele corpus gehalveerde corpus Interne consistentie voorbeeldquery
9
Corpuseigenschappen
12
Conclusies Opbouw corpus Minimale omvang Opschonen en tools Stoppen Werkbare methode gevonden (?) Stemmen Hier niet gedaan, maar … Parameters Interne consistentie
Verwante presentaties
© 2024 SlidePlayer.nl Inc.
All rights reserved.