World class IT in a world-wide market. Practical results with Emile Marten Trautwein Syllogic B.V.

Slides:



Advertisements
Verwante presentaties
KWALITEITSZORG november 2012
Advertisements

Stilstaan bij parkeren Dat houdt ons in beweging
‘SMS’ Studeren met Succes deel 1
28 juni 2009 Paëllanamiddag 1 Paëllanamiddag 28 juni 2009 Voorbereiding vrijdagavond (Loopt automatisch - 7 seconden)
NEDERLANDS WOORD BEELD IN & IN Klik met de muis
WAAROM? Onderzoek naar het meest geschikte traject voor de verlenging tot in Sint-Niklaas van het bestaande fietspad naast de Stekense Vaart en de Molenbeek.
1 Resultaten marktonderzoek RPM Zeist, 16 januari 2002 Door: Olga van Veenendaal, medew. Rothkrans Projectmanagement.
November 2013 Opinieonderzoek Vlaanderen – oktober 2013 Opiniepeiling Vlaanderen uitgevoerd op het iVOXpanel.
Uitgaven aan zorg per financieringsbron / /Hoofdstuk 2 Zorg in perspectief /pagina 1.
Personalisatie van de Archis website Naam: Sing Hsu Student nr: Datum: 24 Juni 2004.
1 COVER: Selecteer het grijze vlak hiernaast met rechtsklik & kies ‘change picture’ voor een ander beeld of verwijder deze slide & kies in de menubalk.
Global e-Society Complex België - Regio Vlaanderen e-Regio Provincie Limburg Stad Hasselt Percelen.
STAPPENPLAN GRAMMATICUS.
Ronde (Sport & Spel) Quiz Night !
Copyright © 2008 Tele Atlas. All rights reserved. Zet uw Business Data op de kaart: Locaties in eTOM ®
Een Concert van het Nederlands Philharmonisch Orkest LES 4 1.
Een optimale benutting van vierkante meters Breda, 6 juni 2007.
Kb.1 Ik leer op een goede manier optellen en aftrekken
© BeSite B.V www.besite.nl Feit: In 2007 is 58% van de organisaties goed vindbaar op internet, terwijl in 2006 slechts 32% goed vindbaar.
© GfK 2012 | Title of presentation | DD. Month
Nooit meer onnodig groen? Luuk Misdom, IT&T
Passie - Verrijzenis Arcabas
FOD VOLKSGEZONDHEID, VEILIGHEID VAN DE VOEDSELKETEN EN LEEFMILIEU 1 Kwaliteit en Patiëntveiligheid in de Belgische ziekenhuizen anno 2008 Rapportage over.
Meisjes en wiskunde (Waarom) is wiskunde moeilijk?
Elke 7 seconden een nieuw getal
Regelmaat in getallen … … …
Regelmaat in getallen (1).
1 introductie 3'46” …………… normaal hart hond 1'41” ……..
Oefeningen F-toetsen ANOVA.
Wat levert de tweede pensioenpijler op voor het personeelslid? 1 Enkele simulaties op basis van de weddeschaal B1-B3.
1 WIJZIGINGEN UNIEK VERSLAG. 2 Agenda Verbeteringen Veranderingen formulieren Praktische herinneringen Nieuwe formulieren Sociale en culturele participatie.
In dit vakje zie je hoeveel je moet betalen. Uit de volgende drie vakjes kan je dan kiezen. Er is er telkens maar eentje juist. Ken je het juiste antwoord,
13 maart 2014 Bodegraven 1. 1Korinthe Want gelijk het lichaam één is en vele leden heeft, en al de leden van het lichaam, hoe vele ook, een lichaam.
Breuken-Vereenvoudigen
Geometrie en topologie Rob Kromwijk, 26 juli 2012.
Seminarie 1: Pythagoreïsche drietallen
Afrika: Topo nakijken en leren.
User management voor ondernemingen en organisaties
2009 Tevredenheidsenquête Resultaten Opleidingsinstellingen.
Ben Bruidegom 1 Sequentiële schakelingen Toestand uitgang bepaald door:  ingangen;  vorige toestand uitgang.
1 Van Harvard naar MIPS. 2 3 Van Harvard naar MIPS Microprocessor without Interlocked Pipeline Stages Verschillen met de Harvard machine: - 32 Registers.
PLAYBOY Kalender 2006 Dit is wat mannen boeit!.
ribwis1 Toegepaste wiskunde – Differentieren Lesweek 7
EFS Seminar Discriminatie van pensioen- en beleggingsfondsen
Hoe gaat dit spel te werk?! Klik op het antwoord dat juist is. Klik op de pijl om door te gaan!
Eerst even wat uitleg. Klik op het juiste antwoord als je het weet.
Opgave 47 a opp beeld = 8 · opp origineel dus k = √8. lengte vergroting = √8 · 15 ≈ 42,4 cm breedte vergroting = √8 · 10 ≈ 28,3 cm b opp beeld = 12 · opp.
Van Vensoc tot Biztax Vennootschapsbelasting Aj 2011.
ECHT ONGELOOFLIJK. Lees alle getallen. langzaam en rij voor rij
Hartelijk welkom bij de Nederlandse Bridge Academie Hoofdstuk 5 Stayman & Jacoby 1Contract 2, hst 5. Stayman & Jacoby.
Hartelijk welkom bij de Nederlandse Bridge Academie Hoofdstuk 7 De 2 ♦ /2 ♥ /2 ♠ en de 2 ♣ -opening 1Contract 2, hst 7.
17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 5.
17/08/2014 | pag. 1 Fractale en Wavelet Beeldcompressie Les 3.
Fractale en Wavelet Beeldcompressie
HOSTA 2010, Vastgoedcongres 29 september september Horwath HTL.
Combining pattern-based and machine learning methods to detect definitions for eLearning purposes Eline Westerhout & Paola Monachesi.
De financiële functie: Integrale bedrijfsanalyse©
1 Zie ook identiteit.pdf willen denkenvoelen 5 Zie ook identiteit.pdf.
13 november 2014 Bodegraven 1. 2 de vorige keer: 1Kor.15:29-34 indien er geen doden opgewekt worden...  vs 29: waarom dopen?  vs.30-32: waarom doodsgevaren.
1 Week /03/ is gestart in mineur De voorspellingen van alle groten der aarden dat de beurzen zouden stijgen is omgekeerd uitgedraaid.
ZijActief Koningslust
Gezondheid oudere migranten in Utrecht (selectie)
Openbaar je talent Service public, talent particulier.
1 DE ADVIEZEN VAN BEURSMAKELAAR BERNARD BUSSCHAERT Week
Gemaakt door Sophie & Dide
Hoofdstuk 6 – Objectgeoriënteerd Programmeren: Overerving
Transcript van de presentatie:

World class IT in a world-wide market

Practical results with Emile Marten Trautwein Syllogic B.V.

Road map Introduction myself Context: –Text mining tools Results with Emile

Introduction myself Computer Science at UvA ( ) –Theoretical computer science Complexity of Categorial Unification Grammar Dr Janssen PhD Computer Science at Uva ( ) –Theoretical computer science Complexity of Unification Grammars Dr v. Emde Boas, Dr Janssen, Dr Torenvliet Syllogic B.V. ( ) –Research and development Text mining

Context Term clustering TextAnalyst - Microsystems Co. Ltd. Intelligent miner for text - IBM

TextAnalyst Microsystems Co. Ltd. Megaputer Intelligence Inc (distributor) Version 2.0

TextAnalyst - Features Functionality includes –Hierarchical / Structured topics –Knowledge base formation –Semantic search –Abstracting Languages –English –Russian

TextAnalyst - Knowledge base

TextAnalyst - Summarization

Intelligent miner for text IBM Corp. Version 2.3 December 1998 www-4.ibm.com/software/data/iminer/fortext/

IM4Text - Features Functionality includes –Clustering –Categorization –Search –Summarization –WebCrawler Languages –English

IM4Text- Clustering 0 III IX, X VII XI I II IV V VI VIII XII

IM4Text - Summarization

Other tools Verity Knowledge Organizer Autonomy Knowledge Server GrapeVine TextWise's DR-LINK, CHESS and CINDOR Data Junction's Cambio DataSet Synthema, Italy (IBM Technology Watch) Semio Corp's SemioMap Cartia's ThemeScape Canis' cMap Inxight's LinguistX and VizControls Muscat's Empower

Emile Syllogic / University of Amsterdam Version 3.1

Emile - Features Functionality includes –Grammar induction –Knowledge base construction –Compound term separation Languages –Any

Emile - Grammar induction Fragment of Phaistos disk * … Fragment of grammar [0] --> [3]. [3] --> [16] [47] [14] --> 15 [40] [14] --> 2 12 [16] --> 2 [57] [16] --> [14] 13 1 [16] --> [40] --> 7 [40] --> 29 [47] --> 18 [47] --> [57] --> 27 [57] --> 29

Emile - Incomplete data set Ik kan geen mail lezen met MS-Mail Ik kan geen mail schrijven met MS-Mail Ik kan geen mail openen met MS-Mail Ik kan geen mail verzenden met MS-Mail Ik kan geen mail lezen met MS-Outlook Ik kan geen mail schrijven met MS-Outlook Ik kan geen mail openen met MS-Outlook Ik kan geen mail verzenden met MS-Outlook Ik kan geen mail lezen met Mail Ik kan geen mail schrijven met Mail Ik kan geen mail openen met Mail Ik kan geen mail verzenden met Mail Ik kan geen mail lezen met Outlook Ik kan geen mail schrijven met Outlook Ik kan geen mail openen met Outlook Ik kan geen mail verzenden met Outlook

Emile - Variable settings Default on 12 context support: 30% expression support: 30% total support: 50% Default on 8 context support: 40% expression support: 40% total support: 60% context support: 50% expression support: 50% total support: 70% Generate data set Generate complete language Generate data set Generate 15 out of 16 sentences Generate complete language

Emile - Induced grammar [0] --> [2] [18] [0] --> [31] [29] [0] --> [42] [15] [2] --> Ik kan geen mail [12] met [12] --> openen [12] --> verzenden [15] --> met [41] [15] --> met [18] [18] --> MS-Mail [18] --> MS-Outlook [27] --> verzenden [27] --> lezen [29] --> met [30] [30] --> MS-Outlook [30] --> Mail [31] --> Ik kan geen mail [27] [31] --> Ik kan [45] [39] --> lezen [39] --> schrijven [41] --> Mail [41] --> Outlook [42] --> Ik kan [45] [45] --> geen mail [39] [45] --> geen mail [12]

Emile - Knowledge base Dictionary Type [35] K033 k033 K105 k33 Dictionary Type [87] Vrachtgeb vrachtgeb Vrachtgebouw Vracht Dictionary Type [89] CGOADTP6 Printqueue Dictionary Type [114] is Userid Password Dictionary Type [138] status Error Dictionary Type [196] scarlos vrachtbrieven Dictionary Type [215] G239 g239 Dictionary Type [237] enorm ontzettend super Dictionary Type [290] pingen benaderen

Emile - Knowledge base [16] --> School of Medicine, University of Washington, Seattle 98195, USA [16] --> University of Kitasato Hospital, Sagamihara, Kanagawa, Japan [16] --> Heinrich-Heine-University, Dusseldorf, Germany [16] --> School of Medicine, Chiba University [5] --> Department of Urology, [16] [94] --> Chinese [94] --> Japanese [94] --> Polish [101] --> 32 : Cancer Res 1996 Oct [101] --> 35 : Genomics 1996 Aug [101] --> 44 : Cancer Res 1995 Dec [101] --> 50 : Cancer Res 1995 Feb [101] --> 54 : Eur J Biochem 1994 Sep [101] --> 58 : Cancer Res 1994 Mar [105] --> identified in 13 cases ( 72 [105] --> detected in 9 of 87 informative cases ( 10 [105] --> observed in 5 ( 55 [11] --> LOH was [105] %

Emile on Biomed (1)

Emile on Biomed (2)

Emile on Biomed (3)

Merits Emile Language independent Clustering within sentences Incremental learning No training phase Raw text input Access to source code

Improve performance Start with information rich text Boot strap with substitution patterns