Ontsluiten debatten der Staten Generaal een update Oplijnen Herkennen Doorzoeken Publiceren
PARLEMENTAIRE DROOM Het zou mooi zijn als…….
Parlementaire droom Alle officiële spraak automatisch omzetten in grammaticaal, correct, en fatsoenlijk Nederlands 2.Alles op begripsniveau doorzoekbaar maken 3.In het parlement gesproken spraak correleren aan gelijksoortige topics in de nationale geschreven & audiovisuele pers (en wellicht Blogs, Tweets, Facebook)
HUIDIGE SITUATIE
Situatie 2014 De uitzendingen op debat gemist zijn op datum, type debat, onderwerp en spreker doorzoekbaar. Uitzendingen zijn niet ondertiteld
Oplijnen: workflow 2014 Stenografen Spreker AV-opnamen VLOS2
OPLIJNEN Oplijnen: workflow 2016 Stenografen Spreker AV-opnamen VLOS2 Ik heet de minister welkom SRTSRT XMLXML ondertitelen XMLXML zoeken
Situatie 2016 De uitzendingen op debat gemist zijn nog steeds op datum, type debat, onderwerp en spreker doorzoekbaar EN de uitzendingen zijn ondertiteld 83 (Pechtold) 00:07:15,060 --> 00:07:21,850 Ik reik de minister hier nogmaals mijn hand, maar het is zo langzamerhand wel een lamme hand. 84 (van der Steur) 00:07:23,130 --> 00:07:33,640 Ik ben het niet eens met zoveel oneens van wat collega Pechtold heeft 85 00:07:33,640 --> 00:07:37,023 gezegd over het belang van de veiligheidsketen en het investeren daarin :07:37,024 --> 00:07:43,790 Wat nu als het kabinet uw handreiking niet aanneemt, mijnheer Pechtold? 83 (Pechtold) 00:07:15,060 --> 00:07:21,850 Ik reik de minister hier nogmaals mijn hand, maar het is zo langzamerhand wel een lamme hand. 84 (van der Steur) 00:07:23,130 --> 00:07:33,640 Ik ben het niet eens met zoveel oneens van wat collega Pechtold heeft 85 00:07:33,640 --> 00:07:37,023 gezegd over het belang van de veiligheidsketen en het investeren daarin :07:37,024 --> 00:07:43,790 Wat nu als het kabinet uw handreiking niet aanneemt, mijnheer Pechtold?
TOEKOMSTIGE SITUATIE?
Toekomstige situatie De uitzendingen op debat gemist zijn volledige doorzoekbaar op allerlei metadata & gesproken data. Uitzendingen zijn (op verschillende niveaus) ondertiteld
Parlementaire droom Alle officiële spraak automatisch omzetten in grammaticaal, correct, en fatsoenlijk Nederlands 2.Alles op begripsniveau doorzoekbaar maken 3.In het parlement gesproken spraak correleren aan gelijksoortige topics in de nationale geschreven & audiovisuele pers (en wellicht Blogs, Tweets, Facebook)
Zoeken en Tonen 2016 Zoeken String-match Semantisch zoeken Conceptueel zoeken Presenteren zoekresultaten Alfabetisch? Op tijd? Op relevantie?
Zoeken en Tonen 2016 Zoekwoord: 10x in document Document bevat 8000 woorden Heeft 4§ en zoek- woorden zijn homogeen verdeeld Zoekwoord: 15x in document Document bevat woorden Heeft 2§ en in 1§ komen alle zoekwoorden voor
Vragen Spraakherkenning voor het indexeren van videobestanden: kan de trefzekerheid van de zoek verhoogd worden als gebruik wordt gemaakt van het geredigeerd woordelijk verslag dat met de audio is opgelijnd ten behoeve van de ondertiteling in Debat gemist?
Topic clustering Bijeen brengen van verschillende bronnen die over het zelfde onderwerp gaan. TOPICWeekersTOPICWeekers
Ontwikkelpad Nu Huidige versie Herkenning Semantiek KI / Begrijpen
AANDACHTSPUNTEN Er kunnen fouten gemaakt worden bij: Te veel achtergrond lawaai (komt nauwelijks voor) Heel korte zinnen (‘ja, ja, ok’) Volkomen andere schrijfwijze van de gesproken zinnen
Verschillen spraak-VLOS Heel korte zinnen – In de VLOS2-tekst staat: ‘De voorzitter: Ja, ja. Natuurlijk.’ maar voorzitter wordt niet gezegd. – De spreker wordt soms wel en soms niet genoemd. Bij langere zinnen is dat niet erg omdat de rest voldoende info geeft maar bij kleine zinnetje kan dat fout gaan.
Verschillen spraak-VLOS De geschreven tekst is anders dan de gesproken spraak. Kan de staatssecretaris nader aanduiden waarom de opsporings- diensten in zijn ogen zondagavond niet verrast konden zijn door de uitzending van Brandpunt? Geschreven Kan de staatssecretaris nader aanduiden waarom de opsporings- diensten in zijn ogen niet verrast konden zijn op zondagavond bij de Brandpuntuitzending. Gesproken
VRAGEN?