Hoofdstuk 4: Organisatie van Beslissingsprocessen

Slides:



Advertisements
Verwante presentaties
Update on EduStandard: public-private platform in Dutch education Henk Nijstad, Kennisnet / november 2013.
Advertisements

KWALITEITSZORG november 2012
The stock market will go up De beurswaarden zullen stijgen YESNO JA NEEN Is Jefken a good person ? Is Jefken een goed mens ? YES NO JA NEEN Is Lonny a.
Help, ik moet naar Office 2007!?. Wat horen wij bij klanten Training “New UI will cause too big of a loss in productivity” Training “New UI will cause.
Simuleren van DOT / Impact Analyse Simplifying Decisions for Everyone.
November 2013 Opinieonderzoek Vlaanderen – oktober 2013 Opiniepeiling Vlaanderen uitgevoerd op het iVOXpanel.
Ervaringen van een BPOS Partner T-BENCH Danny Otten.
Atos, Atos and fish symbol, Atos Origin and fish symbol, Atos Consulting, and the fish itself are registered trademarks of Atos Origin SA. August 2006.
Een alternatief voorstel Naar aanleiding van bestudering van de IAASB voorstellen denkt de NBA na over een alternatief. Dit alternatief zal 26 september.
Social Technographics Hoe ontwikkel je een succesvolle social media strategie? Reineke Reitsma Director, Consumer Technographics Forrester Research 11.
Deltion College Engels C1 Gesprekken voeren [Edu/002]/ subvaardigheid lezen thema: Order, order…. can-do : kan een bijeenkomst voorzitten © Anne Beeker.
Global e-Society Complex België - Regio Vlaanderen e-Regio Provincie Limburg Stad Hasselt Percelen.
Internet vriendschap Internet friendship
1 Co-Design at Chess-iT Guus Bosman. 2 Afstuderen bij Chess Net.Footworks tot augustus 2003 Afstuderen augustus 2003 tot maart 2004 Chess full-time vanaf.
Confidential & Proprietary Copyright © 2007 The Nielsen Company INNOVATIE Tracking Februari 2007.
Sex, drugs and rock n' roll 2.0: Wat kunnen we leren van evenementen? Dr. Walther Ploos van Amstel Vrije Universiteit/TNO Mobility.
Teams on the frontline Geert Stroobant De Heide - Balans
Copyright © 2008 Tele Atlas. All rights reserved. Zet uw Business Data op de kaart: Locaties in eTOM ®
Finance & Business Control
Megatrends, besturen en talent
Open Access en de universiteit IQ healthcare Bart Staal.
QAD Reporting & Analytics
Gezondheidszorg Microsoft Dynamics Harco van Polen
Een optimale benutting van vierkante meters Breda, 6 juni 2007.
Voorziening levensonderhoud Religieuze Instituten Paul Op Heij ‘s-Hertogenbosch, 25 september 2013 The future depends on what you do today.
Accessible Instructional Materials. § Discussion: Timely access to appropriate and accessible instructional materials is an inherent component.
1 Presenting Borealis 2006 © 2005 Borealis A/S Presenting Borealis A leading, innovative provider of plastics solutions February 2007.
Performance Intelligence!
Corporate Communications February 2011 Succesvol met Outsourcing Gerben Edelijn, CEO Thales Nederland.
AGENDA Het programma start om uur en eindigt om uur met aansluitend een dinerbuffet tot uur. Er is voldoende ruimte om met uw collega.
Beyond Big Grid – Amsterdam 26 september 2012 Enquette 77 ingevulde enquettes, waarvan 60 met gebruikservaring = Mainly Computer Science.
Rob Elsinga Business Group Lead Information Worker Microsoft Nederland Samenwerken op Afstand.
AGENDA Tijd Agenda Spreker 08:00 – 08:30 Registratie en ontbijt
EIE/06/075/SI From January 2007 to March 2009 Nationale Workshop Energiebesparing Introductie van E-BAG.
Nooit meer onnodig groen? Luuk Misdom, IT&T
1 HOORCOLLEGE Hoorcollege CRM en Interactieve marketing (Thema Marketing & Communicatie Sjo Smeets)
1 HOORCOLLEGE Customer Relationship Management
Woensdag 23 juli 2014 volgende vorige algemeen ziekenhuis Sint-Jozef Malle Dementia pathway: a condition specific approach Patrick De Wit, MD Thierry Laporta,
Elke 7 seconden een nieuw getal
In samenwerking met het Europees Sociaal Fonds en het Hefboomkrediet The role of APEL in career coaching and competence management Competence navigation.
Specialismen Analyse en verificatie van protocollen Analyse van Petri-netten Component-specificatie Web-based information systems (Query)talen voor Web.
Software Engineering Sommerville, Ian (2001) Software Engineering, 6 th edition Ch.1-3
Enterprise Application Integration Walter Moerkerken Ilona Wilmont Integratie Software Systemen 8 mei 2006.
Microsoft Partner Programma
Databases I (H.3) Het Entity-Relationship Model Wiebren de Jonge Vrije Universiteit, Amsterdam versie 2003.
IOP and Vrije Universiteit1 Example of bad interface  Windows: Use Start to Stop.
Sunday, 03 August 2014 zondag 3 augustus 2014 Click Klik.
Marketing: Veranderingen in Belang en Rol
1 Van Harvard naar MIPS. 2 3 Van Harvard naar MIPS Microprocessor without Interlocked Pipeline Stages Verschillen met de Harvard machine: - 32 Registers.
Automation SolutionsMFG/Pro Dutch usergroup 8 februari 2007 ISA S88 & S95 Het gebruik van deze normen in de productie.
Geheugen, distributie en netwerken Netwerken: de basis voor distributie van gegevens en taken (processen) –bestaan zo’n 40 jaar, zeer snelle ontwikkeling.
Organizing Organization is the deployment of resources to achieve strategic goals. It is reflected in Division of labor into specific departments & jobs.
Motivation One secret for success in organizations is motivated and enthusiastic employees The challenge is to keep employee motivation consistent with.
Deltion College Engels C1 Schrijven [Edu/002] thema: CV and letter of application can-do : kan complexe zakelijke teksten schrijven © Anne Beeker Alle.
Deltion College Engels C1 Gesprekken voeren [Edu/004]/ thema: There are lies, damned lies and statistics... can-do : kan complexe informatie en adviezen.
Deltion College Engels C1 Luisteren [Edu/001] thema: It’s on tv can-do : kan zonder al te veel inspanning tv-programma’s begrijpen.
Deltion College Engels En Projectopdracht [Edu/001] thema: research without borders can-do/gesprekken voeren : 1. kan eenvoudige feitelijke informatie.
Deltion College Engels B1 Schrijven [Edu/004]/ subvaardigheid lezen thema: reporting a theft can-do : kan formulieren waarin meer informatie gevraagd wordt,
© Copyright VIMC 2009 Telecom Expense Management A Discussion Ed Vonk
AOPA KNVvL 1 Safety Management System (SMS) The Basics Paul van den Berk AOPA KNVvL Lelystad.
Rational Unified Process RUP Jef Bergsma. Iterations –Inception –Elaboration –Construction –Transition De kernbegrippen (Phases)
Blended Learning. content Waarom wij e-learning hebben gebruikt Demo van de module Voorlopige resultaten van effecten op gebruikers.
© Shopping 2020 TITLE Date Subtitle Logo Gastheer Logo Voorzitter.
TRENDS and impact on your Business
Sustainable employability in Tourism The human factor October 24, 2014 Where Europe Meets the Americas.
Klantkennis Geïndividu- Relatie- Multi
WISKUNDIG MODELLEREN KUNST OF KUNDE? 11 november 2009 Jaap Praagman CQM.
Finance Matters CoP Case studies
IBM Software A vehicle manufacturer deploys business rules in one hour instead of a week IBM Operational Decision Manager software helps speed new business.
Transcript van de presentatie:

Hoofdstuk 4: Organisatie van Beslissingsprocessen MIS, OLTP versus DSS, Group DSS, OLAP, Corporate Performance Management, data warehousing, Business Intelligence, digital dashboards, Knowledge Discovery in Data, Belang van externe informatie, waarde van externe informatie Prof. dr. Jan Vanthienen

Deel 2: Organisatie van de informatievoorziening Hoofdstuk 3: Bedrijfsaspecten van ICT Effectiviteit, Efficiëntie en productiviteit van informatiesystemen. Flexibiliteit, Kosten-baten, TCO Hoofdstuk 4: Beslissingsprocessen MIS, OLTP versus DSS, Group DSS, OLAP, Corporate Performance Management, data warehousing, Business Intelligence, digital dashboards, Knowledge Discovery in Data, Belang van externe informatie, waarde van externe informatie Hoofdstuk 5: Informatie- en Kennismanagement Organizational learning en knowledge management, portals, content management, text mining, beslissingstabellen Hoofdstuk 6: Organisatie van controleprocessen Interne versus externe controle, audit, controle op beslissingen, Six-Sigma, Fraude en fraudedetectie, controle op informatiesysteemontwikkeling, Virussen en Malware

De belangrijkste soorten IS

Information Maturity Model Level 4 Level 3 Level 2 Centralized Access to Data and content Level 1 DATA INFORMATION Refine, analyze & sort data to deliver information Apply intelligence to deliver only relevant information – i.e. knowledge KNOWLEDGE ACTION Apply intelligence to trigger actions and flag exceptions

Enkele Typische Management Vragen PRODUCT CUSTOMER How much have we sold? Which product gives the best profit? Which product has the largest sales volume this quarter? Which product best meets market needs? How much to produce of each product? Who is the most profitable customer? What is the satisfaction level? Which are the best segments? Which service to improve? How many customers did we loose last year? Is customer X likely to churn? CHANNEL MARKETING Which retailer yields most by volume and which by profit? What promotions will yield most profit? What effect will discounts have on the turnover? What are the area coverage levels? How many contacted people became a customer? Which types of customers are most likely to respond to promotions? What is the competition doing?

Nood aan business performance management “Trying to improve something without having a goal, a numerical goal, is like trying to lose weight without having a scale.” (Subir Chowdhury, ‘The Power of Six Sigma’) Business Intelligence raamwerken bieden oplossingen aan voor enterprise performance management

Balanced scorecards Balanced scorecards laten toe om de bedrijfsactiviteiten te bemeten in termen van visie en strategie (Kaplan en Norton, 1992) Laat toe om de prestatie te meten via het combineren van klassieke financiële met niet-financiële indicatoren Bv. ROI Bv. Aantal klachten Bv. Tijd nodig voor orderwerking Bv. Opleiding van werknemers

Key Performance Indicators Purchasing # hits Production # hits 1 development of purchase prices 86 1 overhead costs 94 2 stocklevel by item or product line 84 2 direct costs of materials 93 3 reliability of suppliers; quality (zero-defects) 81 3 direct costs of labour 92 4 financial position of suppliers 81 4 factory overhead expenses 91 5 reliability of suppliers; time to delivery 79 5 quality finished product 91 6 reliability of suppliers; completeness 74 6 sick days 91 7 purchasing department costs 72 7 overtime 90 8 number of goods returned 48 8 stock of raw materials 90 9 cash discounts 47 9 production volume 89 10 accounts payable as a % of purchasing value 39 10 maintenance costs 89 Sales # hits Finance # hits 1 sales volume or sales volume growth 95 1 Earnings Before Interest & Taxes (EBIT) 104 2 depreciation of accounts receivable 92 2 Gross margin 103 3 number of buyer complaints 92 3 Profit Before Tax (PBT) 102 4 quality of deliveries 88 4 Gross investments 102 5 marketing expenses 87 5 working capital 101 6 freight costs 86 6 cash flow 94 7 value of new orders 85 7 liquidity position 92 8 accounts receivable as a % of turnover 85 8 Return on Capital Employed 77 9 reliability of deliveries; time to delivery 84 9 Return on Sales 75 10 market growth 83 10 turnover time of goods in stock 75 (Source: Ernst & Young Consulting)

Business Intelligence Business Intelligence (BI) is het proces van het verzamelen, opschonen, combineren, consolideren, analyseren, interpreteren en communiceren van interne en externe data, relevant voor het besluitvormingsproces in een organisatie Geïmplementeerd on de vorm van een MIS, DSS, ESS Transformeren van data in kennis Gebruikte technieken: Data warehousing Digital dashboards OLAP Data mining Data Information Knowledge Action Collection Decisions Integration Analysis

Van chaos naar orde OLAP and data mining Data warehousing

Business Intelligence Dashboards Veel BI tools gebruiken digital dashboards voor het visualiseren van informatie Beknopte en gestructureerde visualisatie van business performance Bv. Weergave van KPI’s Real-time of periodische snapshots Maken gebruik van intuïtieve indicatoren, zoals verkeerslichten, en waarschuwingen Gepersonaliseerd met links voor verdere analyse Vaak in een web browser (intranet omgeving)

Intelligente BI BI software kan gebruikt worden voor het verkennen en analyseren van grote hoeveelheden data, waarbij niet enkel informatie geproduceerd wordt (begrijpen wat er gebeurt), maar ook kennis (begrijpen welke acties kunnen ondernomen worden) Voorbeelden waar BI kan gebruikt worden voor het bijstaan van de besluitvorming: Credit scoring Fraude detectie Market basket analysis Markt segmentatie Mass personalization Selecting marketing channels Customer churn (klantverloop) … Data Information Knowledge Action

Enkele Typische Management vragen PRODUCT CUSTOMER How much have we sold? Which product gives the best profit? Which product has the largest sales volume this quarter? Which product best meets market needs? How much to produce of each product? Who is the most profitable customer? What is the satisfaction level? Which are the best segments? Which service to improve? How many customers did we loose last year? Is customer X likely to churn? CHANNEL MARKETING Which retailer yields most by volume and which by profit? What promotions will yield most profit? What effect will discounts have on the turnover? What are the area coverage levels? How many contacted people became a customer? Which types of customers are most likely to respond to promotions? What is the competition doing?

Vanwaar de interesse in BI Massale beschikbaarheid van data In bepaalde sectoren verdubbelt de data elke 1-2 jaar Business trends die BI stimuleren Implementatie van corporate performance management systems (balanced scorecards, six sigma, ...) Marktglobalisatie Korte product life cycles Company mergers en acquisities Customer Relationship Management (CRM) Technology push Snellere hardware en goedkopere disk capaciteit Moderne OLAP-tools Intranet, portals, mobile devices, …

“The key in business is to know something that nobody else knows.” Business Intelligence (BI) is the process of gathering meaningful information to answer questions and identify significant trends or patterns, giving key stakeholders the ability to make better business decisions. “The key in business is to know something that nobody else knows.” — Aristotle Onassis PHOTO: HULTON-DEUTSCH COLL

BI Questions What happened? What is happening? Why is it happening? What were our total sales this month? What is happening? Are our sales going up or down, trend analysis Why is it happening? Why have sales gone down? What will happen? Forecasting & What If Analysis What do I want to happen? Planning & Targets Source: Bill Baker, Microsoft

BI topics OLAP Data ware- housing Data mining

Business Intelligence and Data Mining Verification driven analysis Query and reporting OLAP Statistical verification techniques Discovery driven data mining (Automated search for patterns) Classification Segmentation Associations Sequence analysis

Organisatie van beslissingsprocessen 1. De moeilijkheidsgraad van besturen en de gevolgen voor een besturingsinformatiesysteem 2. De planmatige besturing van een bedrijf en de situering van beslissingsprocessen 3. De bijdrage in de verkenningsfase van een beslissingsproces 4. De bijdrage in de analysefase van een beslissingsproces 5. DSS’en, datawarehouses, OLAP en data mining

Inzicht in complexiteit van een besturingssysteem Formuleren van eisen waaraan het informatiesysteem t.b.v. het besturingsproces moet voldoen

1. De moeilijkheidsgraad van besturen en de gevolgen voor een besturingsinformatiesysteem Vooraleer een informatiesysteem te ontwikkelen moet men zich vergewissen van: de complexiteit van het te besturen systeem. de irrationaliteit in de besluitvorming.

De moeilijkheidsgraad van de besturing van een organisatie is afhankelijk van: de gevoeligheid en stabiliteit van het bestuurde systeem; het aantal variabelen dat relevant is voor het besturingssysteem en de relaties tussen deze variabelen; de voorspelbaarheid en de beheersbaarheid van de variabelen; de reactieperiode van het bestuurde systeem, respectievelijk besturingsorgaan.

irreguliere variabelen: externe invloeden stuurvariabelen: onder controle van besturingsorgaan Doelvariabelen: nagestreefd door de bestuurder indifferente variabelen: ontstaan als output (neveneffect) Bestuurde systeem: vb. productieproces Besturingsorgaan: vb. productiechef

A. De gevoeligheid en stabiliteit van het bestuurde systeem De besturing van een proces wordt moeilijker naarmate: het bestuurde systeem meer gevoelig is voor verstorende invloeden van buitenaf (irreguliere variabelen). de inputvariabelen (irreguliere- en stuur- variabelen) minder constant blijven.

B. Het aantal variabelen dat relevant is voor het besturingssysteem en de relaties tussen deze variabelen Besturen wordt moeilijker naarmate: het aantal irreguliere variabelen toeneemt: gevolg: toenemende omgevingsinvloed die inwerkt op het systeem het aantal stuurvariabelen toeneemt: Naarmate men meer alternatieven heeft om een ‘verstoord’ systeem weer te regelen, zal de keuze van de meest geschikte ‘mix’ van stuurmaatregelen moeilijker worden (ook valt dan de effectiviteit van iedere stuurvariabele afzonderlijk vrij moeilijk te bepalen).

het aantal doelvariabelen toeneemt: Besturen wordt lastiger naarmate aan meer doelstellingen moet worden voldaan.

C. De voorspelbaarheid en de beheersbaarheid van de variabelen Een systeem is perfect beheersbaar indien er voor alle mogelijke toestanden van het bestuurde systeem een eenduidige stuuractie bestaat, die in 1 stap het systeem in de gewenste toestand brengt. Besturen wordt moeilijker als: het aantal variabelen toeneemt de effectiviteit van de stuurvariabelen afneemt.

Aspecten van voorspelbaarheid: Hoe minder een beslisser in staat is om de gevolgen van zijn stuurmaatregelen te voorspellen, hoe moeilijker de besturing. Aspecten van voorspelbaarheid: de mate van zekerheid de mate van meetbaarheid de tijdshorizon interferenties tussen grote aantallen variabelen

D. De reactieperiode van het bestuurde systeem, respectievelijk besturingsorgaan Hoe trager een te besturen systeem reageert op bepaalde stuurmaatregelen, hoe moeilijker het besturingsprobleem wordt. Met een langere reactieperiode ontstaan er nieuwe kansen voor verstoringen van buitenaf. Hoe wisselvalliger een te besturen systeem verstoord raakt in de tijd, hoe moeilijker het besturingsprobleem. (-> afnemende alertheid) Correctief ingrijpen (feed forward besturing) Anticiperend ingrijpen (feed forward besturing)

In de praktijk vaak voorkomende fouten Gevoeligheid en stabiliteit bv. ontwerp van een batch info.systeem in een situatie waarin gevoeligheid groot is en stabiliteit gering. Voorspelbaarheid en beheersbaarheid bv. deterministische modellen gebruiken in een stochastische omgeving Aantal variabelen bv. traditionele verzameling van programma’s i.p.v. flexibel kennissysteem Reactieperiode bv. zeer frequente ‘reporting’ voor systemen met een grote reactieperiode

De irrationaliteit van de besluitvorming Vaak wordt in de relatie besluitvorming- informatievoorziening van de veronderstelling uitgegaan dat de besluitvormingen volkomen rationeel gebeurt.

Mensen neigen ernaar om de ogen te sluiten voor informatie die niet past in hun beeld van de werkelijkheid. Mensen zijn gevoeliger voor negatieve gevolgen van gebeurtenissen dan voor positieve. Mensen kunnen niet goed omgaan met onwaarschijnlijke gebeurtenissen (bv. ze gaan die volkomen negeren). Mensen willen risico’s vermijden wanneer ze voordeel willen behalen, terwijl ze risico’s willen nemen om verlies te vermijden. . . .

Kenmerken van het beslissingsproces: Complexiteit Irrationaliteit de hoge mate van complexiteit van vele beslissingsprocessen en de irrationaliteit van de besluitvorming Geen gemakkelijke opdracht om informatiesystemen te ontwikkelen die het beslissingsproces ondersteunen.

2. Situering van het beslissingsproces in een organisatie

3 3 3 5 4 Obj. LT Obj. MT Obj. KT Instructies Resultaten Uitvoering Beslissingsprocessen Beleidsvorming en beslissing Beleidsplan Obj. MT Beslissing jaarl. actieplannen Obj. KT Probleem- analyse 3 3 3 Beslissing uitvoering plan Beleids- begroting Jaarlijkse budgetten Budgetvoorstel Operationele processen Taakopdracht 5 Programmatie van uitvoering Instructies Controle-processen 4 Resultaten Uitvoering strategisch tactisch operationeel

Stappen in een beslissingsproces Intelligence activities Opsporingsfase of verkenningsfase verkennen van het probleem en formuleren van de doelstellingen Analysefase analyseren van mogelijke alternatieve acties en onderzoeken van effecten van onzekere gebeurtenissen op het resultaat van acties Keuzefase nemen van de beslissing Design activities Choice activities

Stages in Decision Making Figure 13-3

3. Bijdrage in de verkenningsfase van een beslissingsproces Investeren in middelen op basis waarvan men op systematische wijze relevante interne en externe informatie krijgt aangeleverd. OLTP DSS ERP DB Data Warehouse DB ETL-tools Operationele gegevensbronnen (intern) Externe gegevensbronnen Besturingsinfo

Belangrijke externe informatie info omtrent behoeften van klanten (om daar in de toekomst op te anticiperen); bestaande concurrenten in de gaten houden en nieuwkomers detecteren; nieuwe technologie: de nieuwste trends en ontwikkelingen van de technologie volgen en de impact voorspellen voor de eigen afzetmarkt; bestaande en nieuwe leveranciers op het spoor komen voor samenwerking in ‘value chain’; globale economie en politiek trends, gebeurtenissen en verwachte invloeden op marktactiviteiten.

Diverse bedrijven/organisaties specialiseren zich in het verschaffen van externe gegevens: Mediagroepen en uitgevers: FET, VUM, Roularta, Concentra Industriële belangengroepen Agoria, Febeltex Financiële bedrijven Fortis, KBC, ING Information brookers: CNN, Reuters

overheid Opera- tionele DB DW DB OLTP DSS Extractie en pre-processing persoonsgegevens belastingsaangifte Opera- tionele DB 2000 1999 DW DB naam van persoon, wedde, geslacht, gemeente, provincie, gewest, leeftijds-categorie ... economische conjunctuur gegevens Extractie en pre-processing Operationele gegevens (intern) Post- processing Externe gegevens OLTP DSS

Types of Information Systems OPERATIONAL INFORMATION SYSTEMS MANAGEMENT Operations personnel Staff managers Professionals & clerical Middle Management Executive Management Transaction processing systems (TPS) Office automation systems (OAS) Knowledge work systems (KWS) Management information systems (MIS) Decision support systems (DSS) Executive support systems (ESS) STRATEGIC TACTICAL

Data warehousing: wat betekent dit? Data warehousing is het inrichten en exploiteren van een data warehouse database met gegevens die afkomstig zijn uit operationele productie databases en zijn verrijkt met gegevens die afkomstig zijn uit externe bronnen.

Data warehouse: wat betekent dit? Een data warehouse is een geïntegreerde, subjectgeoriënteerde en tijdsafhankelijke gegevensverzameling die niet of nauwelijks aan verandering onderhevig is en die het beslissingsproces van managers kan ondersteunen.

Data warehouse: definitie “A subject-oriented, integrated, time-variant, and non-volatile collection of data in support of management’s decision-making process” (Inmon) “A copy of transaction data specifically structured for query and analysis” (Kimball) Subject-georiënteerd: Georganiseerd rond de belangrijkste subjecten van een bedrijf (bv. Klanten, producten, verkopen) in plaats van de belangrijkse applicaties (bv. Facturatie, voorraadcontrole, en orderverwerking)

Data warehouse: definitie Geïntegreerd: Integreren en consistent maken van applicatie-data van verschillende bronsystemen teneinde een uniforme view voor de gebruikers aan te bieden Gecentraliseerd en cross-functioneel Voorbeelden data bronnen: OLTP systemen Legacy systemen Externe data Data integratie vertegenwoordigt ~80% van de inspanningen voor het bouwen van een data warehouse Data integratie is moeilijk omwille van: Onbestaande of slechte metadata Slechte data kwaliteit Verschillende coderingen, inconsistent semantiek

Data warehouse: definitie Time-variant: Data warehouse biedt een serie van historische snapshots Niet-volatiel Nieuwe data wordt altijd toegevoegd Oude data blijft bestaan Operational data sources t t0 t1 t2 t3 Data warehouse

OLTP Gegevens zijn gericht op ondersteuning van operationele processen Gegevens zijn gestructureerd rond processen Gegevens zijn gedetailleerd Gegevens worden voortdurend aangepast DSS Gegevens zijn gericht op ondersteuning van tactische en strategische beslissingen Gegevens zijn gestructureerd rond subjecten Gegevens zijn geaggregeerd en veredeld Gegevens worden niet aangepast, er worden telkens nieuwe gegevens toegevoegd (-> historie) ERP DB DW DB

Grootte van een data warehouse The average data warehouse has increased from 1 terabyte to 2.2 terabytes, representing a growth of more than 100 percent in the past 18 months (Source: Forrester research, early 2005) Wal-Mart data warehouse: hundreds of terabytes (“Wal-Mart Making Its Huge Data Warehouse Huger”, InformationWeek, Oct. 2004) Nieuwe technieken zoals RFID zullen de omvang van data warehouses nog doen toenemen

Data marts Data warehouse: bedrijfsbrede scope Data mart: ontworpen ter ondersteuning van de besluitvorming van een specifieke groep eindgebruikers Independent Data Marts Enterprise Data Warehouse

Data Warehousing Issues (1) Modeling a data warehouse (2) Building a data warehouse architecture (3) How to get information into warehouse “ETL – Extract, Transform, Load” (4) What to do with data once it is in warehouse exploring, mining

Example of a Star Schema ProductNo ProdName ProdDesc Category QOH Product Day Month Year Week Date Sales Fact Table Date Product Store StoreID City State Country Region Store CustId CustName CustStreet CustCity CustCountry Cust Customer Quantity Sales Cost Dimensions Measurements Unnormalized (no update anomalies)

Sterschema ontwerp van een data warehouse Employee_Dim EmployeeKey EmployeeID … EmployeeKey Dimensie-attributen Time_Dim TimeKey Date Quarter … Product_Dim ProductKey ProductID ProdGroup … TimeKey Sales_Fact ProductKey TimeKey Composed Key TimeKey EmployeeKey EmployeeKey Dimensional Keys ProductKey ProductKey CustomerKey CustomerKey ShipperKey ShipperKey Units £ … . Measures Shipper_Dim ShipperKey ShipperID … Kunnen geaggregeerd worden Customer_Dim CustomerKey CustomerID CustName CustArea … ShipperKey CustomerKey

KLANT (Dimensietabel) klants. naam gemeente geslacht geb.jaar . 55 Janssens Leuven M 1988 . . . . . . . TIJD (Dimensietabel) tijds. datum weekdag dag voor/na feestdag 202 10.10.04 5 N . . . . . . VERKOPEN (Feitentabel) tijds. klants. prods winkels. hoev omzet 202 55 68 07 1 7.30 . . . . . . . . PRODUCT (Dimensietabel) Prods naam groep merk categ. verpakking . 68 water bruis SPA levensm glas . . . . . . . . WINKEL (Dimensietabel) winkels. soort gemeente regio . 07 superette Leuven Vl.Brabant : . . . . .

Sterschema

Voorbeeld Data warehouse project voor de transport sector Verzamelen en integreren van data betreffende onderzoeken en controles uitgevoerd door: Ministerie van transport Arbeidsinspectie Sociale zekerheidsinspectie Douane Federale en lokale politie

Voorbeeld data warehouse model

Data Warehouse Loading Data extraction/consolidation: get data from multiple, heterogeneous, and external sources Data cleaning: detect errors/duplications in the data and rectify them when possible (KUL, K.U.L., K.U.Leuven) Data transformation: convert data from legacy or host format to warehouse format (Male = M, 1, true) Load: sort, summarize, consolidate, compute views, check integrity, and build indices and partitions Refresh: propagate the updates from the data sources to the warehouse (daily 66%, weekly 20%)

Data integratie problemen Gender Male Female Gender Male Female Gender M F Male Female Weight (kilograms) 6 10 2.72 4.54 Weight (kilograms) 6 10 Extraction, Transformation, and Loading (ETL) tool Weight (pounds) 6 10 Data Warehouse Source Systems ETL tools extraheren de data van de bron systemen (operationeel, extern), transformeren de data naar een gemeenschappelijk formaat, en laden de data vervolgens in het doelsysteem (data warehouse)

4 Bijdrage in de analysefase van een beslissingsproces Inzetten van tools voor OLAP en Data Mining Data Warehouse DB DSS Post-processing kennis managers Query’s rapporten OLAP Data mining

Data Warehouse Usage Three kinds of data warehouse applications Information processing supports querying, basic statistical analysis, and reporting using crosstabs, tables, charts and graphs Analytical processing multidimensional analysis of data warehouse data supports basic OLAP operations, slice-dice, drilling, pivoting Data mining knowledge discovery from hidden patterns supports associations, constructing analytical models, performing classification and prediction, and presenting the mining results using visualization tools. Differences among the three tasks

On Line Analytical Processing (OLAP) Interactieve analyse van grote hoeveelheden multidimensionele data typisch afkomstig van een data warehouse of data mart

Multidimensionale analyses Maand Product Filiaal aantallen verkocht van product 68 in filiaal 07 overheen maand 10

Multidimensioneel data model: OLAP kubus Sales Fact Atlanta Chicago Sales Region Dimension Denver Grapes Cherries Dallas Melons Apples Q1 Q2 Q3 Q4 Time Dimension

Multidimensionele data analyse Product Manager’s View Regional Manager’s View Product Time Region Financial Manager’s View Ad Hoc View

Cube or Pivot Table Date Region Product Product – Chocolate Date – May 2004 Region – South East Date Measure – Sales Region Product How much Chocolate did we sell in the South East in May 2004?

OLAP: on-line analytical processing Een systeem waarmee het mogelijk is om gegevens in het DW op een interactieve wijze te analyseren en de resultaten van de analyses grafisch te tonen (-> OLAP-tools). Er moet iets worden berekend: omzet of verkochte hoeveelheden, winstmarges De resultaten van de berekeningen worden uitgesplitst naar dimensies (conform de analyses die men wil maken) tijd, product, klant, regio,... Dimensies kunnen een hiërarchische structuur hebben. Bij de analyse kunnen allerlei functies gebruikt worden.

water bruis verpakking glas eerste kwartaal 2004 Totale omzet Product water bruis verpakking glas eerste kwartaal 2004 en tweede kwartaal 2006 versus water bruis verpakking plastic en tweede kwartaal 2004 functie berekening Analyse Dimensies: product tijd

Kruistabellen (Pivot tables) Kruistabellen laten toe om interactief geaggregeerde data te herschikken en te manipuleren aan de hand van een twee-dimensionele tabel

OLAP operaties Roll-up Drill down Slicing Dicing Total sales Total sales per city Total sales per city per store Total sales per city per store per month ... Slicing Neem een horizontale of vertikale snede van de kubus Sales data for product X Sales data for store A Dicing Sales data for products X and Y, in stores A and B, during the summer Roll-up

Operations in Multidimensional Model Aggregation (roll-up) aggregate (summarize) data to the next higher dimension element e.g., total sales by city, year  total sales by region, year Navigation to detailed data (drill-down) Selection (slice) defines a subcube e.g., sales where city =‘Gainesville’ and date = ‘1/15/90’ Calculation and ranking e.g., top 3% of cities by average income Visualization operations

(example by Alan Abrahams) OLAP beperkingen Step 1 What is driving sales of walking sticks? Step 1: View some OLAP graphs: e.g. walking stick sales by state Step 2: Noticing that Florida has high sales you decide to investigate further. You click on the Florida pie-slice and view walking stick sales in Florida by age. (Before OLAP, you would have to have written a very complex SQL query instead of just simply clicking to drill-down). It seems that old people are responsible for most walking stick sales. You confirm this by viewing a chart of age distributions by state. But imagine if you had to do this manual investigation for all of the 10,000 products in your range! Here, OLAP gives way to data mining… Step 2 (example by Alan Abrahams)

Querying en OLAP Query en reporting OLAP Je weet precies wat je zoekt SQL OLAP geavanceerde query and reporting Multi-dimensionele analyse Mooie visualisatie, data kubussen, drill-down, roll-up, slice and dice, ... SELECT A1 , A2 , … , An FROM R1 , R2 , … , Rm WHERE <conditions> De eindgebruiker stuurt het kennisontdekkingsproces !

OLAP is verificatie-gebaseerd. Je moet zelf de dimensies aangeven (product, klant, tijd, locatie, ...) en zelf bepalen welke verbanden er moeten worden onderzocht (bv. de evolutie in de omzet van een product, overheen een bepaalde periode, en vergeleken voor verschillende locaties).

Architecture Source Systems Data Warehouse ERP CRM Data Marts Legacy Query and (Multidimensional) Analysis (OLAP, Mining) Reporting Dashboards Performance management Source Systems Client/ Notification Portal Score cards Data Warehouse ERP CRM Data Marts Legacy Other Data Extract Transform Load (ETL) External Metadata

Cubes, Visualisations, Pivot tables, Web access, Maps Reporting & Analysis Cubes, Visualisations, Pivot tables, Web access, Maps

Drill-down

Enterprise Reporting 1. Balanced Scorecard 2. Digital dashboard Analytic applications that offer ready-made report templates for industry-specific metrics and thresholds for alerts (Mission critical) 1. Balanced Scorecard 2. Digital dashboard 3. Corporate Performance Management (CPM) i. CRM Analytics ii. Financial analysis iii. Supply chain intelligence (SCI) 4. Enterprise analytics 5. Business Activity Monitoring (BAM) Also: IT operations: IT’s own scorecards

Digital dashboard (Business Objects)

Business Intelligence Business Intelligence (BI) Enterprise performance management (EPM) SLA Supply chain intelligence Operational intelligence Customer intelligence (analytical CRM) Operational Systems Supplier relationship management (SRM) Enterprise resource planning (ERP) Customer relationship management (operational CRM)