13-6-2014 E-Discovery van on + gestructureerde bedrijfsdata Forensic Technology Solutions Overzicht 1. Process mining – voor gestructureerde data 2. Ongestructureerde informatie … of is het? 3. Process mining – voor on + gestructureerde data PwC 1 13-6-2014 Motivatie PwC Process mining PwC 2 13-6-2014 Process mining – voorbeeld: ERP PwC Jans et. al (2010) Process mining – in een notendop PwC http://www.win.tue.nl/ieeetfpm/ 3 13-6-2014 Process mining – wat heb je nodig? Het toepassen van process mining technieken vereist (slechts) drie eisen aan de dataset: 1 2 3 Unieke identificering van een case die door het proces loopt (bijv. persoon ID, produkt ID, case ID) Unieke identificering van een status waarin een case zich kan bevinden (bijv. login, stock request, place order, check out) Een tijdstempel PwC Process mining – methodologie PwC Van der Aalst (2011) 4 13-6-2014 Ongestructureerde data PwC Ongestructureerde data – misconcepties “Bills on ports and immigration were submitted by Senator Brownback, Republican of Kansas” 1. natuurlijke taal = zeer gestructureerd! http://nlp.stanford.edu/ PwC 5 13-6-2014 Ongestructureerde data – misconcepties 2. tekst (bag-of-words) = gestructureerd! PwC Ongestructureerde data – misconcepties 3. meta-data = zeer gestructureerd! PwC 6 13-6-2014 Ongestructureerde data – misconcepties ... et cetera? PwC Process mining on + gestructureerde data 3 1 administratie 4 2 emails PwC 7 13-6-2014 Process mining on + gestructureerde data Stappenplan: 1. Gestructureerde data -> log bestand veel systemen hebben standaard deze mogelijkheid 2. Log bestand -> procesmodel dit kunnen we doen met ‘standaard’ process mining PwC Process mining on + gestructureerde data Stappenplan: 3. Ongestructureerde data -> (log) bestand ? verschillende niveaus 4. Log bestand -> procesmodel integreer met gestructureerd deel PwC 8 13-6-2014 Process mining on + gestructureerde data Ongestructureerde data -> (log) bestand, verschillende niveaus: Herinner: we hebben slechts case, status en tijdstempel nodig. • Metadata • • 2012-mrt-31 09:16:981, belt_met, pieter, arie Tekst (bag-of-words) • 2012-mrt-31 10:46:911, leest_website(‘fraude’:3, ‘postbedrijf’:2), 84.86.183.171, pieter PwC Process mining on + gestructureerde data Ongestructureerde data -> (log) bestand, verschillende niveaus: Herinner: we hebben slechts case, status en tijdstempel nodig. • Natuurlijke taal (semantiek) • • 2012-mrt-31 12:10:101, stuurt_email(<van:pieter>, <aan:jan>, <betreft:alarm>), 84.86.183.171, pieter Natuurlijke taal (grammatica) • 2012-mrt-31 15:50:731, ontvangt_email(<verb:verwachten>,<subject:pieter>,<subject:pr oblemen>), 84.86.154.89, pieter PwC 9 13-6-2014 Process mining on + gestructureerde data Lessons learned: • Het is belangrijk om de cases in beide delen consistent te houden • Houd de tijdschalen consistent in beide delen • Status is ook belangrijk, maar minder impact • Bedenk (vooraf) een consistente ontologie voor case en status • Durf gestructureerd deel aan te passen! PwC E-Discovery: analytics van meer dan alleen data... PwC 10 13-6-2014 Bedankt voor uw aandacht Foto Gerwin Naber Martijn Schut Partner +31 88 79 2 63 02 +31 6 5150 7575 [email protected] Senior manager +31 88 79 2 16 61 +31 6 1263 4033 [email protected] Forensic Technology Solutions Forensic Technology Solutions PwC 21 © 2014 PwC. All rights reserved. Not for further distribution without the permission of PwC. "PwC" refers to the network of member firms of PricewaterhouseCoopers International Limited (PwCIL), or, as the context requires, individual member firms of the PwC network. Each member firm is a separate legal entity and does not act as agent of PwCIL or any other member firm. PwCIL does not provide any services to clients. PwCIL is not responsible or liable for the acts or omissions of any of its member firms nor can it control the exercise of their professional judgment or bind them in any way. No member firm is responsible or liable for the acts or omissions of any other member firm nor can it control the exercise of another member firm's professional judgment or bind another member firm or PwCIL in any way. PwC 11
© Copyright 2024 ExpyDoc