E-Discovery van on + gestructureerde bedrijfsdata

13-6-2014
E-Discovery van
on + gestructureerde
bedrijfsdata
Forensic Technology Solutions
Overzicht
1.
Process mining – voor gestructureerde data
2. Ongestructureerde informatie … of is het?
3. Process mining – voor on + gestructureerde data
PwC
1
13-6-2014
Motivatie
PwC
Process mining
PwC
2
13-6-2014
Process mining – voorbeeld: ERP
PwC
Jans et. al (2010)
Process mining – in een notendop
PwC
http://www.win.tue.nl/ieeetfpm/
3
13-6-2014
Process mining – wat heb je nodig?
Het toepassen van process mining technieken vereist (slechts) drie
eisen aan de dataset:
1
2
3
Unieke identificering van een case die door het proces loopt
(bijv. persoon ID, produkt ID, case ID)
Unieke identificering van een status waarin een case zich kan
bevinden (bijv. login, stock request, place order, check out)
Een tijdstempel
PwC
Process mining – methodologie
PwC
Van der Aalst (2011)
4
13-6-2014
Ongestructureerde data
PwC
Ongestructureerde data – misconcepties
“Bills on ports and immigration were
submitted by Senator Brownback,
Republican of Kansas”
1. natuurlijke taal
=
zeer gestructureerd!
http://nlp.stanford.edu/
PwC
5
13-6-2014
Ongestructureerde data – misconcepties
2. tekst
(bag-of-words)
=
gestructureerd!
PwC
Ongestructureerde data – misconcepties
3. meta-data
=
zeer gestructureerd!
PwC
6
13-6-2014
Ongestructureerde data – misconcepties
... et cetera?
PwC
Process mining on + gestructureerde data
3
1
administratie
4
2
emails
PwC
7
13-6-2014
Process mining on + gestructureerde data
Stappenplan:
1.
Gestructureerde data -> log bestand
 veel systemen hebben standaard deze mogelijkheid
2. Log bestand -> procesmodel
 dit kunnen we doen met ‘standaard’ process mining
PwC
Process mining on + gestructureerde data
Stappenplan:
3. Ongestructureerde data -> (log) bestand
? verschillende niveaus
4. Log bestand -> procesmodel
 integreer met gestructureerd deel
PwC
8
13-6-2014
Process mining on + gestructureerde data
Ongestructureerde data -> (log) bestand, verschillende niveaus:
Herinner: we hebben slechts case, status en tijdstempel nodig.
•
Metadata
•
•
2012-mrt-31 09:16:981, belt_met, pieter, arie
Tekst (bag-of-words)
•
2012-mrt-31 10:46:911, leest_website(‘fraude’:3, ‘postbedrijf’:2),
84.86.183.171, pieter
PwC
Process mining on + gestructureerde data
Ongestructureerde data -> (log) bestand, verschillende niveaus:
Herinner: we hebben slechts case, status en tijdstempel nodig.
•
Natuurlijke taal (semantiek)
•
•
2012-mrt-31 12:10:101, stuurt_email(<van:pieter>, <aan:jan>,
<betreft:alarm>), 84.86.183.171, pieter
Natuurlijke taal (grammatica)
•
2012-mrt-31 15:50:731,
ontvangt_email(<verb:verwachten>,<subject:pieter>,<subject:pr
oblemen>), 84.86.154.89, pieter
PwC
9
13-6-2014
Process mining on + gestructureerde data
Lessons learned:
•
Het is belangrijk om de cases in beide delen consistent te houden
•
Houd de tijdschalen consistent in beide delen
•
Status is ook belangrijk, maar minder impact
•
Bedenk (vooraf) een consistente ontologie voor case en status
•
Durf gestructureerd deel aan te passen!
PwC
E-Discovery: analytics van meer dan alleen data...
PwC
10
13-6-2014
Bedankt voor uw aandacht
Foto
Gerwin Naber
Martijn Schut
Partner
 +31 88 79 2 63 02
 +31 6 5150 7575
 [email protected]
Senior manager
 +31 88 79 2 16 61
 +31 6 1263 4033
 [email protected]
Forensic Technology Solutions
Forensic Technology Solutions
PwC
21
© 2014 PwC. All rights reserved. Not for further distribution without the permission of PwC. "PwC" refers to the network of member firms of
PricewaterhouseCoopers International Limited (PwCIL), or, as the context requires, individual member firms of the PwC network. Each
member firm is a separate legal entity and does not act as agent of PwCIL or any other member firm. PwCIL does not provide any services to
clients. PwCIL is not responsible or liable for the acts or omissions of any of its member firms nor can it control the exercise of their
professional judgment or bind them in any way. No member firm is responsible or liable for the acts or omissions of any other member firm
nor can it control the exercise of another member firm's professional judgment or bind another member firm or PwCIL in any way.
PwC
11