Big Data

5e editie
U ontvangt een
iPad Air met
het digitale
lesmateriaal
Big Data
Fundamentals
Diepgaande introductie opleiding voor
een succesvolle implementatie van uw Big Data project
• Ontwikkel slimme data-producten voor new business
development
• Ontdek de potentie van big data tools als MapReduce,
Hadoop en andere methodieken
• Maak kennis met geavanceerde analyse technieken
vanuit data mining
• Benut de hands-on kennis van bol.com om uw eigen big
data roadmap vorm te geven
Data: 31 oktober, 13 & 27 november, 11 & 18 december 2014
Locatie: Coengebouw, Amsterdam
In samenwerking met
www.iir.nl/opleiding_bigdata
Doel & resultaat
De verkorte opleiding Big Data Fundamentals geeft u een volledige en toepasbare introductie van de impact van big data
binnen uw organisatie. Zowel praktisch als theoretisch komen
alle aspecten van A tot Z aan bod. Benut deze opleiding als
springplank om uw eigen big data team samen te stellen en uw
project vorm te geven.
Na afronding van deze opleiding;
1. beschikt u over allround kennis die u nodig heeft om een realistische inschatting te maken van de impact en mogelijkheden van
big data in uw organisatie
2. heeft u kennis gemaakt met verschillende toepassingen en
tools voor het verzamelen, opslaan, analyseren en visualiseren
van grote en ongestructureerde databestanden
3. beschikt u over de juiste handvaten om als project manager Big
Data uw eigen big data projecten te ontwerpen en te leiden
Uw voordelen op een rij
Module opbouw
De tweewekelijkse opbouw van het programma stelt u in staat
om deze opleiding eenvoudig te combineren met uw dagelijkse
werkzaamheden. Daarbij creëert deze opbouw voor u de ruimte
om vragen te stellen die tussentijds op de werkvloer naar boven
zijn gekomen.
Compacte kennis
In slechts vijf dagen ontwikkelt u zich tot project manager Big
Data om goed beslagen ten ijs te komen bij de implementatie van
uw big data project. Doe de kennis op die u nodig heeft om een
realistische inschatting te maken van de impact en mogelijkheden
van big data.
Interactief programma
Naast gedegen theoretische kennisoverdracht gaat u ook zelf aan
de slag. U wordt zelf voor de uitdaging gesteld om aan de slag
te gaan met een praktijk case en u sluit de opleiding af met een
individuele opdracht.
www.iir.nl/opleiding_bigdata
Module I Data verzamelen voor uw Big Data project
Big Data kenmerkt zich door grote hoeveelheden gestructureerde én ongestructureerde
data. In deze module leert u hoe u de relevante data verzamelt vanuit een breed spectrum van bronnen en welke tools u hiervoor in zet. Aan de hand van de doelstellingen
van het Big Data project leert u wat de belangrijkste data is die u moet verzamelen.
09:00 Introductie big data
• Inleidend kader: wat is big data en waarom is het van belang?
Gestructureerde data: combineren en filteren van uw databases
innen uw organisatie heeft u te maken met verschillende type databases van
B
verschillende groottes. In deze sessie gaan we kijken welke kansen er liggen in de
informatie die u al heeft in uw organisatie.
• wat zijn de verschillende type databases?
• hoe past u uw big data vraag in bestaande datawarehousing omgevingen?
• hoe vertaalt u uw business vraag in bruikbare datasets vanuit de verschillende bronnen?
• hoe combineert u verschillende typen gestructureerde data?
• hoe maakt u deze data werkbaar?
• hoe bewaakt u de datakwaliteit?
12:30 Lunch
13:30 Ongestructureerde data en social data verzamelen
• Wat is nou precies ongestructureerde data en waarom gebruiken we steeds meer
ongestructureerde data?
• Welke nieuwe uitdagingen brengt ongestructureerde data met zich mee t.o.v.
gestructureerde data?
• Welke vormen van ongestructureerde data zijn interessant en/of komen vaak voor?
• Hoe transformeert u ongestructureerde data naar een vorm die te analyseren is?
Specifieke vorm: social data
• Welke informatie kunt u uit social data halen? Waarom is deze data interessant?
• Hoe stellen social media (en andere bronnen) social data beschikbaar? Hoe verkrijgt u
deze data?
Opdracht - Specifieke toepassing: data collectie
U gaat zelf aan de slag om social data te verzamelen. De verzamelde data zal
getransformeerd moeten worden naar een bruikbare vorm. Dit kunt u zelf doen, maar
tevens zal er een simpele tooling beschikbaar zijn om dit uit te voeren. Deze opdracht
dient ter voorbereiding op Module III over data mining en Gephi tooling.
Koen Penders, Business Consultant Online Analytics, Adversitement
17:00 Einde programma
Inclusief interactieve leeromgeving
Alle presentaties, video’s, artikelen en huiswerk staan op onze online leeromgeving.
Zo heeft u alle cursusinformatie op één plek! Ook kunt u hier makkelijk contact
houden met andere deelnemers, of vragen stellen aan uw docent.
Inhoudelijk contact met uw opleidings-adviseur?
Neem dan contact op met onze opleidings-adviseur Jeremy Stevens
via 020 – 58 05 455 of stuur een e-mail naar [email protected]
Informeer ook naar de mogelijkheden voor groepskorting
www.iir.nl/opleiding_bigdata
Module II Techniek: Big Data Tools
Een overzicht met technische tint van Hadoop en NoSQL gerelateerde thema’s.
Aan de hand van praktijk gerelateerde voorbeelden leert u over verschillende
technologieën en programmeermodellen om data te ontsluiten.
09:00 Parallel rekenen: het datacenter is uw computer
• Horizontaal en verticaal opschalen
• Wat is er nieuw aan Hadoop?
- De MapReduce abstractie
- Het Hadoop Distributed File System
- De hype voorbij: voor welke type cases werkt het nou echt?
• Investeren in kennis en informatie: wat is de rol van de data scientist?
• Het ecosysteem Hadoop : Pig, Hive and HBase
Machiel Jansen, Groupleader eScience & cloud services, SURFsara
12:30 Lunch
13:30 NoSQL
• NoSQL vs tradionele SQL databases aan de hand van het ACID model
• Sharding: het opdelen van data voor fout tolerantie of betere performance
• Overzicht NoSQL databases: wat gebruik ik wanneer?
• CouchDB demo: opschalen naar miljoenen taken
• NoSQL ecosysteem
• Vergelijking ‘database as a service’ diensten zoals Amazon’s S3
• uitkomst innovatie projecten
Jan Bot, Adviseur, SURFsara
17:00 Einde programma
Ook InCompany
Wilt u deze opleiding voor uw gehele afdeling volgen? Vanaf 5 personen
kunt u deze training InCompany volgen. Het programma wordt specifiek
afgestemd op uw organisatie, in overleg wordt een datum, locatie en
tijdstip bepaald. Een ander voordeel van een InCompany traject is dat uw
hele team hetzelfde niveau bereikt en u tegelijkertijd aan teambuilding
werkt.
Neem voor inhoudelijke informatie vrijblijvend contact op met onze adviseur
Saskia van Berkel: tel. 020 - 58 05 440 of stuur een e-mail naar [email protected]
ICT Academy
De IIR ICT Academy leidt jaarlijks honderden professionals op. Onze
trainingen variëren van 1-daagse workshops tot uitgebreide verkorte opleidingen.
Tijdens onze trainingen is daarom altijd veel ruimte om te sparren met uw
vakgenoten. Zo leert u niet alleen van onze topdocenten, maar ook van elkaar!
Bekijk het aanbod van alle ICT opleidingen op www.iir.nl/ict
www.iir.nl/opleiding_bigdata
Module III Analyse: data mining
09:00 Data Mining in het (big data) analytics proces
• Hoe valt data mining in het (big data) analytics proces
- Introductie data mining; supervised data mining, unsupervised data mining en
association learning
• Het data mining proces: welke stappen zijn er nodig om van vraagstuk naar antwoord te
komen?
1. Vraagstuk
2. Information retrieval
3. Data transformatie
4. Feature extraction
5. Mining; model constructie & training, test en validatie stappen
6. Evaluatie model
7. Toepassing model
• Hoe rijmen data mining en big data zich?
- Data mining op ongestructureerde data; tekstuele en logging data
• Laatste ontwikkelingen in data mining
12:30 Lunch
13:30 Aan de slag met data mining en social data
• Leg uw eigen use case voor; op welke manier kunt u hier mee aan de slag? De docent
gebruikt uw use case om data mining op social data toe te passen.
Opdracht - specifieke toepassing: data collectie
• Data mining op social data met de data die u tijdens de eerste dag heeft verzameld
• Gebruik van de tool Gephi; algoritmen in Gephi en betekenis daarvan
• Gewenste uitkomsten vanuit Gephi
Conceptuele afronding
• Terugkoppeling plek data mining binnen het (big data) analytics proces
• ‘The art of data mining’; het belang en de moeilijkheid van deze stap
Koen Penders, Business Consultant Online Analytics, Adversitement
17:00 Einde programma
Deze bedrijven gingen u voor:
• ABN AMRO BANK
• ABZ NEDERLAND
• AGRIMORE
• ANDARR
• ARISTO MUSIC TECHNOLOGY
• BDO HOLDING
• BOL.COM
• CENDRIS
• DBC ONDERHOUD
• DELA HOLDING
• ESSENT IT
• FINAVISTA
• FRIESLAND BANK
• GEMEENTE HAARLEMMERMEER
• GFK
• HOGESCHOOL WINDESHEIM
• INERGY ANALYCITAL SOLUTIONS
• ING BANK
• INTERNATIONAL FLAVORS & FRAGRANCES IFF
• KAMPHUISGROEP
• KLPD
• KPN
• MARKETING QUEENS
• MINISTERIE VAN DEFENSIE
• MN
• NATIONALE NEDERLANDEN
• PETER APPEL TRANSPORT
• RABOBANK NEDERLAND
• RDW (RIJKSDIENST VOOR
• HET WEGVERKEER)
• RED DATA
• SAXION ENSCHEDE
• SNS BANK
• UNIVERSITEIT VAN AMSTERDAM
• USG PEOPLE
• UWV
• VAN LANSCHOT BANKIERS
• WEGENER MEDIA
• WINDESHEIM FLEVOLAND
• ZIGGO
www.iir.nl/opleiding_bigdata
Module IV Praktijkdag: bol.com big data case
Nadat u op basis van uw business vraag de belangrijkste data hebt verzameld en
geanalyseerd, is het inzichtelijk maken van de data de volgende onmisbare stap. Met een
scherpe visualisatie communiceert u op overtuigende wijze uw bevindingen naar de rest
van de business en weet u aan te zetten tot de juiste beslissingen.
09:00 Case: Big Data bij bol.com
• The long tail; big data als business strategie
• Hoeveelheden data bij bol.com
• Clickstream
• Schaalbaarheid
• De business case: big data toepassingen bij bol.com
12:30 Lunch
13:30 Hadoop cluster en analyse in de praktijk
Tijdens deze praktijk middag gaat u zelf aan de slag met Hadoop. Hierin zult u ervaren hoe
diverse tools op Hadoop gebruikt kunnen worden ter ondersteuning van data analyse. Na
de training kunt u verder experimenteren met het Hadoop cluster dat u tijdens de training zult installeren en gebruiken.
Edith Kanters, IT architect, bol.com
17:00 Einde programma
Module V Visualisatie & business case
In deze laatste module wordt alle kennis samengebracht en gaat u een Big Data
project vormgeven. Alle belangrijkste stappen komen aan bod, van het formuleren
van de juiste business case en, het gebruiken en bewerken van de databronnen om te
komen tot een data driven strategie.
09:00 Data visualisatie
Het overtuigend visualiseren van data is onmisbaar in elk Big Data project. Tijdens deze
module wordt op basis van de achterliggende theorie bekeken wat de rol is van informatie
visualisatie binnen Big Data projecten.
De volgende onderwerpen zullen o.a. de revue passeren:
• Waarom is het zinvol om visualisatie in te zetten wanneer je met data werkt?
• Op welke manieren kun je data visualisatie inzetten?
• Hoe evalueer je een visualisatie?
• Welke tools kun je gebruiken voor het visualiseren van data?
Joshua de Haseth, Information Analyst, Provincie Flevoland
12:30 Lunch
13:30 Ontwerp een Big Data business case
• Toepassing (big data) analytics proces in de praktijk
• Problematiek en uitdagingen in de praktijk; keuze tooling en aanpak
• Samenvatting opdracht
- Bespreken resultaten en uitkomsten
- Reflectie van het proces dat de deelnemers hebben doorlopen naar het (big data)
analytics proces
• Uitwerking van de verschillende use cases
• Roundup
Koen Penders, Business Consultant Online Analytics, Adversitement
17:00 Einde programma
www.iir.nl/opleiding_bigdata
Deze opleiding is ontwikkeld voor:
Werkzaam bij:
• Informatie managers
• Business/ data analisten
• Database professionals en database managers
• Business intelligence managers
• Business developers met een achtergrond in IT
• Overheid
• Retailers
• Financiële instellingen
• Energiebedrijven
• Telecombedrijven
• Industrie
• Onderwijsinstellingen
Uw docenten
Koen Penders
Koen Penders werkt als Head of Innovation bij Adversitement. Hij studeerde Business
Information Systems aan de Technische Universiteit Eindhoven met als specialisatie
Data Mining. Bij Adversitement ontwikkelde hij zich tot een allround expert in online
analytics met ruime ervaring in omvangrijke en complexe webanalyticsintegraties. Zo
werkte hij voor onder andere ING, Vodafone en bol.com. Daarnaast beschikt hij over een
uitgebreid track record op het gebied van omnichannel marketing en procesbegeleiding
om organisaties te helpen een data driven cultuur te realiseren.
Jan Bot
Jan Bot werkt als adviseur bij de eScience & Cloud services group van van SURFsara,
het Nederlandse HPC center. Hij studeerde Bioinformatica bij de TU Delft &
Universiteit Leiden. Hij werkt veel met de Dutch Life Science Grid en heeft zijn eigen
distributiesysteem ontwikkeld op basis van CouchDB. Hij heeft de SURFnet Enlighten
Your Research 3 competitie gewonnen en werkt als e-Architect binnen het e-BioGrid
programma.
Machiel Jansen
Machiel Jansen is groepsleider van de groep eScience & cloud services bij SURFsara.
SURFsara biedt hoogwaardige High Performance Computing (HPC) diensten, waarbij
Hadoop al enkele jaren een belangrijk onderdeel van de infrastructuur is. Machiel
promoveerde en doceerde aan de Universiteit van Amsterdam en was, tot hij in 2007 bij
SARA in dienst trad, werkzaam bij Gridline BV en Collexis BV als technisch consultant op
het gebied van ‘information retrieval’ en natuurlijke taal verwerkende software.
Edith Kanters
Edith Kanters is IT Architect bij bol.com. Haar werkervaring bevindt zich op de
gebieden: website personalisatie, business intelligence, datamining, data warehousing,
campaigning en promoting. Edith studeerde Technische Bedrijfswetenschappen aan
de Rijksuniversiteit Groningen en houdt zich al sinds 1997 bezig met data analyse ten
behoeve van multichannel marketing bij een brede klantengroep. Daarnaast heeft Edith
ruime ervaring met het geven van trainingen en workshops
Joshua de Haseth
Joshua de Haseth is ruim 11 jaar werkzaam bij de provincie Flevoland als
beleidsonderzoeker en informatieanalist. In zijn werk gebruikt Joshua datavisualisatie
voor het analyseren en communiceren van overheidsinformatie. Van grafieken in een
rapport voor intern gebruik tot interactieve visualisaties op het internet voor de politiek
en burger. Omdat er op het gebied van data visualisatie veel winst te behalen is deelt hij
daarom graag zijn kennis in de context van overheid en business.
www.iir.nl/opleiding_bigdata
www.iir.nl/opleiding_bigdata
IIR B.V., Kabelweg 37, 1014 BA Amsterdam:
Meld u aan met uw VIPcode:
Aanmelden
Meld u aan voor de verkorte opleiding Big Data Fundamentals
in Amsterdam. Inclusief iPad Air
3 makkelijke manieren om u aan te melden:
1. Via internet: www.iir.nl/opleiding_bigdata
2. Stuur een e-mail naar [email protected]
3. Bel Lorelei Mendoza van customer service: 020 - 580 5400
5-daagse opleiding
Inclusief
iPad Air met
digitaal
lesmateriaal!
€ 4.299,-
Alle prijzen zijn per persoon en exclusief BTW en inclusief documentatie, koffie/thee en lunch.
Wilt u een eigen tablet of laptop meenemen naar de opleiding? Dan ontvangt u € 300,- korting.
Blijf op de hoogte via social media:
Word lid van de IIR LinkedIn groep Big Data Forum en discussieer mee
Volg @Data_Academy en blijf op de hoogte van het laatste nieuws
Scan deze code met uw smartphone en bezoek direct de website van deze
opleiding
Gegevensregistratie
Uw gegevens worden door IIR geregistreerd en gebruikt om u op de hoogte te houden van onze producten en die van zorgvuldig
geselecteerde bedrijven. Mochten uw gegevens niet correct zijn of wenst u dat uw gegevens niet gebruikt wordt voor deze doeleinden, neem dan contact op met onze database afdeling op 020 - 580 5470 of e-mail [email protected]
Algemene voorwaarden
Op alle aanbiedingen zijn onze algemene voorwaarden van toepassing. Deze zijn gedeponeerd bij de K.v.K te Amsterdam, onder
nummer 33200358. De algemene voorwaarden zijn te downloaden op onze website www.iir.nl/algemene_voorwaarden en worden
op verzoek kosteloos toegezonden.
www.iir.nl/opleiding_bigdata