4.980,- (excl. btw)
Virtual Classroom
NCOI Learning
10
>> Boek van deze opleiding de editie die plaats vindt tussen 1/10/23 en 30/06/24 en krijg een gratis Coolblue waardebon van € 50, zolang de voorraad strekt. Info en voorwaarden lees je op deze pagina.
Analist is een knelpuntberoep, mede door het feit dat het een vrij nieuw beroep is waarvoor het aanbod zeer beperkt is in hogere studies. Het gevolg is dat veel organisaties het moeilijk hebben om goed opgeleide Data- en BI analisten te vinden. Statistiek, data blending en datavisualisatie behoren tot de kerncompetenties, maar goede communicatieve vaardigheden, het kunnen organiseren van BI en data governance, het opstellen van business cases en consultancyvaardigheden zijn ook van groot belang in deze functie. Deze 10-daagse opleiding tot Data Analist is bedoeld voor iedereen zich wil verdiepen in data analyse, de theorie van data analyse in de dagelijkse praktijk wil brengen en een boost wil geven aan zijn of haar carrière.
Er wordt veel verwacht van een data analist. Aan data analyse 'doen' betekent zoveel meer dan alleen programmeren in R. In deze opleiding volg je de verschillende stappen die worden uitgevoerd in een data-analyseproject:
Per onderwerp wordt voor elke fase gekeken naar de verschillende taken die een data analist uitvoert.
Deze opleiding is een abolute must voor elke professional die een rol als data analist ambieert. Het is duidelijk dat in een wereld die even turbulent is als degene waarin we ons nu bevinden, deze data scientists uit alle hoeken van de onderneming kunnen komen. Bijvoorbeeld:
Het doel van deze opleiding is om een breed kader te schetsen waarop je kan verder bouwen aan de vereiste expertskills.
Deze opleiding is dus niet geschikt voor professionals die opgeleid willen worden tot R- of Python-expert/programmeur, professor in de statistiek of datatoolgebaseerd expert.
Dag 1 - voormiddag: Je actieplan opstellen en data verzamelen
Kaderen van de rol van de data analist en stilstaan bij de hard en soft skills die van hem of haar verwacht worden. Op die manier wordt de structuur duidelijk waarop de rest van de opleiding gebaseerd is. Daarna volgt een introductie van de case die tijdens de opleiding als rode draad wordt gebruikt om de onderwerpen praktisch in te vullen. Laatste deel: antwoorden op vragen als: Waar kan je gegevens vinden? Hoe kan je er toegang toe krijgen? Ben je vrij om ze commercieel te gebruiken? Dit is concreet de 1e fase van elk data-analyseproject en wordt als dusdanig onmiddellijk toegepast op de dataset die je doorheen deze opleiding gebruikt.
Trainer: Sven Vermeulen
Dag 1 - namiddag: Databases
Vooraleer je te verdiepen in de data zelf, is het noodzakelijk om een sterke theoretische basis te hebben. Enkel zo kan je je kansen op succes, en daarbij de kwaliteit van de resultaten, maximaliseren. Een essentieel theoretisch element is het belang van en de mogelijke soorten databases.
Trainer: Sven Vermeulen
Dag 2: BigData & (No)SQL: overzicht
In dit gedeelte maak je kennis met de complexiteit van de big data-wereld en de manier waarop we ermee omgaan. Je bestudeert het ontwerp van de relationele database die nodig is voor de case en bekijkt enkele alternatieve NoSQL-indelingen om een deel van de informatie op te slaan. Tot slot vergelijk je de verschillende alternatieven.
Trainer: Ann Van Eyken
Dag 3: Preprocessing data
In dit gedeelte leer je hoe je van een vervuilde en onvolledige dataset een schone dataset maakt die klaar is voor analyse. Je leert over opschonen, integreren, transformeren, reduceren en discretiseren van onbewerkte gegevens, zowel in theorie als in de praktijk.
Gedurende deze dag gebruik je voornamelijk de tool OpenRefine om de ruwe data van de case voor te bereiden.
Trainer: Ann Van Eyken
Dag 4: Business Intelligence
In dit gedeelte leer je waarom BI waardevol is, wie je nodig hebt in je team en waar je moet beginnen. Je praat over data warehousing en dimensioneel modelleren en waarom het zo belangrijk is.
Ten slotte ontwerp je een dimensionaal model voor de case en extraheer, laad en transformeer je de gegevens die je tot nu toe hebt gevonden en verwerk je deze in een datawarehouse.
Trainer: Ann Van Eyken
Dag 5: Kennismaking met R
R verwijst naar een open-sourceprogrammeertaal en softwareomgeving en is zeer relevant in de context van datamining en statistiek.
Je geraakt op weg met R, de basisbeginselen en ziet een aantal geavanceerde functies. Je gebruikt R om enkele modellen voor de dataset in de case te bouwen en probeert ook een aantal voorspellingen te doen.
Trainer: Ann Van Eyken
Dag 6: Statistiek
Een gefundeerde beslissing maken over welke tests kunnen leiden tot nuttige en relevante resultaten, is heel belangrijk. Daarbij mag statistiek niet ontbreken. Door een dag de tijd te nemen om de onderdelen te bespreken die bepalen hoe statistische principes leiden tot specifieke soorten tests, kan je als data analist op een gefundeerde manier keuzes maken als je naar de effectieve implementatie van je analyse overgaat.
Trainer: Sven Vermeulen
Dag 7 en dag 8 - voormiddag: Data Mining
Datamining is het proces waarbij patronen in datasets worden herkend. In dit gedeelte onderzoek je verschillende soorten patronen en pas je ze toe op de businessvragen. Bijvoorbeeld: het vinden van verschillende klantengroepen, het voorspellen van churn of het ontdekken van een bepaalde frequentie van sets. Je gebruikt een tool om enkele relevante algoritmes toe te passen.
Trainer: Ann Van Eyken
Dag 8 - namiddag: EDA in R
EDA of Exploratory Data Analysis is de fase waarin je voor het eerst de data onder de loep neemt vanuit een descriptief standpunt. De essentie van deze stap is om de eigenschappen van de dataset te begrijpen en zo de verdere analyse een meer geschikte vorm te geven. In dit onderdeel combineer je R, dat op dag 5 aan bod komt, met de theoretische benadering in de voormiddag en pas je het toe op de case.
Trainer: Sven Vermeulen
Dag 9: Kennismaking met Python
Python is een open-sourceprogrammeertaal waarbij simpliciteit en leesbaarheid van de code centraal staan. Daarnaast bestaat er een heel gamma aan packages die specifiek zijn toegespitst op data analyse. Om die reden is Python onmisbaar in de toolkit van elke data analist.
Gedurende de dag maak je kennis met de basisbeginselen van programmeren in Python, maar ook met de meest gebruikte packages voor data analyse.
Trainer: Glenn De Ranter
Dag 10 - voormiddag: Datavisualisatie
Als je het punt bereikt waar je de gevormde inzichten kan communiceren naar de klant, moet je beslissen welke visualisaties hiervoor het meest geschikt zijn. Niet elke grafieksoort of infographic draagt dezelfde boodschap. Het kan daarom schadelijk zijn om in de laatste fases toch nog de verkeerde keuzes te maken, ondanks alle moeite die ervoor in het project werd gestopt. De essentie van elk project blijft namelijk dat je de klant moeten kunnen overtuigen om de inzichten om te zetten naar actie. In het eerste onderdeel van deze voormiddag krijg je vanuit de theorie een overzicht van de belangrijkste visualisaties en hun eigenschappen.
Dat wordt opnieuw praktisch ingevuld door de case om te zetten naar een Power BI-dashboard. In het tweede onderdeel van de voormiddag bespreek je de werking van Power BI en hoe het kan worden gebruikt om inzichten weer te geven op een overzichtelijke manier.
Trainer: Sven Vermeulen
Dag 10 - namiddag: Visualisaties in Python
In de namiddag gaat het verder over visualisaties, maar dan in Python. Ook hier onderzoek je de manieren waarmee je data en bevindingen kan voorstellen met allerhande grafieken. Je leert hoe je de meest gebruikte grafieken kan tekenen in Python en hoe je ze in een mooi overzicht toont aan de klant via Jupyter Notebooks in samenwerking met de visualisatiepackage matplotlib.
Trainer: Glenn De Ranter
De opleidingen komen in aanmerking voor verschillende subsidies. Handig: zo betaal je zelf maar een deel van het inschrijvingsgeld.
Gelieve je laptop mee te brengen naar deze opleiding. Zo garanderen wij je het maximum leerresultaat.