Programma
Dag 1
1. Het data analyse-proces
Begrijp de vraag, vind de gegevens, sla de gegevens op, verken, analyseer, visualiseer en communiceer je resultaten
2. Inzicht in de vraag
Wat voor soort vragen kan je stellen en wat het doel van het data analyse project of de opdracht?
3. De data vinden
Open data, Google Search, Google Public Data, OCR, en web scraping.
4. De data opslaan
Verschillende soorten databases (hiërarchisch, netwerk, relationeel, key-value, document, kolom-georiënteerd, en graaf) worden geïntroduceerd.
5. Opschonen van de gegevens
Opschonen, integreren, transformeren, reduceren en discretiseren. OpenRefine wordt hierbij als tool geïntroduceerd om je data op te schonen.
Dag 2
6. De gegevens onderzoeken
De grondbeginselen van de statistiek: gemiddelde, variantie, standaardafwijking, scheefheid, kurtosis, en correlatie. Introductie van RStudio, een (gratis) software-applicatie voor statistische berekeningen en grafieken.
7. De gegevens grondig analyseren
De basisconcepten van Business Intelligence (bv. OLAP, OLTP, en ETL) en Data Mining (bv. generalisatie, over-fitting, ID3, C4.5, en K-means) worden besproken.
8. Visualiseren van de resultaten
Best-practices om de data te visualiseren worden besproken. PowerBI wordt geïntroduceerd als een tool om de resultaten te visualiseren.
9. Het verhaal vertellen
We hebben data gevonden, opgeschoond, geanalyseerd en gevisualiseerd, maar hoe vertellen we ons verhaal aan de stakeholders? Best-practices worden besproken op basis van het SCQA-acroniem (Situation, Complication, Question, Answer).