Data Science met Python
Deze cursus in het kort
- Locaties door heel Nederland
- Professionele docenten
- Inclusief certificaat
- 9.4 op Springest.nl
- Ook bij u op locatie
Python krijgt een steeds grotere rol in de wereld van data science. Een van de redenen is dat Python een general purpose programming language is. Hierdoor biedt Python mogelijkheden om modellen direct in te zetten in een bredere context. Bovendien is Python gemakkelijk om te leren.
Het belang van data-analyse en data-science is enorm toegenomen en de programmeertaal Python is hierbij een van de belangrijkste hulpmiddelen geworden. Met behulp van een aantal gespecialiseerde bibliotheken, zoals NumPy, Pandas en Matplotlib, is Python uitgegroeid tot misschien wel het belangrijkste hulpmiddel voor het analyseren en visualiseren van allerlei data.
Ook wanneer u geen ervaring heeft met Python kunt u meedoen met de cursus Data Science met Python. Tijdens de eerste dag van de training zullen wij de benodigde basisprincipes van de programmeertaal Python behandelen, die nodig zijn om later in de training de data te kunnen analyseren en te presenteren in bijvoorbeeld grafieken. Wanneer u al een ervaren Python programmeur bent, is het mogelijk om de eerste dag van de training over te slaan.
De overige drie dagen van de cursus leert u hoe u data snel en effectief kunt omzetten in bruikbare inzichten en grafieken. Hierbij maakt u gebruik van de verschillende bibliotheken in Python. U leert met NumPy snel en efficiënt data bewerken. U leert data analyseren, bewerken, manipuleren en verwerken in interactieve presentaties. Theorie en oefenopdrachten wisselen elkaar af, waardoor u het geleerde direct in de praktijk kunt brengen onder begeleiding van onze zeer ervaren docenten. Als ontwikkelomgeving wordt de Anaconda-distributie met Jupyter notebooks gebruikt.
Na afloop van de training Data Science met Python heeft u de volgende leerdoelen bereikt:
- u leert de basisprincipes van Python en hoe deze te gebruiken voor data-analyse en -manipulatie;
- u ontwikkelt vaardigheden in het verzamelen, schoonmaken en voorbereiden van datasets voor data science-projecten;
- u begrijpt en past statistische methoden en data-analysetechnieken toe met Python om waardevolle inzichten te verkrijgen;
- u verwerft kennis over het bouwen en evalueren van voorspellende modellen met behulp van populaire Python-bibliotheken zoals Pandas, NumPy, en Scikit-learn;
- u ontwikkelt praktische ervaring met het visualiseren van data en het communiceren van bevindingen met behulp van Python-tools zoals Matplotlib en Seaborn.
Cursusmateriaal en lunch zijn bij de cursus inbegrepen.
Heeft u speciale wensen? Of wilt u de cursus graag bij u op locatie volgen? Dat is mogelijk! Neem gerust contact met ons op voor de mogelijkheden.
Doelgroep
De cursus Data Science met Python is bedoeld voor data-analisten, die Python en de Python libraries willen gebruiken in data science projecten.
Voorkennis
Om aan deze cursus te kunnen deelnemen is enige kennis van en ervaring met statistiek wenselijk. De beginselen van Python worden op de eerste dag behandeld. Indien u deze kennis al heeft, kunt u de eerste dag van de cursus tegen een minderprijs overslaan. Twijfelt u of u over de juiste voorkennis beschikt, neem dan contact met ons op.
Duur
De duur van de cursus is vier dagen.
Groepsgrootte
De maximale groepsgrootte bedraagt acht personen.
Certificaat
De deelnemers krijgen na het goed doorlopen van de cursus een officieel certificaat Data Science met Python.
Tijdens de cursus worden per dag de volgende onderwerpen behandeld:
Dag 1
Als eerste worden de Python syntax-aspecten behandeld. Deze zijn belangrijk bij data science projecten. Variabelen, datatypes, functies, flow-control, comprehensions, classes, modules en packages worden besproken. Ook wordt ingegaan op de werking van de Jupyter notebooks, de IPython shell en het installeren van Python packages in Anaconda.
Dag 2
Vervolgens komt het NumPy package aan de orde, waarmee grote data sets zeer efficiënt kunnen worden verwerkt. Hierbij worden NumPy’s ndarray object en de methodes besproken. Er wordt aandacht besteed aan de verschillende array-manipulatietechnieken en speciale routines voor het ordenen, zoeken en vergelijken van data in matrices. Hierbij wordt ook de MatPilotlib library besproken. Deze is nauw geïntegreerd met NumPy en vormt een zeer krachtig instrument voor het creëren en plotten van complexe datarelaties.
Dag 3
Daarna is het de beurt aan het gebruik van Pandas voor data-analyse. De Pandas library introduceert twee nieuwe data structures in Python, die gebruik maken van NumPy en daarom zeer snel zijn. De data structures zijn DataFrame en Series en er wordt uitgebreid ingegaan op hoe u deze kunt gebruiken voor data-analyses bij het inspecteren, selecteren, filteren, combineren en groeperen van data.
Dag 4
Ten slotte wordt aandacht besteed aan de essentials van SciPy library. De cursus maakt gebruik van vele voorbeelden uit de praktijk en laat zien hoe een-, twee- en driedimensionale datasets kunnen worden gevisualiseerd. De theorie wordt behandeld aan de hand van presentaties. Illustratieve demo’s verduidelijken de concepten verder. De theorie wordt afgewisseld met oefeningen. Als ontwikkelomgeving wordt de Anaconda distributie met Jupyter notebooks gebruikt.