De cursus R & data mining is een toptraining die gericht is op het daadwerkelijk toepassen van data science in de praktijk. Data science is een vakgebied dat steeds meer ingeburgerd raakt. In essentie ga je proberen patronen te ontdekken in grote stromen data (big data). Maar hoe doe je dat? In deze training R leer je alles over dit mooie vakgebied en tegelijkertijd ga je onder leiding van de docent modellen ontwikkelen. Ook krijg je onder meer een helder overzicht van de verschillende soorten algoritmes en tools. Als vehikel om data science (en meer specifiek machine learning) vorm te geven maken we gebruik van de populaire programmeertaal R. Voor meer informatie neem contact met ons op.
Wat zijn de belangrijkste uitdagingen die tijdens de cursus R & data mining aan bod komen? En wat zijn de leerdoelen?
Wat is data science, wat is data mining en patroonherkenning en wat is het nut voor je organisatie?
Hoe ontdek je verborgen patronen in de data van je organisatie?
Wat is R precies, wat kun je er mee en wat is de essentie van de programmeertaal R?
Wat is een algoritme en hoe bouw je met R een betrouwbaar predictive model?
Welke typen voorspellende modellen en data mining algoritmes zijn er en wanneer zet je welke in?
Hoe krijg je het programmeren in R onder de knie zodat je een predictive model kunt ontwikkelen?
Wat zijn de succesfactoren van R & data mining qua implementatie?
Je krijgt in deze op data mining gerichte R-training antwoord op al deze vragen. Daarnaast ga je heel praktisch met R aan de slag. De data mining R cursus is dus een ideale combinatie van theorie en praktijk en helpt je vooral om data science in de praktijk toe te passen door het ontwikkelen van goede algoritmes.
Praktische informatie: locatie, duur, data en prijs
Door onze registratie in het Centraal Register Kort Beroepsonderwijs (CRKBO) zijn onze opleidingen vrijgesteld van 21% BTW. Die brengen we dus niet in rekening.
Locatie:
Amrâth Berghotel Amersfoort
Duur:
3 dagen
Data:
27 t/m 29 november 2024
5 t/m 7 maart 2025
14 t/m 16 mei 2025
24 t/m 26 september 2025
26 t/m 28 november 2025
Punten:
✪ PA15
Deze training R & data mining geeft je recht op PA-punten net als al onze andere trainingen. Bij een totaal van 150 PA-punten én na het succesvol afleggen van een examen ontvang je een certificaat van bekwaamheid. Je ontvangt daarnaast de badge 'Certified Data & Decisions Professional' voor op LinkedIn.
✪ PE-punten
Informeer bij je vakvereniging - bijvoorbeeld de Vereniging van Registrercontrollers of de Nederlandse Beroepsvereniging van Accountants - hoeveel PE-punten/uren je kunt registreren voor je Permanente Educatie (PE).
Data science is een nieuw vakgebied dat zich richt op het ontdekken van trends en patronen in de data. Deze ontdekkingen vormen vervolgens de basis van modellen en algoritmes waarmee je uiteindelijk voorspellingen kunt gaan doen.
Maak jezelf de basisprincipes van R eigen
In deze training R & data mining ontdek je de verschillende toepassingen en verschijningsvormen van data science in de praktijk. En welke mogelijkheden liggen er braak om nieuwe businessmodellen te realiseren? Vervolgens ga je aan de slag met de basisprincipes van R, zodat je in control blijft. De docent stipt ook aan welke rol de data scientist speelt in een organisatie.
Daarna ga je de diverse data mining technieken en algoritmes ontdekken, onderzoeken en gebruiken. Met deze kennis en kunde van de algoritmes ga je alleen of in groepjes met R werken. De verschillende algoritmes probeer je uit en je leert te kijken naar de toepassing ervan. Je leert ook hoe je de algoritmes kunt beïnvloeden en wat het effect daarvan is.
Tot slot komen in deze R-training de vragen uit de praktijk naar voren. Je gaat deze beantwoorden vanuit het Data Science-perspectief. Je leert daarnaast R strategisch toe te passen: hoe bepaal je nu het meest succesvolle model en wat is de business value van een voorspelling?
Wat zeggen onze cursisten?
“Zeer bedankt, grote aanvulling voor de verdere ontwikkeling van Business Analytics en Data Science in mijn organisatie.”
Tijdens de training R & data mining leer je iedere opleidingsdag nieuwe technieken en mogelijkheden. Die ga je ook direct toepassen en evalueren. Concreet leer je hoe je ze kunt inzetten in jouw dagelijkse praktijk. Na het afronden van deze opleiding R & data mining heb je gegarandeerd een solide basis om data science ook daadwerkelijk toe te passen in jouw organisatie.
Modulaire opzet van de 3-daagse cursus R & data mining
De cursus R & data mining bestaat uit 9 compacte onderdelen. Laat je onderdompelen in het specialistische vakgebied Data Science en de programmeertaal R. Na afloop van deze training Data Mining & R ben je in staat om zelf te programmeren in R en algoritmes te ontwikkelen en heb je een goed begrip van de mogelijkheden om data mining binnen de eigen organisatie toe te passen.
Dag 1: Data science, machine learning en basisbeginselen van R
Tijdens de eerste dag van de cursus R & data mining ga je leren wat het belang van data science en machine learning is voor publieke en commerciële organisaties en verken je samen met de docent dit interessante vakgebied. Je krijgt ook inzicht in de belangrijkste basisbeginselen, data mining algoritmes en supervised versus unsupervised learning.
Het vakgebied Data Science: wat is de positie van Data Science in relatie tot de vakgebieden zoals BI, Machine Learning en Artificial Intelligence? Waarom is data science juist nú belangrijk voor je organisatie? Wat is data mining en hoe pas je dit toe om bedrijfsproblemen op te lossen?
Kennismaken met de programmeertaal R: welke basisvaardigheden, objecten, functies, datatypes en commando’s moet je kennen voor data mining? En wat is Python? Wat is een algoritme? De docent geeft je een overzicht van gangbare data mining algoritmes en toepassingen. Ook leer je het verschil tussen supervised en unsupervised data mining en ga je aan de slag met “exploratory” data-analyse en datavisualisatie. De theorie ga je direct in de praktijk brengen met R.
Data bewerkingen: tijdens dit onderdeel leer je hoe je gestructureerde data importeert en geschikt maakt voor bewerkingen met R. De theorie komt langs, maar je gaat vooral zelf aan de slag en veel experimenteren en oefenen.
Dag 2: Supervised learning algoritmes, modellen en data mining
Tijdens de tweede dag van deze compacte training R & data mining ga je de gehele dag aan de slag met data en met R. De docent neemt je mee in de mogelijkheden van R voor het analyseren van data, het kiezen van algoritmes, het maken van en het evalueren van modellen. Je gaat ook praktische data mining toepassingen bouwen in R. Verder laat de docent je zien hoe een solide data mining process eruit ziet en wat de stappen en valkuilen zijn.
Supervised learning: we maken kennis met twee veelgebruikte vormen van supervised learning: regressie en classificatie.
Ontwikkelen van praktische data mining toepassingen: de docent neemt je mee in de verschillende soorten algoritmes die er zijn en je gaat met R oefenen, onder andere lineaire regressie en logistic regressie. Verder laat de docent je zien hoe een solide data mining proces eruit ziet en wat de stappen en valkuilen zijn.
Evaluatie van modellen: na het maken van een model willen we weten of het model goed is, met andere woorden of de voorspellingen valide en betrouwbaar zijn. Hoe kun je de validiteit verifiëren en wat kun je doen om de betrouwbaarheid van je data mining algoritmes en regressiemodellen te verhogen? Evaluatie van modellen is een belangrijk onderdeel van deze training.
Dag 3: Unsupervised learning, forecasting, text mining en implementatie
Tijdens de derde en laatste dag van deze intensieve, praktische cursus R & data mining leer je nieuwe modellen, ga je leren hoe je de performance van classificatie-algoritmes kunt verifiëren en hoe je het “beste” model kunt kiezen. Tot slot komen de belangrijkste implementatie-aspecten aan bod voor het succesvol toepassen van data mining met in R programmeren.
Ontwikkelen van praktische data mining toepassingen: we gaan verder met de case van dag 2 waarvoor we een logistic regressiemodel hebben ontwikkeld. We gebruiken dezelfde data om daaraan decision tree en random forest modellen toe te voegen. Naast deze supervised learning algoritmes behandelen we clustering (unsupervised), forecasting en text mining.
Het “beste” model: voor de classificatiecase van dag 2 hebben we vier verschillende modellen gemaakt. Je leert hoe je modellen kunt vergelijken in relatie met je businessdoelstellingen en hoe je de beste keuze kunt maken.
Implementatieaspecten data science: als afsluiter van deze praktische cursus R programmeren leer je de belangrijkste implementatieaspecten te begrijpen. Denk hierbij bijvoorbeeld aan de toolkeuze (het selecteren van een R data mining tool) en het opstellen van een business case. Tot slot presenteert de docent je de belangrijkste succesfactoren van data science en de doorvertaling naar in R programmeren.
Interactieve cursus programmeren R & data mining
Tijdens elke opleidingsdag van deze cursus R & data mining vinden er ook groepsdiscussies plaats en werk je aan uitdagende praktijkopdrachten. Je leert daadwerkelijk programmeren in R. Zo ontstaat er een optimale mix tussen leren en doen. Na afronding van deze unieke R-cursus ontvang je een certificaat, een digitale badge voor LinkedIn en een exemplaar van het boek ‘De intelligente, datagedreven organisatie’.
Aanvullende informatie van deze R cursus
De prijs van deze cursus R & data mining is inclusief lunchbuffet, onbeperkt thee en koffie, overige drankjes en hapjes tijdens de breaks. Je ontvangt tevens een exemplaar van het Big Data boek ‘De intelligente, datagedreven organisatie (2021)’.
✪ HBO niveau ✪ vrijgesteld van BTW ✪ geen studiebelasting
✪ interactief & praktijkgericht ✪ gewaarmerkt digitaal certificaat ✪ van 9:00 tot 17:00
Voor iedereen die betrokken is bij een Data Science of Big Data project biedt onze R training waardevolle content, praktische programmeerervaring en een stevig houvast. Onze opleiding R wordt vooral veel gevolgd door: (aankomend) projectleiders Business Analytics, Data Scientists, Data Architecten, BI managers, Data Science managers, business analisten, data analisten en business managers.
Behaalde leerdoelen van de training Data mining in R:
Je weet hoe je data mining kunt toepassen om bedrijfsproblemen op te lossen
Je kunt programmeren in R en werken met RStudio
Je kunt data uit externe bronnen importeren en visualiseren
Je kunt de belangrijkste packages van R voor data mining gebruiken
Je beheerst de verschillende soorten modellen en algoritmen voor data mining
Je weet hoe je betrouwbare modellen kunt ontwikkelen en valideren
Je ontwikkelde lineaire en niet-lineaire voorspellingsmodellen voor cases
Je hebt geoefend met text mining
Je doorgrondt de belangrijkste succesfactoren van data mining en data science
Schrijf je nu in voor onze unieke training R & data mining
Via ons inschrijfformulier schrijf je je direct in voor de eerstkomende training R & data mining. Heb je vragen over deze training, neem dan nu contact met ons op. Of bel ons voor meer informatie over de mogelijkheden voor een incompany training R op maat voor jouw organisatie.
Over de docent
Herman van Dellen is een zeer ervaren data scientist. Hij zet zijn jarenlange kennis en ervaring in voor organisaties die worstelen met hun bedrijfskritische toepassingen en tools, zoals CRM, BI, Datawarehousing en ETL. Uiteraard heeft hij uitgebreide ervaring met programmeren in R en Python. Ook is hij expert op het gebied van datagedreven werken, predictive modeling en de PDCA-verbetercyclus.
Geverifieerde deelnemer | Innax | 25 augustus 2022
Nuttige opleiding, geeft een goed algemeen overzicht in wat er mogelijk is en wat er veel gebruikt wordt. Soms iets te breed, maar dat kan ook niet anders omdat je met mensen uit meerdere achtergronden en interesse gebieden zit.
Geverifieerde deelnemer | Gemeente Leeuwarden | 10 december 2021
Heel informatief. Goed gestructureerd. Goed niveau. Zou in mijn geval meer willen kunnen oefenen. Gewoon de praktische handelingen en zelf een plan maken. Dit zijn de data. Dit is wat we willen onderzoeken. Wat ga je dan doen. In welke stappen.
Tom Griekspoor | Gemeente Waddinxveen | 14 juni 2021
Een prettige opleiding waarbij theorie en praktijk bij elkaar kwamen. Wel was het prettiger geweest als er meer voorbeelden kwam wat aansluit bij mijn interesse. Zo hadden we verschillende voorbeelden gezien, maar wat betekend dit voor ons? Hoe kan ik dit gebruiken?
Goede start met duidelijke uitleg. Soms mogen onderwerpen iets meer in Jip-en-Janneke taal worden uitgelegd in plaats van alleen maak vaktermen te gebruiken.
Martin Hoekstra | Gemeente Leeuwarden | 15 december 2020
Ik vond de opleiding erg pittig. De opleiding vereist meer dan gemiddelde statistiek kennis. Daarnaast vond ik het lastig dat de opleiding 3 dgn aaneengesloten wordt gegeven. Misschien is het beter om een week tussen de cursusdagen te laten zitten met huiswerk. Ik vond het prettig dat de scripts aan ons verstrekt werden. Op die manier kon je altijd even spieken of weer aanhaken wanneer je vast kwam te zitten bij een bepaalde stap.
Gerke Hoogstra | Gemeente Leeuwarden, DataCenter Strategie&Bedrijfsvoering | 7 december 2020
Leuke training, deskundige trainer die serieus is en wil helpen met allerlei vragen die er zijn. Wel heel veel voor 3 dagen en structuur is niet altijd duidelijk.
Fijn dat de trainer zoveel ervaring en kennis heeft, zowel op het gebied van data science, statistiek als IT. Hij kon daardoor goed reageren op alle vragen en discussies.
Ronald van Rooijen | AstraZeneca | 30 januari 2020
Om nog meer rendement te halen uit de opleiding zou ik het handig vinden als de opleiding opgeknipt wordt in de tijd. Per week 1 dag. Je hebt dan de tijd om zelf even te oefenen met de stof die aangeboden is, voordat je weer nieuwe krijgt. Omdat je zelf geoefend heb krijg je ook weer vragen, die je dan kan stellen in de volgende les.
Er lag teveel focus op het zelf aan de slag gaan met programmeren. Tom had het soms over een aantal eenvoudige stappen/bewerkingen in R, terwijl ik nog maar net wist wat een vector was. Die stappen waren voor mij absoluut niet eenvoudig. Dit heb ik ook aangegeven en mening werd gedeeld door gedeelte van de groep die nog geen ervaring had met R. Na deze feedback gingen we meer klassikaal doen, alleen daarbij raceten we ook direct door de inhoud heen. Beter is het om meer te focussen op de basisprincipes van data mining en R. Of om vooraf aan te geven (ik heb nog specifiek gevraagd naar instapniveau) dat ervaring met R zeer gewenst of zelfs noodzakelijk is. Ik denk dat 3 dagen te kort is voor combinatie van instapniveau en zelf theorie toepassen in praktijk in R.
In het algemeen zou ik meer hands on willen kennismaken met R en de verschillende algoritmes voor datamining. Ook de uitleg over hoe de resultaten van de beslisboom geïnterpreteerd moeten worden kan veel beter.