Heeft u belangstelling voor het beroep van datawetenschapper en beschikt u over veel tijd en geld? Dan kunt u misschien nog participeren in de opleiding Data Science van de IT Academy Noord-Nederland ( http://www.itacademy.nl ). Tot voor kort kende ik het bestaan niet van deze organisatie, een advertentie verscheen bij de zoekresultaten en nieuwsgierig geworden toch even gekeken. Dat was even schrikken en slikken: een opleiding Data Science van 28 hele (werk)dagen verspreid over negen maanden voor een bedrag van meer dan 8.000 euro. Welke participanten kunnen dit zich permitteren? Je moet wel een (semi-)overheid als werkgever hebben om zo’n opleiding te kunnen volgen. Voor wie niet kan deelnemen heb ik een goedkoop alternatief.
Ik zat vermoedelijk te zoeken op de termen Data Science al dan niet in combinatie met Python toen de betaalde advertentie in beeld kwam. Recentelijk kreeg ik het boek(je) getiteld ‘Data Science from Scratch’ in handen van de Amerikaanse uitgeverij O’Reilly ( http://shop.oreilly.com/product/0636920033400.do ) geschreven door een medewerker van Google. Het maakt gebruik van de programmeertaal Python en dus ook maar even gekeken of er een aardig boek over die programmeertaal te vinden is. Een Amerikaanse hoogleraar computerwetenschap schreef er eentje voor absolute beginners en stelt het in de vorm van een pdf-bestand gratis beschikbaar op http://greenteapress.com/wp/think-python-2e/ . Het aanleren van Python is sowieso niet verkeerd, als datawetenschappen te hoog gegrepen zijn dan kun je altijd nog je Raspberry Pi ( http://www.raspberrypi.org ) programmeren. Het aardige van het genoemde boekje is niet alleen dat het een mooi overzicht geeft van het vakgebied, de auteur is ook zo vriendelijk geweest aanvullend studiemateriaal te vermelden. Ik heb zo’n zes aangeprezen boeken in de vorm van een pdf-bestand gratis en legaal van het Internet geplukt, slechts een enkel exemplaar telde minder dan 500 pagina’s. Het grootste deel betreft klassieke onderwerpen als lineaire algebra, differentiaal- en integraalrekening alsmede kansrekening en statistiek. Zulke mooie boeken hadden ze niet in de tijd dat ik in de schoolbankjes zat.
Data Science is anno nu een gigantisch breed en diep vakgebied en ik heb derhalve met verbazing kennis genomen van de aangeboden leergang. In 28 dagen een ratjetoe aan onderwerpen voor een niet kinderachtig bedrag terwijl je voor minder dan dertig euro aan de slag kunt. Mijn advies zou zijn: leer eerst de programmeertaal Python. Lukt dat niet dan is een loopbaan als datawetenschapper niet aan de orde. Werk het boek van de Google-medewerker door om te zien of Data Science iets voor u is. Bekijk ondertussen de aanbevolen literatuur om te zien of u de tijd en de capaciteiten heeft om de onderliggende wiskunde eigen te maken. Wees voorbereid op menig uur studeren (ik kan het weten want gedaan). Datawetenschapper mag door sommigen de baan van de toekomst worden genoemd, geen idee wanneer die toekomst aanbreekt. Maar goed, voor een paar tientjes kun je beginnen en je wordt er in ieder geval wat wijzer van.



