Zie alle stories

Wat is het meest sexy beroep van de 21ste eeuw?

 

Het zal je misschien verrassen, maar dat is het beroep van data scientist volgens het toonaangevende Harvard Business Review. Maar wat doet een data scientist precies? Ik neem je graag mee in de wereld van het meest sexy beroep van de 21ste eeuw. 

Een data scientist werkt in het interdisciplinaire domein van data science. Hierin komen verschillende expertises samen. Hieronder zie je een diagram van de verschillende werkvelden in data science.

Calvin.Andrus (Own work) [CC BY-SA 3.0 (http://creativecommons.org/licenses/by-sa/3.0)], via Wikimedia Commons

 

Chris Andrus (Eigenwerk)

Diverse achtergronden

In de praktijk zien we dat data scientists veel verschillende achtergronden hebben. Logisch, het werkveld is relatief nieuw en er bestaat geen eenduidige definitie. We onderscheiden vier verschillende achtergronden van data scientists: 

  • Domeinkennis en kennis van de business: weet waar de kansen liggen en welke vragen te stellen.
  • Statistiek: hoofdzakelijk kennis van modellen en kansberekeningen.
  • Programmeren: Software/data architectuur en engineering.
  • Communicatie: zowel geschreven als mondeling.

Hieronder zie je een venndiagram met de overlap van de verschillende achtergronden:

Author: Stephan Kolassa

Stephan Kolassa (Eigenwerk)

Aan welke producten werkt een data scientist?

Een data scientist werkt aan veel verschillende producten voor een organisatie. Daarbij vraagt hij zich vooraf altijd af wat het doel is en wie de stakeholders zijn van het op te leveren product. Hieronder een overzicht van producten waar een data scientist aan werkt:

  • Voorspelling (voorspelling van een waarde op basis van input)
  • Classificatie (bijvoorbeeld spam of geen spam)
  • Aanbevelingen (bijvoorbeeld aanbevelingen van Amazon en Netflix)
  • Patroonherkenning en -groepering (bijvoorbeeld classificatie zonder bekende klassen)
  • Anomalie-detectie (bijvoorbeeld fraude-detectie)
  • Herkenning (beeld, tekst, audio, video, gezicht, ...)
  • Actieve inzichten (via dashboards, rapporten, visualisaties, ...)
  • Geautomatiseerde processen en besluitvorming (bijv. goedkeuring van creditcards)
  • Scoren en rangschikken (bijvoorbeeld FICO-score)
  • Segmentatie (bijv. op demografische gegevens gebaseerde marketing)
  • Optimalisatie (bv. risicobeheer)
  • Prognoses (bv. verkoop en inkomsten)

Hoe richt je een data science project in? 

Er bestaan veel modellen om een data science project in te richten. Een van de meest gebruikte modellen is het CRIPS DM model:

http://blog.mjvinnovation.com/big-data-analytics/a-more-competitive-business-with-data-science-and-data-mining

http://blog.mjvinnovation.com: CRISP DM referentie-model

Binnen bestaat uit verschillende fases. Een iteratief proces ligt hieraan ten grondslag. De pijlen in de afbeelding hierboven geven aan hoe het proces is opgebouwd en welke stappen elkaar opvolgen.

Reageren? Graag! Mick.brown@vlammrs.nl

Bron: Castrounis, A. (2017, 7 maart). What Is Data Science, and What Does a Data Scientist Do? InnoArchiTech.

Afbeelding via: https://australianfintech.com.au/sexiest-job-21st-century-data-scientist/

Wat is het meest sexy beroep van de 21ste eeuw?

Wat is het meest sexy beroep van de 21ste eeuw?