Wat is het verschil tussen data science, machine learning en kunstmatige intelligentie… als er al een is? Deze drie velden hebben veel overlap, dus het mag niet verbazen dat er veel verwarring heerst over de specifieke meerwaarde van elk. Toch mogen ze zeker niet over dezelfde kam geschoren worden. Simpel gezegd kunnen de drie toepassingen als volgt onderscheiden worden: 

  • data science leidt tot inzichten
  • machine learning leidt tot voorspellingen
  • kunstmatige intelligentie leidt tot acties

 

Data science leidt tot inzichten 

Data science is anders dan machine learning en KI omdat het een menselijker doel heeft: inzichten winnen en begrijpen. Drie soorten inzichten of data die verworven kunnen worden zijn beschrijvende, verklarende en causale data. Bij data science is er altijd een mens betrokken in het hele proces: iemand die de inzichten begrijpt, de grafieken ziet of baat heeft bij de conclusies die data science trekt. Data science bestaat dan ook uit statistische inferenties, data-visualisatie, experimenten, domeinkennis en communicatie. Datawetenschappers maken daarbij soms gebruik van simpele tools: ze rapporteren bijvoorbeeld percentages en maken grafieken gebaseerd op SQL-series. Maar ze kunnen evengoed zeer complexe methoden gebruiken: ze werken bijvoorbeeld met gedistribueerde datamagazijnen om miljarden datarecords te analyseren, of ze ontwikkelen vooruitstrevende statistische technieken, of ze bouwen interactieve visualisaties van data. Welk soort technieken ze ook gebruiken, het doel blijft altijd hetzelfde: een beter inzicht verkrijgen in hun data.

 

Machine learning leidt tot voorspellingen 

Met voorspellingen bedoelen we niet alleen voorspellingen over de toekomst (vb.: voorspel wanneer deze machine aan vervanging toe is), maar ook voorspellingen over zaken die voor computers niet onmiddellijk duidelijk zijn (vb.: voorspel of er op deze foto een vogel aanwezig is). Er zit zeker overlap tussen data science en machine learning. Logistische regressie bijvoorbeeld, kan gebruikt worden om inzichten (data science) te verkrijgen in relaties (vb.: een rijkere gebruiker zal ons product sneller kopen, dus moeten we onze marketingstrategie hierop afstemmen), maar ook om voorspellingen (machine learning) te maken (vb.: deze gebruiker heeft 53% kans om ons product te kopen, dus moeten we het met een advertentie aan hem voorstellen). Vaak is er een wisselwerking tussen machine learning en data science.

 

Kunstmatige intelligentie leidt tot acties 

Kunstmatige intelligentie is van de drie toepassingen allicht de bekendste, en daardoor ook het moeilijkst om te definiëren. De term KI gaat dan ook gepaard met veel hype, mede dankzij onderzoekers, journalisten en start-ups die op zoek zijn naar geld of bekendheid. Dit heeft het spijtige gevolg dat kunstmatige intelligentie een term is die (te) veel ladingen dekt, en heeft geleidt tot het KI-effect: “KI is datgene wat we nog niet kunnen.”

Maar wat is dan een juiste definitie? In ieder geval moet KI leiden tot acties. Wanneer we dat als uitgangspunt nemen, dan kunnen we alvast volgende toepassingen onderbrengen bij KI:

  • algoritmes voor videospelletjes (vb. DeepBlue schaakcomputer, Googles Alpha Go)
  • robotica en controletheorie (vb. motion planning)
  • optimalisatie (Google Maps een route laten kiezen)

 

Opnieuw is er heel wat overlap met de andere twee velden. Zo is deep learning bijvoorbeeld interessant voor zowel machine learning als kustmatige intelligentie. Een deep learning-tool wordt typisch eerst getraind met data en dan gebruikt om productievoorspellingen te doen, maar het heeft ook veel succes op het gebied van algoritmes voor videospelletjes zoals AlphaGo.

Maar er zijn ook verschillen. Bij het analyseren van salesdata bijvoorbeeld, kan men ontdekken dat klanten van bepaalde sectoren hun contracten vaker vernieuwen dan andere (een inzicht verkrijgen). De output hiervan zijn nummers en grafieken, geen actie. Men kan op basis hiervan wel actie ondernemen, maar dat is een menselijke handeling, geen automatische. Daardoor zou dit proces onder data science vallen, en zou het dus fout zijn om het als KI te labellen.

Het verschil tussen KI en machine learning is subtieler. Machine learning werd voordien dan ook vaak als een onderdeel van KI gezien. Door de negatieve bijklank die KI in recentere jaren kreeg, is machine learning echter grotendeels losgebroken. Personen die werken aan voorspellende problemen worden niet graag gezien als KI-onderzoekers. Dit wil zeggen dat wanneer een probleem draait rond het voorspellen van X door middel van Y, er niet (langer) gesproken kan worden over KI.

Hoe kunnen de drie velden samen gebruikt worden? 

Stel: we bouwen een zelfrijdende wagen en behandelen het probleem van stoppen bij stopborden of rode lichten. Hiervoor moeten we beroep doen op alle drie de velden.

  • Machine learning: de auto moet met zijn camera’s de stopborden of verkeerslichten kunnen herkennen. Hiervoor moeten we een dataset construeren van miljoenen foto’s met straatobjecten. Vervolgens moeten we een algoritme trainen om te voorspellen welke foto’s stopborden of rode lichten hebben.
  • Kunstmatige intelligentie: eens de auto verkeersborden herkent, moet het kunnen beslissen wanneer de remmen in werking treden. Het is gevaarlijk om te vroeg of te laat te remmen. Bovendien moet er rekening gehouden worden met wisselende omstandigheden zoals bijvoorbeeld een gladde weg. Dit een een probleem dat aangepakt kan worden door de controletheorie van KI.
  • Data science: tijdens straattesten ontdekken we dat de prestaties van de auto niet voldoen. Hij rijdt bijvoorbeeld een paar keer door het rode licht. Na het analyseren van de testdata, winnen we het inzicht dat het aantal overtredingen afhankelijk is van het tijdstip van de dag. De auto heeft meer kans om een rood licht te negeren voor zonsopgang of na zonsondergang. We komen tot de conclusie dat de meeste van onze trainingsdata enkel bestond uit objecten in daglicht. We moeten dus een betere dataset construeren, die ook bestaat uit nachtbeelden, en hiermee terug naar de stap van machine learning gaan.

Suppose we were building a self-driving car, and were working on the specific problem of stopping at stop signs. We would need skills drawn from all three of these fields.

  • Machine learning: The car has to recognize a stop sign using its cameras. We construct a dataset of millions of photos of streetside objects, and train an algorithm to predict which have stop signs in them.
  • Artificial intelligence: Once our car can recognize stop signs, it needs to decide when to take the action of applying the brakes. It’s dangerous to apply them too early or too late, and we need it to handle varying road conditions (for example, to recognize on a slippery road that it’s not slowing down quickly enough), which is a problem of control theory.
  • Data science: In street tests we find that the car’s performance isn’t good enough, with some false negatives in which it drives right by a stop sign. After analyzing the street test data, we gain the insight that the rate of false negatives depends on the time of day: it’s more likely to miss a stop sign before sunrise or after sunset. We realize that most of our training data included only objects in full daylight, so we construct a better dataset including nighttime images and go back to the machine learning step.
Bron: opendatascience.com. Foto: Shutterstock 

Pin It on Pinterest

Shares
Share This