AutoML en machine learning zonder expertise

Data-analisten, marktleiders en zakelijke gebruikers zullen het over één ding eens zijn: de democratisering van data en inzichten is tegenwoordig cruciaal. Een recente Google Cloud/Harvard Business Review-paper bevestigde dit: 97% van de ondervraagde professionals was het ermee eens dat zakelijk succes afhankelijk is van het democratiseren van toegang tot gegevens in organisaties.

AutoML is een cruciale stap in de richting van dit doel, omdat het het gemakkelijk maakt om een ​​ML-model te implementeren met minder technische expertise. Hoewel dit veel deuren opent, beginnen bedrijfsleiders langzaam de risico’s en beperkingen te beseffen van het inzetten van een technologie zonder eerst te weten hoe het werkt.

Ik heb het genoegen gehad om met veel teams samen te werken tijdens mijn reis als serie-ondernemer, en ik kan de kracht van kennis niet genoeg benadrukken. In dit artikel deel ik mijn ervaring die ik heb opgedaan in het werken voor organisaties in verschillende bedrijfstakken, en bespreek ik wat AutoML precies is (en niet is), de waarde die datawetenschappers naar voren brengen en best practices voor het gebruik van AutoML om projecten binnen jouw zaken.

Wat AutoML wel en niet is

Dit is wat Automated Machine Learning (AutoML) in duidelijke technische termen is: het automatiseert de selectie, samenstelling en parametrering van ML-modellen. Simpel gezegd, AutoML biedt u de methoden en processen om uw onderzoek te versnellen en voorspellingen te doen. De snelle explosie van de vraag naar AI-ondersteunde projecten in combinatie met een gebrek aan experts in het veld betekende dat de complexe taken moesten worden overgelaten aan automatisering. AutoML is echter geen one-stop-shop voor het sturen van de prestaties van een model, en het kan ook niet worden gebruikt om de bevindingen van de verzamelde gegevens te analyseren.

Een voorbeeld van de beperkingen van AutoML is een algoritme voor het beklimmen van heuvels, waarbij een model de taak heeft om het globale optimale resultaat of de oplossing te vinden. Een AutoML-model werkt vaak alleen totdat het de top van de eerste “heuvel” bereikt – het lokale maximum. Terwijl bergbeklimmen lijkt alsof je de oplossing hebt gevonden, zou een datawetenschapper weten dat je misschien niet op de grootste heuvel bent, en naarmate je het model blijft uitbreiden, wordt het minder nauwkeurig. Een getrainde datawetenschapper kan helpen om het model snel uit te breiden en het globale optimale maximum te vinden.

Uitgebreide trainings- en testfasen garanderen de levensvatbaarheid van een project op lange termijn. Het belang van het inzetten van technologische expertise bij dergelijke projecten wordt hier duidelijk. Het antwoord?

Data wetenschappers.

De waarde die datawetenschappers naar ML brengen

Automatisering van machine learning begon als een project om het datawetenschappers gemakkelijker te maken. Door de saaie en repetitieve taken uit te voeren, kon het project in een veel sneller tempo verlopen. Minimale menselijke inbreng betekende ook minimale menselijke fouten. Wat duidelijk is, is dat AutoML altijd een add-on is geweest en geen vervanging voor de expertise van een datawetenschapper.

Er zijn verschillende belangrijke verantwoordelijkheden die een datawetenschapper bij elk project op zich neemt, van het formuleren van de probleemstelling, het instrueren van het algoritme, het identificeren van correlaties van functievariabelen tot het interpreteren van de output van het uiteindelijke model.

Datawetenschappers kunnen ook putten uit ervaringen uit het verleden om ML-modellen te helpen begeleiden. Door te begrijpen wat in het verleden het beste werkte, kunnen datawetenschappers efficiënte en intuïtieve beslissingen nemen. Denk er eens over na: je ziet nooit een wetenschapper in een laboratorium werken aan het oplossen van een probleem. Door als een team te werken aan verschillende aannames, kan het bedrijf de meest efficiënte oplossingen bedenken, iets wat automatisering nog moet bereiken.

Het vermogen om intuïtieve beslissingen te nemen en hypothesen te formuleren resulteert ook in een nauwkeurig ML-model in een veel sneller tijdsbestek. AutoML kan eventueel bereik 90%-95% nauwkeurigheid over vele iteraties. Datawetenschappers kunnen het model begeleiden om dit niveau van nauwkeurigheid zeer snel te bereiken.

AutoML als uitgangspunt gebruiken

Hier is een schokkende statistiek: volgens een artikel van Forbes heeft minder dan 15% van de bedrijven AI-mogelijkheden in de productie ingezet. De waarheid is dat AutoML een goed startpunt is om tot 90% nauwkeurigheid te komen met uw ML-model. Verder gaan dan 95% is de echte uitdaging. Theoretisch kan een nauwkeurigheidstoename van het model met zelfs maar één extra datapunt zich vertalen in miljoenen dollars aan inkomsten.

We zien dat meer bedrijven die AutoML op de een of andere manier hebben geïmplementeerd, proberen hun modellen te verbeteren. De toegevoegde waarde van datawetenschappers is vooral duidelijk wanneer je werkt met een bureau dat met meerdere klanten en industrieën werkt. De blootstelling aan verschillende datawetenschapsproblemen biedt een bredere expertise dan op elk uniek probleem kan worden toegepast.

Er is een combinatie van datawetenschappers en automatisering nodig om het beste van machine learning naar boven te halen. Hoewel veel bedrijven tegenwoordig elke dag enorme hoeveelheden gegevens verzamelen, lopen ze vast als ze dat omzetten in uitvoerbaar advies.

Veel bedrijven wenden zich tot AutoML vanwege een gebrek aan expertise op het gebied van datawetenschap – een gevolg van het tekort aan IT-vaardigheden. Dit is waar AutoML als een levensvatbaar startpunt kan dienen. Wanneer uw bedrijf echter de limiet heeft bereikt van de modelnauwkeurigheid die u met AutoML kunt bereiken, of wanneer u snel resultaten wilt behalen met ML-machine learning, is expertise een absolute must.

.

Leave a Comment

Your email address will not be published.