Meten = leren

Dennie van den Biggelaar: ‘Effectief bijdagen aan verbeteren bedrijfsresultaten.’

(Dennie van den Biggelaar, Onesurance, in Ken je vak!, VVP 4-2024) In dit vierde deel van de serie AI in de Adviespraktijk richten we ons op een cruciaal aspect: hoe weet en meet je of je AI-systeem daadwerkelijk doet wat het moet doen? In het eerste deel (VVP 1, 2024) liet AI-strateeg Dennie van den Biggelaar zien hoe je van start gaat met Machine Learning (een specifiek onderdeel van AI), in het tweede deel (VVP 2) hoe je AI operationaliseert in je bedrijfsprocessen en in het derde deel (VVP 3) stond Integreren van AI-software in bestaande IT-landschappen centraal.

Het meten van de effectiviteit van een AI-toepassing begint met het definiëren van duidelijke ‘business KPI’s’. Deze KPI’s zijn es sentieel omdat ze richting geven aan welke aspecten van je bedrijfsvoering je wilt verbeteren en hoe je deze verbeteringen meetbaar kunt maken. Voor een verzekeringsbedrijf kunnen deze doelen bijvoorbeeld zijn: verhogen van omzet, verbeteren van retentie, verhogen van polisdichtheid of verhogen van STP-acceptatie. Het vaststellen van deze KPI’s biedt een kader voor zowel de ontwikkeling als de evaluatie van de AI-applicatie.

Mens en machine

In de praktijk werken AI-toepassingen vaak samen met menselijke experts. Daarom is het belangrijk om de prestaties van zowel de AI als de mens afzonderlijk én gezamenlijk te meten. Dit geeft inzicht in de effec tiviteit van de samenwerking en helpt je te bepalen waar verbeteringen mogelijk zijn.

Voorbeeld: Actief klantbeheer : stel je hebt een AI-algoritme dat klanten identificeert met een hoge kans op royement. Als de binnendienst of adviseur deze signalen niet adequaat opvolgt, kan de beoogde reductie van royement uitblijven. Door prestaties per medewerker te meten, kun je ontdekken of bepaalde medewerkers betere resultaten boeken dan anderen. Deze inzichten kunnen vervolgens worden gedeeld om het team als geheel te versterken.

Technische performance

Om de technische performance van een voorspellend algoritme te beoordelen, worden verschillende indicatoren gebruikt: nauwkeurigheid of accuracy (geeft aan hoe vaak het algoritme de juiste voorspelling doet), precisie (deze maatstaf kijkt specifiek naar de betrouwbaarheid van positieve voorspellingen, sensitiviteit (dit meet hoe goed een AI-model in staat is om alle relevante uitkomsten te detecteren), Area Under Curve (biedt een overzicht van de voorspellingskwaliteit van het model over verschillende drempelwaarden) en Log Loss ofwel Logaritmisch Verlies (dit meet hoe dicht de voorspelde kansen bij de werkelijke uitkomsten liggen).

Naast deze indicatoren zijn snelheid, efficiëntie en schaalbaarheid van belang. De snelheid, oftewel latency, bepaalt hoe snel de AIapplicatie reageert op een verzoek. Efficiëntie wordt gemeten door het geheugenverbruik van de applicatie, en schaalbaarheid wordt beoor deeld op basis van de hoeveelheid voorspellingen die binnen een bepaalde tijd worden gerealiseerd (throughput). Deze factoren geven een oordeel over de schaalbaarheid van een algoritme.

Robuust en ethisch

Een AI-toepassing moet niet alleen technisch goed presteren, maar ook robuust en ethisch verantwoord zijn. Dit omvat het vermogen van het model om goed te blijven presteren, zelfs als de inputdata of de omgeving verandert (model drift en shift). Daarnaast moet het model gevoelig zijn voor veranderingen in de data waarop het is getraind (data drift en shift). Ethische overwegingen, zoals het voorkomen van discriminatie op basis van geslacht, etniciteit of leeftijd, zijn eveneens cruciaal om te waarbor gen dat de AI eerlijk en verantwoord opereert.

‘Meten effectiviteit van een AI-toepassing is een complex maar noodzakelijk proces’

Uptime en betrouwbaarheid

Zoals bij elke cloudgebaseerde applicatie is de uptime van een AI-toepassing van cruciaal belang, vooral in productieomgevingen. Een ge bruikelijke norm in een Service Level Agreement (SLA) is een uptime van 99,9 procent. Dit betekent dat van elke 1.000 interacties met de ap plicatie er niet meer dan één fout mag gaan. Om deze betrouwbaarheid te waarborgen, wordt vaak een reserve-applicatie ingezet die het eventueel kan overnemen bij uitval.

Van prototype naar productie

Het opzetten van een AI-toepassing is een stapsgewijs proces. In de prototypefase ligt de focus vooral op het testen van de voorspelbaarheid van het algoritme en het minimaliseren van eventuele discriminatie. Als de AI-applicatie deze tests doorstaat, is de volgende stap om te beoordelen of de toepassing daadwerkelijk de gewenste business KPI’s verbetert. Ook de schaalbaarheid van het model wordt in deze fase al in overweging genomen.

Wanneer de AI eenmaal in productie is, ver schuift de focus naar het waarborgen van de uptime en het monitoren van de robuustheid van de AI over de tijd. Door systematisch te meten en te evalueren, kun je continu verbeteren en ervoor zorgen dat je AI-toepassing doet wat zij moet doen, nu en in de toekomst.

Meten van impact

Een van de meest effectieve methoden om te meten of een AI-toepassing de gewenste resultaten oplevert, is door middel van A/B-testing. Hierbij wordt de doelgroep willekeurig verdeeld in twee groepen: de ene groep (Groep A) gebruikt de nieuwe AI-toepassing, terwijl de an dere groep (Groep B) de traditionele methode of een eerdere versie van het systeem zonder AI gebruikt. Door de prestaties van beide groepen te vergelijken, kun je vaststellen hoe effectief de AI is in het verbeteren van de business KPI’s.

Het succes van een AI-toepassing hangt sterk af van hoe de inzichten uit A/B-tests wor den geïntegreerd in de bedrijfsvoering. Als een A/B-test bijvoorbeeld laat zien dat een bepaalde AI-tool leidt tot een hogere polisdichtheid, kan dit aanleiding zijn om de tool breder uit te rollen binnen de organisatie.

Effectief

Het meten van de effectiviteit van een AI-toepassing is een complex maar noodzakelijk proces. Het begint bij het definiëren van heldere business KPI’s en het evalueren van zowel de technische prestaties als de samenwerking tussen mens en machine. Robuustheid, ethische overwegingen en uptime zijn net zo belangrijk als de voorspelbaarheid van het algoritme. Door gebruik te maken van A/B-testing kun je bovendien op een be trouwbare manier vaststellen of de AI-applicatie daadwerkelijk bijdraagt aan het behalen van je bedrijfsdoelen. Het is van essentieel belang dat het niet alleen technisch goed functioneert, maar ook effectief bijdraagt aan het verbeteren van je bedrijfsresultaten.

Reactie toevoegen

 
Meer over
ChatGPT versus Richard Meinders

ChatGPT versus Richard Meinders

(Uit VVP 1-2024) Nieuw in 2024: VVP legt een vraag voor aan ChatGPT en laat vervolgens een deskundige van vlees en bloed op het antwoord reageren. In deze eerste...

Starten met specifieke AI en ML

Starten met specifieke AI en ML

(Dennie van den Biggelaar, Onesurance, in Ken je vak! in VVP 1-2024) We starten in deze eerste editie van AI in de Adviespraktijk bij het begin: wat is het en...

Onesurance en Insurance Data lanceren AI Engine

Onesurance en Insurance Data lanceren AI Engine

Insurance Data en Onesurance gaan samenwerken om het gebruik van data in de verzekeringsmarkt te verbeteren. Hiertoe is door Onesurance een geavanceerde AI Engine...

FD: de stille revolutie van AI in de verzekeringssector

FD: de stille revolutie van AI in de verzekeringssector

"Je mag ethisch en moreel geen concessies doen, wanneer je werkt met machine learning en AI. Het is van cruciaalbelang dat AI experts verantwoordelijkheid voelen...

AI vergroot risico bestuurders bedrijven

AI vergroot risico bestuurders bedrijven

Bestuurders van bedrijven kunnen voor steeds meer zaken aansprakelijk worden gesteld, volgens het D&O verzekeringsrapport van Allianz Commercial. Allianz: “Inadequate...

"AI game changer bij financiële functies"

"AI game changer bij financiële functies"

Meer dan de helft (52 procent) van de AI-pioniers in finance is van mening dat AI een game changer zal zijn voor de financiële functie, vergeleken met 39 procent...

Enno Wiertsema (Adfiz): "Start vandaag nog met ChatGPT"

Enno Wiertsema (Adfiz): "Start vandaag nog met ChatGPT"

"Mijn wens voor 2024 is dat we als sector met z’n allen aan de slag gaan met ChatGPT." Aldus Adfiz-directeur Enno Wiertsema in zijn maandcolumn. "Want", schrijft...

Ethische AI-dilemma’s

Ethische AI-dilemma’s

(Kees van Montfort en Gert de Jong, Hogeschool van Amsterdam, in Katern Risicobeheer en Preventie, VVP 5-2023) AI is een uitstekende tool om financiële fraudedetectie...

Visa lanceert AI-adviespraktijk voor klanten en partners

Visa lanceert AI-adviespraktijk voor klanten en partners

Visa gaat banken en andere partners adviseren over het gebruik van kunstmatige intelligentie (AI). De nieuw opgerichte AI Advisory Practice van het in-house adviesbureau...

Jack Vos: drie belangrijke dilemma's voor financieel adviseurs

Jack Vos: drie belangrijke dilemma's voor financieel adviseurs

"Door een tsunami aan ontwikkelingen komt de verzekeringsbranche voor belangrijke dilemma’s te staan waarover verzekeraars, maar ook adviseurs, tegelijkertijd...