Pareltjes vinden in de databerg

De databerg wordt ongeveer iedere 14 maanden twee keer zo hoog. Databestanden met aankoopgegevens, bezochte locaties, klantgegevens en surfgedrag herbergen een schat aan informatie over trends. Door grote databestanden met elkaar te koppelen, kunnen bedrijfsprocessen verbeterd worden en nieuwe diensten ontwikkeld. Dr. Sandjai Bhulai (Vrije Universiteit) belicht praktijkvoorbeelden.

Wat doet u als de pinautomaat bij uw bank niet werkt? Belt u het servicenummer op uw bankpas? Waarschijnlijk niet. Teveel gedoe. De kans is groot dat u geïrriteerd doorloopt naar de volgende automaat. En het zou zomaar kunnen dat u er en passant een tweet uit gooit om uw irritaties kracht bij te zetten. Welnu, dat laatste is voer voor sentimentanalyses en... betere dienstverlening. Met een beetje geluk en technisch inzicht is de locatie van de pinautomaat veel sneller gevonden dan op de gebruikelijke manier. Want hoeveel tijd was er overheen gegaan voordat uw klacht uiteindelijk bij de dienstdoende servicemonteur van de bank terecht zou zijn gekomen?

De koppeling van grote databestanden gaat leiden tot ontwikkeling van allerlei nieuwe producten en diensten. Big data wordt big business. Iedereen roept het. Maar hun beste praktijkvoorbeelden geven organisaties niet graag prijs. Daarom gaan we te rade bij een ‘onafhankelijke' deskundige. Dr. Sandjai Bhulai promoveerde in 1994 op ‘hoogdimensionale' (zeg maar: complexe) computersystemen. Daarna maakte hij wiskundige modellen voor telecommunicatiebedrijf Lucent. Sinds 2003 is Bhulai universitair hoofddocent aan de VU, met een focus op callcenters en telecombedrijven. Verder is hij verbonden aan het CWI (Centrum Wiskunde & Informatica) en heeft hij zijn eigen bedrijf, Prompt Business Analytics, dat software levert aan de zorgsector. Volgens Bhulai moeten organisaties die mee willen in de snelle ontwikkelingen beter gebruik maken van de nieuwe kansen door koppeling van databestanden.

E-thermostaat
Zomaar wat willekeurige cijfers. Volgens Kwik-Fit Autoservice (182 vestigingen) rijden 440.000 Nederlandse automobilisten in de zomer door op winterbanden. De ANWB heeft bijna 4 miljoen leden, waarvan er jaarlijks 1 miljoen telefonisch contact opnemen. ING heeft 2.400 geldautomaten (waarvan 700 bij Albert Heijn). In Nederland hebben ongeveer 2,5 miljoen mensen een contract voor groene stroom. Het HagaZiekenhuis in Den Haag telde in 2011 ruim 34.000 dagbehandelingen. Aan al deze namen en cijfers hangen kengetallen en databestanden. Hoewel de cijfers op zichzelf niets met elkaar te maken hebben, zou een beetje wiskundige er met een voorspellend algoritme zomaar nieuwe dienstverlening of efficiëntere organisatiestructuren uit kunnen halen. En dat is in deze tijd van bezuinigingen waar alle bedrijven en organisaties naar op zoek zijn.

Het moet efficiënter, slimmer en klantgerichter in 2013 en het nieuwe groeipotentieel is niet ver weg. Met andere woorden: het ligt voor het grijpen op uw eigen harde schijf. Onderzoek toont echter aan dat we veel minder datagedreven zijn dan onze directeuren denken. Softwareleverancier QlikTech vroeg 1.000 kantoormedewerkers in Groot Brittannië naar hun datagebruik en constateerde dat 90 procent van hen meer data verwerkt dan een jaar geleden maar dat slechts een kwart ook echt nieuwe dingen heeft ontdekt over de bedrijfsvoering. Bhulai: "De valkuil is dat organisaties gegevens gaan verzamelen en dan niet weten wat ze er mee aan moeten. Je moet heel goed voor ogen hebben wat je van je klanten wilt weten."

Veel gegevens zijn openbaar en makkelijk toegankelijk. Zo kunnen de gegevens van het KNMI door iedereen geraadpleegd worden. Dat deed Bhulai voor energiebedrijf Essent, dat eind 2011 de E-thermostaat introduceerde. Met de E-thermostaat kunnen klanten van Essent op afstand met een smartphone of computer de temperatuur in hun huis regelen. Bhulai kreeg anonieme klantgegevens van Essent over gemeten binnentemperaturen en de instelling van de thermostaten op gegeven tijdstippen. Deze gegevens koppelde hij aan de 23 bekende variabelen van het KNMI. Bhulai: "De vraag was wat de klant zou gaan instellen en of we trends konden detecteren in diens gedrag. Daaruit kwam naar voren dat de windsnelheid veel effect kan hebben op wat de klant instelt. En daaruit konden we afleiden dat 80 procent van de huizen slecht geïsoleerd is. Daar zou Essent een nieuwe dienst omheen kunnen bouwen."

Zoals Essent u in het najaar een energiescan op uw tochtige woning kan aanbieden, kan Albert Heijn met behulp van de klantenkaart uw ideale looproute in de winkel vaststellen. En Google weet waarschijnlijk meer van uw depressieve klachten dan uw eigen levenspartner. Hij of zij krijgt te horen dat u 's ochtends geen zin hebt om op te staan. Terwijl u in Google al lang hebt gezocht op specifieke zoektermen als ‘manisch depressief, ‘angstremmer' of ‘alternatieve geneeswijze '.

Nieuwsdetector Twitter
Slim gebruik maken van big data werd enkele jaren geleden nog business intelligence genoemd. Maar business intelligence ging over het verleden en was daarom niet slim genoeg. Inmiddels zijn we een stap verder. Het nieuwe vakgebied heet business analytics en voorspelt de toekomst. Die is strategisch vele malen belangrijker.

Een knap staaltje toekomst voorspellen is de manier waarop de VU gebruik maakt van Twitter. Een wiskundige als Bhulai ziet Twitter als een enorme interface, een speeltuin vol semantiek, nullen en enen, waaruit bruikbare informatie te halen valt. Bhulai: "In Nederland worden vijf miljoen tweets per dag verstuurd. Daarmee zijn we internationaal een van de koplopers. Hoe kunnen we in al die tweets nieuws en trends ontdekken? Dat leek ons voor de VU een interessant vraagstuk. Het kan gaan om een kapotte pinautomaat, de vermissing van personen, een brand of een aardbeving. We willen er bovenop zitten als de eerste berichten zich aandienen. We detecteren trends in wording."

Bhulai en zijn team ontwikkelden een dashboard. Daarvoor moesten wel wat hobbels genomen worden. Zo wilde Twitter slechts een klein deel van de data geven. Daarom schakelde Bhulai een team van semantici in, waarmee in totaal 300 typisch Nederlandse woorden werden geselecteerd zoals ‘want', ‘ook' en ‘omdat'. Daarmee wordt meer dan 90 procent van alle tweets binnengehaald. Op basis van clustering van woorden die met elkaar te maken hebben kan Bhulai de versnelling meten van berichtgeving over een bepaald onderwerp. Spam wordt eruit gefilterd en het echte nieuws blijft over. NU.nl werkte mee aan een test en haalde er gemiddeld twee nieuwsitems per dag uit.

Achter zijn beeldscherm toont Bhulai de tien trending topics op 20 maart 2012. Op één staat #PrayForMexico op de dag van de zware aardbeving in de buurt van de stad Acapulco. Een grafiek toont de ontwikkeling van de berichtenstroom. Bhulai: "Kijk, ´s ochtends om twee minuten over half acht kwamen de eerste tweets binnen. Op dat moment waren we er al bij want we willen inzicht in de versnelling. Zo ontdekken we nieuws voordat het nieuws is."

Callcenters
Ook callcenters kunnen veel beter gebruik maken van de nieuwe mogelijkheden door hun eigen bestanden te koppelen aan bijvoorbeeld social media. Bhulai: "Aan ons als wiskundigen de taak alle verschillende datastromen op één plek zien te krijgen in één datawarehouse. Zodra er gebeld wordt door een klant, moet de callcentermedewerker al volledig geïnformeerd zijn. Hoe was het klantgedrag op internet? Welke concurrenten zijn op het web bezocht? Hoe was het surfgedrag op de eigen website? Is de klant al in de webshop geweest? Wanneer was de klant in de fysieke winkel? Welke transacties hebben daar plaatsgevonden? Welke gegevens staan er op de klantenkaart? Welk second best offer kan de klant worden aangeboden? Veel bedrijven zijn nog lang niet zover dat ze al die datastromen met één muisklik beschikbaar hebben."

Telecombedrijven en energiebedrijven zijn volgens Bhulai goed op weg om uit hun databergen nieuwe markt- en klantgegevens te halen. Sectoren die het minder goed doen zijn de kledingretail ("die kennen hun klanten niet") en de zorgsector. De vraag is of ze zich kunnen veroorloven om deze nieuwe kansen onbenut te laten. De zorgsector staat voor de enorme uitdaging om met beperkte middelen de groeiende vraag naar zorg op te vangen. De data die zorginstellingen hebben, herbergt een schat aan informatie die gebruikt kan worden om de organisatie te verbeteren, efficiënter te werken, kosten te besparen en de klant beter te helpen.

Bhulai: "We weten bijvoorbeeld dat ziekenhuizen die patiënten opnemen vaak geen idee hebben wanneer ze ze weer ontslaan. Toch valt dat met big data heel goed te voorspellen. Op die voorspellingen kunnen ze hun capaciteit instellen. Met big data krijgen zorginstellingen prestaties inzichtelijk op het gebied van capaciteitsmanagement, patiëntenzorg, wachttijden en behandelduur. Door toepassing van mathematische beslismodellen kunnen ze analyseren en berekenen welke scenario's gevolgd moeten worden om tot de gewenste wachttijd en capaciteit te komen. Beleidskeuzes worden straks meer gemaakt op basis van feiten en minder met de onderbuik."

De databerg wordt steeds groter. Het datavolume verdubbelt iedere 14 maanden. De grote kunst is te zorgen dat relevante data in iedere laag van de organisatie terecht komt. Van de directeur tot de callcentermedewerker, allemaal halen ze hun eigen gegevens uit een en dezelfde informatiebron. Het callcenter krijgt belangrijke klantinformatie, de afdeling Projekten krijgt informatie om urencalculaties te kunnen maken, de afdeling Service krijgt informatie over het soort onderhoud en het beschikbare personeel en de afdeling Finance krijgt gegevens om liquiditeitsprognoses te kunnen maken. Bhulai: "Elke afdeling haar eigen stuurinformatie. De valkuil is dat alle afdelingen hun eigen toko runnen, en alle leden van de directie dat ook doen. De CIO, CFO, CEO en CTO moeten hetzelfde belang dienen en elkaar helpen om toegevoegde waarde te creëren. Anders vinden ze niets bruikbaars in de databerg."

recente artikelen

gepubliceerd in diverse (vak)media

Uitstervend beroep: natuursteenbewerker

Voor steenhouwers is er in heel Nederland nog één opleiding, die jaarlijks een handjevol vakmensen aflevert voor de hele branche. Bij restauratiebedrijf Slotboom Steenhouwers staan klanten in de rij. “Jemig, bestaat dat vak nog?”

Lees artikel »

Broodfonds redding voor zzp'er Mario van Kemenade

Mario van Kemenade, zzp'er in de bouw, kon een jaar niet werken vanwege een ernstig bedrijfsongeval. “Zonder broodfonds was het voor mijn bedrijf einde oefening geweest.”

Lees artikel »

Recruiter, check gamingskills in sollicitatie

“Ingewikkelder dan schaken”, beweren sommigen. Dat games als League of Legends en Call of Duty speciale skills vragen, leidt geen twijfel. HR-managers zouden standaard naar gamingskills moeten vragen in sollicitatiegesprekken. Dat kan nieuw talent opleveren.

Lees artikel »

Brandweer-coach Biesot over mentale weerbaarheid

Als je ergens klappen moet kunnen verwerken (om geen burn-out te krijgen) is het wel bij de brandweer. Willem Biesot, coach van De Zwerm Groep, weet er alles van. Al vele jaren traint hij brandweermensen om mentaal weerbaar te worden.

Lees artikel »

Digital natives retailen zonder tussenschakels

De keten kan korter. Dat is de overtuiging van digital natives, bedrijven die online zijn geboren, gegroeid en succesvol geworden. 'Cut out the middle man!'

Lees artikel »

Fujitsu over smart society

Het Japanse tech-bedrijf Fujitsu denkt dat artificial intelligence nu pas rijp is voor ontginning. Een gesprek met Pacal Huijbers.

Lees artikel »

Infrastructuur laat zich eenvoudig plat leggen

Het nieuwe kabinet steekt 95 miljoen euro per jaar in cyberveiligheid. Dat is fijn voor straks maar ondertussen is het prijsschieten. "Inbreken kan op alle fronten", stelt de ethical hacker.

Lees artikel »

Klussers bedienen doe je zo

Intergamma, de franchiseorganisatie van Gamma en Karwei, trekt online twee miljoen bezoekers per week. Hoe krijgt Lieke Luttmer, directeur e-commerce, dat voor elkaar?

Lees artikel »

E-commerce duikt op booming pillenmarkt

Het louche imago lijkt verdwenen. Heel Holland slikt en koopt via internet.

Lees artikel »

Permissioned blockchain: hip en pseudo-innovatief

Kan samen oefenen in afgeschermd ecosysteem bestaande markten en sectoren op hun kop zetten?

Lees artikel »