Big Data en gegevenskwaliteit

In mijn vorige blog heb ik geschreven over de toegevoegde waarde van BiSL voor Big Data. Ik heb daarbij aangegeven dat een deel van de toegevoegde waarde vanuit BiSL ligt in de zorg voor de gegevens en de gegevenskwaliteit. Binnen BiSL is hiervoor het proces Beheer Bedrijfsinformatie gedefinieerd. Het is voor de hand liggend dat dit BiSL-proces en Big Data sterk met elkaar verweven zijn.

Inmiddels ben ik gestart met het schrijven van een boek over het BiSL-procescluster Gebruiksbeheer. Dit boek gaat deel uitmaken van een set van boeken die voor het BiSL-framework (waarin het WAT staat beschreven) invulling geven aan de vraag HOE je de door BiSL gedefinieerde processen kunt uitvoeren. Een van de processen binnen Gebruiksbeheer is het proces Beheer Bedrijfsinformatie. Dit proces gaat onder andere in op de zorg voor het gebruik en de kwaliteit van de gegevens in de informatiehuishouding van een organisatie. Big Data zal voor de gegevenskwaliteit wel het nodige betekenen.

Ik moest hier eerder deze week aan denken, toen de brandstofmeter in mijn auto in de rode zone was gekomen. Tijd om een tankstation op te zoeken. En dan liefst een niet al te duur tankstation. Maar ja, waar is de brandstof voordelig en waar niet? Hiervoor heeft een vriend mij niet zo lang geleden een handige app voor op mijn smartphone aangeraden. Op deze app kun je zien welke tankstations zitten in de buurt van je actuele locatie en wat de brandstofprijs daar is. Heel handig! Nu vertrouwt mijn vriend altijd blindelings op alles wat hij binnenkrijgt via zijn app-jes. Maar ik ben zo eigenwijs dat ik daar niet altijd op vertrouw. Helaas heb ik de laatste tijd af en toe wat tijd over. En dan kan ik soms de verleiding niet weerstaan om toch eens de gegevens van mijn app-je te ijken aan de pompprijzen. En wat is de uitkomst? De app heeft niet altijd gelijk! Sterker nog, het lijkt er soms op, dat de prijzen van de app ’s-ochtends vaker kloppen dan later op de dag, wanneer de pompprijzen in de loop van de dag een beetje omhoog gegaan zijn! Waarschijnlijk gewoon toeval of een tijdvertraging waardoor de gegevens in het app-je nog niet up-to-date zijn. Of zou er toch een slimme truc achter zitten? Het lijkt mij, dat niet veel bestuurders nog door zullen rijden naar een ander tankstation, nadat hun app-je hen naar een bepaald tankstation heeft gestuurd, zelfs als de prijzen daar (inmiddels een beetje) hoger zijn. De kwaliteit van de gegevens in mijn app-je heeft in dit voorbeeld dus een direct financieel gevolg voor mij.

Waarom breng ik dit consumentenvoorbeeld nu in verband met Big Data en het BiSL-proces Beheer Bedrijfsinformatie? Welnu, het is niet altijd even duidelijk hoe betrouwbaar externe data zijn. En zoals uit eigen onderzoek is gebleken, zijn niet alle externe data op ieder moment even betrouwbaar als je eigenlijk zou willen. Het is belangrijk, om met dit gegeven rekening te houden als je (als organisatie) vorm geeft aan gegevensgebruik en bezig gaat allerlei gegevens –ook vanuit externe bronnen- met elkaar te verbinden. Het is niet alleen noodzakelijk om goed te weten waarvoor je alle gegevens wilt gebruiken en op basis daarvan kwaliteitscriteria voor de eigen processen en gegevens te definiëren en te bewaken. Het is ook belangrijk, om te weten met welk doel externe gegevens worden verzameld, wat de kwaliteitsnormen en –maatregelen zijn voor dergelijke gegevenssets en ook wat het achterliggende business-model van de externe partij is om deze gegevens te willen delen.

Op basis van deze kennis is het mogelijk om gepaste maatregelen voor de eigen procesvoering en de eigen gegevenskwaliteit te nemen. Hopelijk worden onverwachte en ongewenste effecten (in mijn voorbeeld een hogere brandstofrekening) voorkomen. Het doel van informatievoorziening is immers te komen tot een beter organisatieresultaat en niet tot een verslechtering. Ook voor de in ontwikkeling zijnde boekenreeks waarin we allerlei instrumenten aanreiken om de BiSL-processen echt op te pakken en uit te voeren is dit de achterliggende gedachte. Vanzelfsprekend zal gegevenskwaliteit een belangrijk onderwerp zijn in het boek over het BiSL-cluster Gebruiksbeheer. Daarmee wordt ook een verdere invulling gegeven aan de toegevoegde waarde van BiSL voor Big Data.

Wil je reageren op deze blog? Stuur me dan even een mail: frank.van.outvorst@thelifecyclecompany.nl