Bedrijven hebben er de mond van vol: Big Data. Het is de toekomst, een onontgonnen terrein met oneindige mogelijkheden. Bedrijven schieten als paddenstoelen uit de grond, organisaties nemen speciale data-analisten in dienst. Maar wat is Big Data eigenlijk? En wat kan de corporatie ermee?
Door Silvester de Ruig
De meest gehanteerde definitie van Big Data is afkomstig uit een rapport uit 2001 van Gartner, een van de grootste Amerikaanse onderzoeks- en adviesbureaus in de informatietechnologie. Volgens deze definitie wordt Big Data gekenmerkt door de drie V’s: volume, variety and velocity.
Volume staat voor de enorme hoeveelheid en exponentieel groeiende data. Zo zijn er data beschikbaar van miljoenen smartphones, van Facebook, van aankopen etc. De tweede v in de definitie variety geeft aan dat waar vroeger data vooral van Excel-sheets of databases kwamen, er nu honderden bruikbare formats zijn. Denk aan: tekst, foto, audio, video, web, GPS data, data afkomstig van sensoren, relational data bases (gegevens opgeslagen in tabelvorm), documenten, SMS, tweets, pdf, flash etc. De velocity geeft het belang weer om al deze data snel te kunnen analyseren.
Big Data in de praktijk
Als men in de praktijk over Big Data spreekt, dan gaat het meestal over het vinden van verbanden tussen gegevens die door de hoeveelheid, variëteit en snelheid het menselijk brein te boven gaan. Deze analyses gebeuren dan door middel van machine learning, een methode om met computers complexe modellen en algoritmes te ontwerpen die zich lenen voor voorspellingen. Want daar gaat het uiteindelijk om: het uit de enorme data-brij halen van verbanden die van belang zijn voor bijvoorbeeld toekomstig beleid van de organisatie.
Smart Data bij Eigen Haard
Ivar Vermazen, senior onderzoeker bij Eigen Haard, pleit er voor om als corporatie eerst te kijken wat er met de data uit de eigen organisatie mogelijk is, alvorens allerlei data te gaan kopen: nagaan hoe gegevens die de corporatie al in huis heeft slimmer kunnen worden benut. Hij praat in corporatieverband liever over smart data, waarin het meer gaat over de kwaliteit van de data dan over de hoeveelheid, dan over Big data. ‘Meestal gaat het nu nog om het slim koppelen van verschillende informatiebronnen. Van het koppelen van enorme hoeveelheden data, van zeer veel verschillende bestanden, is in de sector vaak nog geen sprake.’
Als redenen voor de focus op het gebruik van smart data bij Eigen Haard noemt hij: de beperkte kennis over de huurder, het optimaliseren van de interne administratie- en informatiesystemen, de toenemende focus op doelmatig en passend huisvesten en de inzet van middelen hiertoe, en het ontginnen van nieuwe toepassingsmogelijkheden. ‘Zo hebben we bij Eigen Haard op het gebied van leefbaarheid voor een pilotonderzoek naar de leefbaarheid in een buurt in Amsterdam het Analysecentrum ingehuurd, en hebben we Peter Windt van Vastgoed Marketing Advies ingeschakeld om het bewonersdraagvlak voor verduurzaming van onze woningen in Amstelveen in kaart te brengen. In deze specifieke gevallen maken we dus vooral gebruik van data van buitenaf.’
Aanbevelingen
Wat Vermazen andere corporaties met betrekking tot het gebruik van Big of smart Data zou willen aanbevelen? ‘Betrek de vraagsteller uit de organisatie bij het proces, kijk dus eerst wat er met de eigen data mogelijk is, let goed op de betrouwbaarheid van de data, gebruik GIS om data te koppelen aan openbare bronnen, zoek eventueel samenwerking om data te kopen, wees terughoudend met persoonsgegevens van huurders. Het is belangrijk om verantwoordelijk om te gaan met data van onze huurders. Daarnaast is de privacywetgeving behoorlijk streng.
Publicaties
Meer weten over definities van Big Data? Lees dan de Survey van de University of St Andrews.