BOEKONOMIKA

Principles of Database Management

Wilfried Lemahieu, Seppe vanden Broucke, Bart Baesens

WAAROM HEBBEN JULLIE BESLIST HET BOEK PRINCIPLES OF DATABASE MANAGEMENT TE SCHRIJVEN?

Wilfried Lemahieu: We gaven reeds meer dan 20 jaar een tweetal vakken over database management, gevolgd door zowel bachelor- als masterstudenten, en vonden eigenlijk geen enkel bestaand boek dat een goede balans had tussen theoretische diepgang en praktische toepassing. Verder zagen we de interesse in deze materie sterk groeien. Toen we het vak Principles of Database Management begonnen te doceren hadden we 50 studenten, ondertussen hebben we er al 375! Op basis van onze cursusinhoud en slides zijn we dan maar aan de slag gegaan en besloten we zelf een boek te schrijven. Daarbij wilden we de materie ook voldoende breed benaderen. Naast dus de materie over databasemodellering en diverse types databasesystemen, hebben we het ook over de database in haar context: gaande van data-integratie over data-governance tot zelfs diverse technieken voor data-analytics.

BIEDEN JULLIE NAAST HET BOEK OOK NOG ANDERE SERVICES AAN?

Seppe vanden Broucke: Ja, op onze boekwebsite www.pdbmbook.com bieden we verschillende add-ons, zoals gratis YouTube video’s, slides in het Engels en Mandarijns en ook een online quizomgeving waar de studenten automatisch multiple choice vragen kunnen genereren, ofwel per hoofdstuk of over geselecteerde hoofdstukken heen. Dat laatste wordt door de studenten zeer enthousiast onthaald, gezien ze zo zeer gemakkelijk hun begrip van de leerstof kunnen verifiëren en zich voorbereiden op het examen. Verder hebben we ook een online playgroundomgeving waar de studenten kunnen experimenteren op een aantal voorbeeld-databases die wij vooraf aangemaakt hebben. Ze kunnen daarbij zonder zelf ingewikkelde installaties te hoeven doen kennismaken met zowel de ‘gevestigde waarde’ van een relationele databasesysteem als met nieuwere, NoSQL systemen zoals MongoDB en Neo4j.

HOE POPULAIR IS HET BOEK MOMENTEEL?

Bart Baesens: Het boek wordt momenteel door zo’n kleine honderd universiteiten wereldwijd gebruikt als handboek in cursussen over Database Management, Data Modeling en zelfs Data Science. Tussen die universiteiten zitten toch behoorlijk wat kleppers zoals University of Cambridge, University College London en National University of Singapore. Er is recent ook een vertaling van het boek in het Mandarijns gepubliceerd. Op termijn zijn we ook van plan onze YouTube video’s in het Mandarijns te laten inspreken.

HOE LANG DUURT HET SCHRIJVEN VAN EEN BOEK?

Wilfried: Het was een zeer intensief, lang maar leerrijk proces. Eerst moet je een internationale uitgever vinden. We hadden er een drietal gecontacteerd en zijn dan uiteindelijk met Cambridge University Press in zee gaan, gezien de ondersteuning zowel tijdens het schrijfproces zelf als de marketing achteraf. We hebben het werk dan onder ons drie verdeeld maar uiteraard elkaars hoofdstukken ook grondig nagelezen, herwerkt en gecontroleerd op inconsistenties en overlap. De hoofdstukken werden dan ook nog eens extern gereviewed wat ons bijzonder nuttige inzichten opleverde en de kwaliteit sterk ten goede kwam.

Die externe ‘development editor’ was een Amerikaan waarmee het wonderwel klikte. Hij had een groot gevoel voor humor en een passie voor wielrennen: hij kon zowaar elke heuvel in de Ronde van Vlaanderen uit het hoofd opnoemen, hoewel hij nog nooit in België geweest was. Het ganse proces van publisher pitching tot publicatie heeft ruwweg zo’n 2 jaar in beslag genomen.

KUNNEN JULLIE EEN DRIETAL LESSEN MEEGEVEN DIE HET LEZEN VAN HET BOEK OPLEVEREN?

Bart: Een eerste les betreft datakwaliteit. Om goede beslissingen te nemen, gestoeld op data, is het belangrijk dat de data van goede kwaliteit is. Vaak valt daar meer winst te boeken dan meteen meer complexe analysemethode. Datakwaliteit is echter een multidimensioneel concept met verschillende criteria zoals accuraatheid van data (bijvoorbeeld leeftijd is 300 jaar), data volledigheid (bijvoorbeeld leeftijd ontbreekt), dataconsistentie (bijvoorbeeld een student die meer studiepunten in zijn programma heeft dan toegelaten), etc. Goede datakwaliteit is essentieel voor het nemen van goede beslissingen. Je kan het een beetje vergelijken met een kok die geen goede schotel kan maken op basis van slechte ingrediënten.

Seppe: Een tweede les is dat men altijd omzichtig en gezond kritisch moet omgaan met nieuwe technologieën. NoSQL-data bases werden bijvoorbeeld met veel tromgeroffel binnen dedata basewereld onthaald, maar naderhand bleek het toch minder evident om ze succesvol in productie te brengen. Veel bedrijven zijn dan ook op hun stappen moeten terugkeren en teruggegaan naar hun oude, vertrouwde, meer robuuste en stabiele SQL-omgevingen zoals MySQL, Oracle, IBM en Microsoft.Tegelijk plooien veel producenten van NoSQL-databases zich dubbel om, jawel, een SQL-interface bovenop hun product te voorzien.

Wilfried: Een derde les is dat het belangrijk is dat men als data architect, data modeler of data scientist heel nauw samenwerkt met de business. Het is immers heel belangrijk om de vereisten van de business grondig te kennen en te begrijpen vooraleer men ze met een geschikt datamodel optimaal in kaart kan brengen. Een goed datamodel is een eerste garantie voor datakwaliteit wat dan terug aan de eerste les relateert.

HOE KAN JE DE LEZER VASTHOUDEN TIJDENS HET LEZEN VAN HET BOEK?

Seppe: We hebben hier vooraf grondig over nagedacht en bieden hiervoor drie faciliteiten aan. We hebben een (fictief)scenario opgesteld rond Sober, een taxibedrijf dat met zelfrijdende auto’s werkt, en gebruiken dit als rode raad doorheen het ganse boek. Elk hoofdstuk begint dan met een concrete probleemstelling van Sober en eindigt met de oplossingen ervoor zoals besproken in het hoofdstuk. Verder hebben we ook Connection boxes voorzien die koppelingen leggen tussen de hoofdstukken zodat de lezer duidelijk de samenhang ervan kan opvolgen. Ook hebben we Content boxes voorzien die af en toe wat breder uitzoomen en zeer concrete (bedrijfs-)voorbeelden geven van het besproken materiaal. Andere voorbeelden zijn iets persoonlijker van aard, zoals de inhoud van Barts wijnkelder. Verder eindigt elk hoofdstuk met een set van multiple choice en open vragen.

WORDT MEN RIJK VAN HET SCHRIJVEN VAN EEN BOEK?

Bart: Tot onze grootste spijt niet. De royalties bij het schrijven van een boek liggen typisch rond de 20% van de netto boekomzet. Gezien de relatief lage prijs (ondanks uiteraard de kwaliteit!), laten we het aan de lezer om de rekenoefening te doen. Trouwens, wie ons op dit gebied toch absoluut een handje willen toesteken, kan het boek gemakkelijk bestellen op www.amazon.com.