Op werkdagen voor 23:00 besteld, morgen in huis Gratis verzending vanaf €20

Recensie

Succes met Big Data - 'Leerzaam!'

Als je wilt starten met Big Data, is starten met het lezen van dit handzame boek een goed idee. Succes met Big Data van Wiebe en Bert van der Zee vertelt je wat de basisconcepten zijn in korte hoofdstukken die met name ingaan op de techniek.

Elly Stroo Cloeck | 26 februari 2021 | 3-5 minuten leestijd

Succes met Big Data van Wiebe en Bert van der Zee is handig om te zorgen dat iedereen in jouw Big Data-projectgroep dezelfde basiskennis heeft en de bijbehorende termen kent, waaronder Data lake en Data reservoir, en een zee van andere weetjes.

11 zelfstandig leesbare hoofdstukken
Het boek bestaat uit 11 korte hoofdstukken elk over een specifiek onderwerp. Heel makkelijk als je over een specifiek onderwerp wat wilt lezen, want alle hoofdstukken zijn min of meer zelfstandig leesbaar. De volgende onderwerpen worden behandeld:

- Big Data - over het verschil met ‘gewone' data in databases en toepassingen van Big Data;
- Opslag - over data ontwerp, met ook informatie over programmeertalen Fortran, Unix en C en over data-opslag, met een beschrijving van de werking van (no)SQL databases, datawarehouse en data mart, data lake en data reservoir)
- Proces - over data-analyse, data-mining, Big Data verwerken en Predictive Analytics;
- Beslisboom - over deze analysemethode met bijbehorende wiskundige formules;
- Neurale netwerken - over de voordelen en beperkingen en de (zelf)lerende methoden;
- Clusteren - hoe je grote dataverzamelingen behapbaar maakt met hiërarchisch, puntsgewijs en dichtheidsgewijs clusteren;
- Lineaire regressie - over het visualiseren van meetpunten;
- Naaste buur - over patroonherkenning;
- Regels afleiden - uit grote hoeveelheden data, met een mooi voorbeeld van hooikoorts wat er heel herkenbaar uitziet: dit gebruiken we nu bij het onderscheid tussen verkoudheid en Corona;
- Zin en onzin - over kwaliteitsmanagement en manipulatief presenteren;
- Ethiek - over bijvoorbeeld Cambridge Analytica en het beïnvloeden van je klanten.

Verder zijn er 3 appendices, die een praktijkvoorbeeld geven, verder ingaan op statistische methoden, en op technisch niveau uitwerken hoe te starten met Big Data, bijvoorbeeld welke IT architectuur je nodig hebt en hoe je een BD project aanpakt. Ook is er een lijst met tools.
Elk hoofdstuk heeft (uitgewerkte) voorbeelden. In het hoofdstuk Big Data is het interessante en heel actuele voorbeeld van het Corona-dashboard van de John Hopkins Universiteit opgenomen. De input daarvoor komt uit een aantal internationale databases maar ook uit datamining op Twitterfeeds en nieuwsberichten. JHU stelt de data gratis beschikbaar; overheden in alle landen gebruiken ze voor de Corona-bestrijding. Wat een nuttige toepassing!

Breed en relevant
Ik vond het boek vrij breed, goed voor een naslagwerk, maar van een aantal onderwerpen vroeg ik me echt af of ik dat wel nodig had om Big Data te begrijpen, bijvoorbeeld de exacte werking van databases. Anderzijds was deze informatie wel handig om juist de verschillen tussen gestructureerde en ongestructureerde data te begrijpen.

Het boek raakt de meest relevante zaken die bij Big Data komen kijken. De afbeeldingen en plaatjes voegen niet altijd wat toe, en soms worden er fouten bij gemaakt. Slordig. Ondanks het uitgebreide gebruik van termen is het toch goed leesbaar en de vele voorbeelden zijn goed te volgen. Daardoor reikt het boek een soort gemeenschappelijke taal aan, wat de onderlinge communicatie tussen programmeurs en gebruikers van BD zeker zal bevorderen.

Voor wie is dit boek nuttig?
Er zal bijna geen bedrijf meer zijn wat niet aan de slag wil, of moet, met Big Data, en voor deze bedrijven is dit boek relevant en actueel. Na het lezen weet je zeker meer over gestructureerde en ongestructureerde data, algoritmes, etc. maar er is natuurlijk nog wel wat meer nodig dan techniek om ‘Succes met Big Data' te hebben.

De schrijvers geven aan dat de doelgroep ‘iedereen is die met Big Data te maken krijgt', van programmeur, via analist tot gebruiker. Het boek lijkt geschreven te zijn voor mensen die al in de IT werkzaam zijn en de stap willen maken naar Big Data. Een beetje kennis van statistiek is voor de lezer ook wel handig, anders gaan de formules, met name die in de appendix, je al snel duizelen. Ik moest het woord ‘polynoom' even opzoeken..... Dat blijkt toch wel basiskennis statistiek te zijn, wat bij mij is weggezakt. Leerzaam dus, dit boek!

Over Elly Stroo Cloeck

Elly Stroo Cloeck is project- en interim-manager op het gebied van Finance, Internal Audit en Risk Management. Daarnaast schrijft ze recensies en samenvattingen van managementboeken.

Deel dit artikel

Wat vond u van dit artikel?

0
0

Boek bij dit artikel

Wiebe van der Zee, Bert van der Zee
Succes met Big Data

Populaire producten

    Personen

      Trefwoorden