Een verhaal vertellen met data is een reis die meestal niet bij jou begint. Deze gegevens moeten ergens vandaan komen. Om de gegevens op een voor jou bruikbare plaats te krijgen, is inspanning nodig die waarschijnlijk buiten je bereik ligt. En dit vooral met het oog op de onderneming.
De toepassingen en projecten van vandaag kunnen groot en ingewikkeld zijn. Hierbij worden vaak de de vaardigheden en kennis van tal van individuen gebruikt.
Elk persoon brengt een uniek talent en expertise met zich mee. Om een project van concept tot productie goed te laten verlopen, werkt iedereen samen om de taken en verantwoordelijkheden op de juiste manier te coördineren en te verdelen.
In het recente verleden waren functies als business analisten en business intelligence-ontwikkelaars de standaard voor gegevensverwerking en -begrip. Door de buitensporige uitbreiding van de omvang en de soorten gegevens zijn deze rollen echter geëvolueerd naar meer gespecialiseerde vaardigheden. Vaardigheden die de processen van data-engineering en -analyse moderniseren en stroomlijnen.
De volgende secties belichten deze verschillende rollen in data en de specifieke verantwoordelijkheid in het algemene spectrum van data-ontdekking en -begrip:
Hoewel er enkele overeenkomsten zijn tussen een data-analist en een business analist, is de belangrijkste onderscheidende factor tussen de twee rollen wat ze met data doen.
Een business analist staat dichter bij de business en is een specialist in het interpreteren van de data die uit de visualisatie komt.
Vaak kunnen de rollen van data-analist en business analist de verantwoordelijkheid zijn van één persoon.
Met behulp van een data-analist maximaliseren bedrijven de waarde van hun data-assets door middel van visualisatie- en rapportage tools zoals Microsoft Power BI. Data-analisten zijn verantwoordelijk voor het profileren, opschonen en transformeren van gegevens. Hierbij hoort ook het ontwerpen en bouwen van schaalbare en effectieve datamodellen en het inschakelen en implementeren van de geavanceerde analysemogelijkheden in rapporten voor analyse.
Een data analist werkt samen met de relevante belanghebbenden om geschikte en noodzakelijke gegevens en rapportagevereisten te identificeren. Daarna zetten ze onbewerkte gegevens om in relevante en zinvolle inzichten.
Een data analist is ook verantwoordelijk voor het beheer van business intelligence, waaronder rapporten, dashboards, werkruimten en de onderliggende datasets die in de rapporten worden gebruikt. Ze implementeren en configureren de juiste beveiligingsprocedures, in combinatie met de vereisten van belanghebbenden, om de veilige bewaring van hun gegevens te waarborgen.
Data-analisten werken samen met data ingenieurs om geschikte gegevensbronnen te bepalen en te lokaliseren die voldoen aan de vereisten van belanghebbenden. Bovendien werken data analisten samen met de data engineer en databasebeheerder om ervoor te zorgen dat de analist toegang heeft tot de juiste gegevensbronnen. De data analist werkt ook samen met de data engineer om nieuwe processen te identificeren of bestaande processen te verbeteren voor het verzamelen van gegevens voor analyse.
Data engineers leveren en installeren dataplatform technologieën die on-premises en in de cloud zijn. Ze beheren en beveiligen de stroom van gestructureerde en ongestructureerde gegevens uit meerdere bronnen. De gegevens platforms die ze gebruiken, kunnen relationele databases, niet-relationele databases, gegevensstromen en bestand archieven zijn. Data engineers zorgen er ook voor dat nieuwe data services veilig en naadloos worden geïntegreerd in bestaande data services.
De primaire verantwoordelijkheden van data engineers zijn onder meer het gebruik van on-premises en cloud gegevensservices en hulpmiddelen om gegevens uit meerdere bronnen op te nemen, uit te gaan en te transformeren. Data engineers werken samen met zakelijke belanghebbenden om gegevens vereisten te identificeren en hieraan te voldoen. Zij ontwerpen en implementeren dus oplossingen.
Er kan enige overeenstemming bestaan in de taken en verantwoordelijkheden van een data engineer en een databasebeheerder. Het werk van een data engineer gaat echter veel verder dan het zorgen voor een database en de server waarop deze wordt gehost. Het gaat waarschijnlijk niet om het algehele operationele gegevensbeheer.
Een data engineer voegt enorme waarde toe aan business intelligence en data science projecten. Wanneer de data engineer data samenbrengt, vaak omschreven als data-ruzie, gaan projecten sneller omdat data wetenschappers zich kunnen concentreren op hun eigen werkterrein.
Als data analist werk je nauw samen met een data engineer om ervoor te zorgen dat je toegang hebt tot de verscheidenheid aan gestructureerde en ongestructureerde data bronnen. Deze bronnen zullen je ondersteunen bij het optimaliseren van datamodellen, die doorgaans worden bediend vanuit een modern datawarehouse of data lake.
Zowel database beheerders als business intelligence professionals kunnen overstappen naar een rol als data engineer. Belangrijk is dan wel dat ze de tools en technologie moeten leren die worden gebruikt om grote hoeveelheden gegevens te verwerken.
Een data scientist voert geavanceerde analyses uit om waarde uit data te halen.
Het werk varieert van beschrijvende analyses tot voorspellende analyses. Beschrijvende analyses evalueren gegevens via een proces dat exploratory data-analyse (EDA) wordt genoemd. Voorspellende analyses worden gebruikt bij machine learning om modelleringstechnieken toe te passen die afwijkingen of patronen kunnen detecteren. Deze analyses zijn belangrijke onderdelen van prognosemodellen.
Beschrijvende en voorspellende analyses zijn slechts gedeeltelijke aspecten van het werk van data scientists. Sommige data scientists werken mogelijk op het gebied van deep learning en voeren iteratieve experimenten uit om een complex data probleem op te lossen met behulp van aangepaste algoritmen.
Anekdotisch bewijs suggereert dat het meeste werk in een data science-project wordt besteed aan data-ruzie en feature-engineering. Data scientists kunnen het experimenteren proces versnellen wanneer data engineers hun vaardigheden gebruiken om met succes data te ruziën.
Op het eerste gezicht lijkt het misschien dat een data scientist en een data analist ver uit elkaar liggen in het werk dat ze doen, maar dit vermoeden is niet waar. Een data scientist kijkt naar data om de vragen te bepalen die beantwoord moeten worden. Hij bedenkt vaak een hypothese of een experiment en wendt zich vervolgens tot de data analist om te helpen bij de datavisualisatie en rapportage.
Een databasebeheerder implementeert en beheert de operationele aspecten van cloud-native en hybride dataplatform oplossingen.
Een database beheerder is verantwoordelijk voor de algehele beschikbaarheid en consistente prestaties en optimalisaties van de database oplossingen.
Ze werken samen met belanghebbenden om het beleid, de hulpmiddelen en de processen voor gegevensback-up- en herstelplannen te identificeren en te implementeren.
De rol van een databasebeheerder is anders dan die van een data engineer. Een database beheerder bewaakt en beheert de algehele gezondheid van een database en de hardware waarop deze zich bevindt. Een data engineer is betrokken bij het proces van gegevens ruzie. Oftewel het opnemen, transformeren, valideren en opschonen van gegevens om aan zakelijke behoeften en eisen te voldoen.
De databasebeheerder is ook verantwoordelijk voor het beheer van de algehele beveiliging van de gegevens. Denk aan, het verlenen en beperken van gebruikerstoegang en -rechten tot de gegevens, zoals bepaald door de zakelijke behoeften en vereisten.
Het is zijn passie om zijn kennis op een eenvoudige en positieve manier te doceren aan zijn studenten.