Beroep data-analist
Data-analisten staan in voor het importeren, inspecteren, opschonen, transformeren, valideren, modelleren of interpreteren van gegevensverzamelingen in verband met de zakelijke doelstellingen van het bedrijf. Zij zorgen ervoor dat de gegevensbronnen en opslagplaatsen consistente en betrouwbare gegevens leveren. Data-analisten gebruiken verschillende algoritmen en IT-tools afhankelijk van de situatie en de bestaande gegevens. Zij kunnen rapporten opstellen in de vorm van visualisaties zoals grafieken, diagrammen en dashboards.
Via de uitgebreide beroepskeuzetest kun je zien welke beroepen bij jouw persoonlijkheidsprofiel passen.
Persoonlijkheidstypen
Kennis
- Business intelligence
De instrumenten die worden gebruikt om grote hoeveelheden ruwe gegevens om te zetten in relevante en nuttige bedrijfsinformatie.
- Vertrouwelijkheid van informatie
De mechanismen en voorschriften die selectieve toegangscontrole mogelijk maken en garanderen dat alleen geautoriseerde partijen (mensen, processen, systemen en apparaten) toegang hebben tot gegevens, de manier om te voldoen aan vertrouwelijke informatie en de risico’s van niet-naleving.
- Informatiestructuur
Het type infrastructuur dat het formaat van de gegevens bepaalt: semi-gestructureerd, ongestructureerd en gestructureerd.
- Gegevensextractie
De technieken en methoden die worden gebruikt om informatie uit ongestructureerde of semigestructureerde digitale documenten en bronnen te verkrijgen en te extraheren.
- Beoordeling van kwaliteit van gegevens
Het proces inzake het opsporen van gegevensproblemen via kwaliteitsindicatoren, maatstaven en metrieken om op die manier strategieën voor gegevensopschoning en gegevensverrijking te plannen aan de hand van criteria voor gegevenskwaliteit.
- Documentatietypen
De eigenschappen van soorten interne en externe documentatie die zijn afgestemd op de levenscyclus van het product en de specifieke soorten inhoud ervan.
- Querytalen
Gestandaardiseerde computertalen voor het opvragen van informatie uit een databank en van documenten die de benodigde informatie bevatten.
- Gegevensmodellen
De technieken en de bestaande systemen voor de structurering van de gegevenselementen en de onderlinge verbanden daartussen, alsook de methoden voor de interpretatie van de gegevensstructuren en -verhoudingen.
- Ongestructureerde gegevens
De informatie die niet op een vooraf vastgestelde manier is geordend of geen vooraf vastgesteld gegevensmodel heeft, die moeilijk te begrijpen is en waarin moeilijk patronen herkend kunnen worden zonder gebruik te maken van technieken zoals datamining.
- Datamining
De methoden van kunstmatige intelligentie, machinaal leren, statistiek en databanken die worden gebruikt om inhoud uit een dataset te extraheren.
- Querytaal voor resource description framework
De querytalen zoals SPARQL, voor het ophalen en manipuleren van de gegevens die zijn opgeslagen in Resource Description Framework format (RDF).
- Statistiek
De studie van statistische theorie, methoden en praktijken zoals verzameling, organisatie, analyse, interpretatie en presentatie van gegevens. Het heeft betrekking op alle aspecten van gegevens, met inbegrip van de planning van de gegevensverzameling wat betreft het ontwerp van enquêtes en experimenten om werkgerelateerde activiteiten te voorspellen en te plannen.
- Technieken voor visuele presentatie
De technieken voor visuele weergave en interactie, waaronder histogrammen, strooiingsdiagrammen, 3D-oppervlakdiagrammen, boomdiagrammen en diagrammen met parallelle coördinaten, die kunnen worden gebruikt om abstracte numerieke en niet-numerieke gegevens te presenteren om mensen meer inzicht in deze gegevens te bieden.
- Informatie-indeling
De indeling van de informatie in categorieën en het aantonen van de relatie tussen de gegevens voor een aantal duidelijk omschreven doeleinden.
Vaardigheden
- Analytische wiskundige berekeningen uitvoeren
Wiskundige methoden toepassen en gebruik maken van de berekeningstechnologieën om analyses uit te voeren en oplossingen voor specifieke problemen te bedenken.
- Gegevensprocessen vaststellen
Gebruik maken van ICT-instrumenten om wiskundige, algoritmische of andere gegevensverwerkingsprocessen toepassen om informatie te genereren.
- Criteria voor gegevenskwaliteit definiëren
Specificeer de criteria aan de hand waarvan de gegevenskwaliteit voor zakelijke doeleinden wordt gemeten, zoals inconsistenties, onvolledigheid, gebruiksvriendelijkheid en nauwkeurigheid.
- Datamining uitvoeren
Grote datasets onderzoeken om patronen aan het licht te brengen aan de hand van statistieken, databasesystemen of kunstmatige intelligentie, en de informatie op een begrijpelijke manier presenteren.
- Steekproefgegevens behandelen
Verzamelen en selecteren van gegevens van een populatie via een statistische of andere gedefinieerde procedure.
- Processen voor gegevenskwaliteit implementeren
Toepassen van kwaliteitsanalyse-, validerings- en verificatietechnieken op gegevens om de integriteit van de gegevens te controleren.
- ICT-gegevens verzamelen
Verzamelen van gegevens door zoek- en bemonsteringsmethoden te ontwerpen en toe te passen.
- Technieken toepassen voor statistische analyses
Gebruiksmodellen (beschrijvende of inferentiestatistieken) en technieken (datamining of machinaal leren) voor statistische analyse en ICT-instrumenten om gegevens te analyseren, correlaties en verwachte trends aan het licht te brengen.
- Grote hoeveelheden gegevens analyseren
Numerieke gegevens in grote hoeveelheden verzamelen en evalueren, met name met het oog op het vaststellen van patronen tussen de gegevens.
- Gegevens beheren
Beheren van alle soorten gegevensbronnen gedurende hun levenscyclus door het uitvoeren van dataprofilering, parsing, standaardisatie, identiteitsresolutie, opschoning, verbetering en auditing. Ervoor zorgen dat de gegevens geschikt zijn voor het doel, met behulp van gespecialiseerde ICT-instrumenten om aan de gegevenskwaliteitscriteria te voldoen.
- Actuele gegevens interpreteren
Gegevens analyseren die verkregen werden uit bronnen zoals marktgegevens, wetenschappelijke documenten, eisen van klanten en vragenlijsten die actueel zijn om de ontwikkeling en innovatie binnen expertisedomeinen te beoordelen.
- ICT-gegevens integreren
Combineren van gegevens uit bronnen om een uniform beeld te geven van de reeks van deze gegevens.
- Aan gegevensopschoning doen
Het opsporen en corrigeren van corrupte bestanden van datasets, ervoor zorgen dat de gegevens volgens de richtsnoeren gestructureerd worden en blijven.
- Gegevens normaliseren
Het beperken van de gegevens tot hun accurate basisvorm (normale formulieren) om die resultaten te bereiken als minimalisering van de afhankelijkheid, eliminatie van redundantie, vergroting van de consistentie.
Optionele kennis en vaardigheden
webanalyse ldap cloudtechnologieën gegevens verzamelen voor forensische doeleinden xquery informatiearchitectuur online analytische verwerking linq gegevensbank systemen voor gegevensverzameling beheren gegevensmodellen creëren gegevensopslag mdx n1ql berichten over analyseresultaten visuele gegevenspresentatie bieden sparqlSource: Sisyphus ODB