Beroep data-analist

Data-analisten staan in voor het importeren, inspecteren, opschonen, transformeren, valideren, modelleren of interpreteren van gegevensverzamelingen in verband met de zakelijke doelstellingen van het bedrijf. Zij zorgen ervoor dat de gegevensbronnen en opslagplaatsen consistente en betrouwbare gegevens leveren. Data-analisten gebruiken verschillende algoritmen en IT-tools afhankelijk van de situatie en de bestaande gegevens. Zij kunnen rapporten opstellen in de vorm van visualisaties zoals grafieken, diagrammen en dashboards.

Via de uitgebreide beroepskeuzetest kun je zien welke beroepen bij jouw persoonlijkheidsprofiel passen.

Persoonlijkheidstypen

Kennis

  • Business intelligence

    De instrumenten die worden gebruikt om grote hoeveelheden ruwe gegevens om te zetten in relevante en nuttige bedrijfsinformatie.

  • Vertrouwelijkheid van informatie

    De mechanismen en voorschriften die selectieve toegangscontrole mogelijk maken en garanderen dat alleen geautoriseerde partijen (mensen, processen, systemen en apparaten) toegang hebben tot gegevens, de manier om te voldoen aan vertrouwelijke informatie en de risico’s van niet-naleving.

  • Informatiestructuur

    Het type infrastructuur dat het formaat van de gegevens bepaalt: semi-gestructureerd, ongestructureerd en gestructureerd.

  • Gegevensextractie

    De technieken en methoden die worden gebruikt om informatie uit ongestructureerde of semigestructureerde digitale documenten en bronnen te verkrijgen en te extraheren.

  • Beoordeling van kwaliteit van gegevens

    Het proces inzake het opsporen van gegevensproblemen via kwaliteitsindicatoren, maatstaven en metrieken om op die manier strategieën voor gegevensopschoning en gegevensverrijking te plannen aan de hand van criteria voor gegevenskwaliteit.

  • Documentatietypen

    De eigenschappen van soorten interne en externe documentatie die zijn afgestemd op de levenscyclus van het product en de specifieke soorten inhoud ervan.

  • Querytalen

    Gestandaardiseerde computertalen voor het opvragen van informatie uit een databank en van documenten die de benodigde informatie bevatten.

  • Gegevensmodellen

    De technieken en de bestaande systemen voor de structurering van de gegevenselementen en de onderlinge verbanden daartussen, alsook de methoden voor de interpretatie van de gegevensstructuren en -verhoudingen.

  • Ongestructureerde gegevens

    De informatie die niet op een vooraf vastgestelde manier is geordend of geen vooraf vastgesteld gegevensmodel heeft, die moeilijk te begrijpen is en waarin moeilijk patronen herkend kunnen worden zonder gebruik te maken van technieken zoals datamining.

  • Datamining

    De methoden van kunstmatige intelligentie, machinaal leren, statistiek en databanken die worden gebruikt om inhoud uit een dataset te extraheren.

  • Querytaal voor resource description framework

    De querytalen zoals SPARQL, voor het ophalen en manipuleren van de gegevens die zijn opgeslagen in Resource Description Framework format (RDF).

  • Statistiek

    De studie van statistische theorie, methoden en praktijken zoals verzameling, organisatie, analyse, interpretatie en presentatie van gegevens. Het heeft betrekking op alle aspecten van gegevens, met inbegrip van de planning van de gegevensverzameling wat betreft het ontwerp van enquêtes en experimenten om werkgerelateerde activiteiten te voorspellen en te plannen.

  • Technieken voor visuele presentatie

    De technieken voor visuele weergave en interactie, waaronder histogrammen, strooiingsdiagrammen, 3D-oppervlakdiagrammen, boomdiagrammen en diagrammen met parallelle coördinaten, die kunnen worden gebruikt om abstracte numerieke en niet-numerieke gegevens te presenteren om mensen meer inzicht in deze gegevens te bieden.

  • Informatie-indeling

    De indeling van de informatie in categorieën en het aantonen van de relatie tussen de gegevens voor een aantal duidelijk omschreven doeleinden.

Vaardigheden

  • Analytische wiskundige berekeningen uitvoeren

    Wiskundige methoden toepassen en gebruik maken van de berekeningstechnologieën om analyses uit te voeren en oplossingen voor specifieke problemen te bedenken.

  • Gegevensprocessen vaststellen

    Gebruik maken van ICT-instrumenten om wiskundige, algoritmische of andere gegevensverwerkingsprocessen toepassen om informatie te genereren.

  • Criteria voor gegevenskwaliteit definiëren

    Specificeer de criteria aan de hand waarvan de gegevenskwaliteit voor zakelijke doeleinden wordt gemeten, zoals inconsistenties, onvolledigheid, gebruiksvriendelijkheid en nauwkeurigheid.

  • Datamining uitvoeren

    Grote datasets onderzoeken om patronen aan het licht te brengen aan de hand van statistieken, databasesystemen of kunstmatige intelligentie, en de informatie op een begrijpelijke manier presenteren.

  • Steekproefgegevens behandelen

    Verzamelen en selecteren van gegevens van een populatie via een statistische of andere gedefinieerde procedure.

  • Processen voor gegevenskwaliteit implementeren

    Toepassen van kwaliteitsanalyse-, validerings- en verificatietechnieken op gegevens om de integriteit van de gegevens te controleren.

  • ICT-gegevens verzamelen

    Verzamelen van gegevens door zoek- en bemonsteringsmethoden te ontwerpen en toe te passen.

  • Technieken toepassen voor statistische analyses

    Gebruiksmodellen (beschrijvende of inferentiestatistieken) en technieken (datamining of machinaal leren) voor statistische analyse en ICT-instrumenten om gegevens te analyseren, correlaties en verwachte trends aan het licht te brengen.

  • Grote hoeveelheden gegevens analyseren

    Numerieke gegevens in grote hoeveelheden verzamelen en evalueren, met name met het oog op het vaststellen van patronen tussen de gegevens.

  • Gegevens beheren

    Beheren van alle soorten gegevensbronnen gedurende hun levenscyclus door het uitvoeren van dataprofilering, parsing, standaardisatie, identiteitsresolutie, opschoning, verbetering en auditing. Ervoor zorgen dat de gegevens geschikt zijn voor het doel, met behulp van gespecialiseerde ICT-instrumenten om aan de gegevenskwaliteitscriteria te voldoen.

  • Actuele gegevens interpreteren

    Gegevens analyseren die verkregen werden uit bronnen zoals marktgegevens, wetenschappelijke documenten, eisen van klanten en vragenlijsten die actueel zijn om de ontwikkeling en innovatie binnen expertisedomeinen te beoordelen.

  • ICT-gegevens integreren

    Combineren van gegevens uit bronnen om een uniform beeld te geven van de reeks van deze gegevens.

  • Aan gegevensopschoning doen

    Het opsporen en corrigeren van corrupte bestanden van datasets, ervoor zorgen dat de gegevens volgens de richtsnoeren gestructureerd worden en blijven.

  • Gegevens normaliseren

    Het beperken van de gegevens tot hun accurate basisvorm (normale formulieren) om die resultaten te bereiken als minimalisering van de afhankelijkheid, eliminatie van redundantie, vergroting van de consistentie.

Optionele kennis en vaardigheden

webanalyse ldap cloudtechnologieën gegevens verzamelen voor forensische doeleinden xquery informatiearchitectuur online analytische verwerking linq gegevensbank systemen voor gegevensverzameling beheren gegevensmodellen creëren gegevensopslag mdx n1ql berichten over analyseresultaten visuele gegevenspresentatie bieden sparql

Source: Sisyphus ODB