Technische handleiding Persoonlijkheidstest

Inhoudsopgave

1. Inleiding
2. Methode
   2.1 Gebruikte instrumenten
3. Verkenning en selectie van de onderzoeksdata
   3.1 Leeftijd
   3.2 Geslacht
   3.3. Opleidingsniveau
   3.4 Nationaliteit
   3.5 Arbeidsmarktpositie
   3.6 Werksectorbranche
   3.7 Afnameduur
   3.8 Responsevariatie
   3.9 Menselijke response
4. Analyse
   4.1 Ruwe scores
   4.2 Correlaties
   4.3 Betrouwbaarheid
   4.4 Constructvaliditeit/factoranalyse
5. Normering
   5.1 Beroepsbevolking volgens het cbs
   5.2 Groepsverschillen
6. Conclusie
7. Referenties

Inleiding

Dit document geeft inzicht in de psychometrie van de Big Five persoonlijkheidstest van 123test. Deze door 123test B.V. ontwikkelde test is een speciaal voor de Nederlandse markt gemaakte operationalisatie van de Big Five persoonlijkheidstheorie.

De test meet de vijf hoofddimensies van persoonlijkheid en de 30 onderliggende schalen. De Big Five persoonlijkheidstest van 123test is geen vertaling of bewerking van een buitenlands instrument maar echt gemaakt in en voor Nederland. Daarmee is het een actueel instrument, dat bovendien een hoge betrouwbaarheid heeft, een hoge validiteit heeft en een representatieve en recent samengestelde normgroep gebruikt.

Informatie over betrouwbaarheid, validiteit en normering worden in dit document beschreven. Ook wordt er besproken hoe de dimensies van deze test variëren als een functie van opleidingsniveau, geslacht en leeftijd.

Methode

Sinds 1 november 2019 zijn op www.123test.nl meer dan 100.000 afnames van de Big Five Persoonlijkheidstest. Door de data van deze anonieme respondenten te analyseren kunnen we een goed beeld vormen van dit instrument.

Gebruikte instrumenten

De Big Five Persoonlijkheidstest is gratis te gebruiken op https://www.123test.com/nl/persoonlijkheidstest/. Het Engelse equivalent van deze vragenlijst staat op https://www.123test.com/personality-test/ en is ook gratis te gebruiken.

Verkenning en selectie van de onderzoeksdata

Ter verkenning van de onderzoeksdata worden in dit hoofdstuk een aantal achtergrondvariabelen van de respondent nader onderzocht. Per onderdeel wordt aangegeven welke selectiecriteria er zijn gebruikt voor de uiteindelijke dataset.

De volledige dataset bestaat uit 65.703 respondenten. Op basis van cirteria als leeftijd, geslacht, opleidingsniveau, nationaliteit, arbeidsmarktpositie, afnameduur en responsevariatie wordt de uiteindelijke subset gemaakt waarop analyses worden gedaan en waarmee de uiteindelijke norm wordt berekend.

Leeftijd

Er is gekozen voor een leeftijdsgroep van 18 t/m 67 jaar, omdat deze groep het beste de arbeidsbevolking van Nederland representeert.

Geslacht

Van alle respondenten is het geslacht bekend omdat deze achtergrondvraag verplicht was om te beantwoorden. Opvallend is het hogere aantal vrouwen dat de test heeft afgerond. Logischerwijs worden beide geslachten meegenomen in de dataset omdat deze groep het beste de arbeidsbevolking van Nederland representeert.

Opleidingsniveau

Omdat de Big Five Persoonlijkheidstest speciaal wordt ontwikkeld voor gemiddeld tot hoger opgeleiden is ervoor gekozen om een aantal opleidingsniveau’s te selecteren die worden meegenomen in de dataset. De blauw gearceerde opleidingsniveau’s in de diagram zijn meegenomen in de dataset.

Nationaliteit

Omdat de Big Five Persoonlijkheidstest wordt ontwikkeld voor de Nederlands sprekende markt hoeft er niet op nationaliteit te worden geselecteerd: de vragenlijst is immers in het Nederlands.

Buiten Nederland en België is er een groep van 6% van respondenten met een andere nationaliteit in de dataset. Hieronder wordt weergegeven welke landen er in de groep van “Overige nationaliteiten” zit.

Overige landen	Percentage %
Overig	3.21
Suriname	1.06
Curaçao	0.43
Turkije	0.40
Marokko	0.36
Syrië	0.33
Afghanistan	0.24

Arbeidsmarktpositie

Er is de respondent gevraagd naar zijn/haar arbeidsmarktpositie. Er is gekozen om alleen de arbeidsmarktposities Loondienst, Eigen baas/freelancer en Officieel werkloos te gebruiken in de dataset, omdat deze groep het beste de arbeidsbevolking van Nederland representeert.

Werksector/branche

De respondent is gevraagd om aan te geven in welke werksector hij/zij werkzaam is. Hierbij kon een keuze gemaakt worden uit de 23 werksectoren die worden gehanteerd in het model van EurOccupations (Wageindicator.org 2009). De verdeling komt voldoende overeen met de meest recente gegevens van het CBS (CBS 2008) en geeft geen aanleiding om hiervoor te corrigeren.

Afnameduur

Het bekijken van de afnameduur van een vragenlijst is een goede manier om te bepalen hoe serieus een respondent de vragenlijst heeft ingevuld. Er is voor gekozen om een afnameduur tussen de 5 en 45 minuten mee te nemen in de uiteindelijke dataset.

Responsevariatie

Het bekijken van de responsevariatie van een respodent is een goede manier om te bepalen hoe serieus de respondent de vragenlijst heeft ingevuld. Er is voor gekozen om alleen een responsevariatie van 5 mee te nemen in de uiteindelijke dataset. Een responsevariatie van 5 betekent dat een respondent over alle 120 items genomen alle antwoordopties van de Likert-5 schaal in ieder geval één keer heeft gebruikt.

Menselijke response

Online vragenlijsten kunnen last hebben van crawlers en bots die de vragenlijsten geautomatiseerd invullen. Door een consistentiemaat te gebruiken kunnen we responses waar geen samenhang in is te vinden uitsluiten van de dataset.

De consistentiemaat psychometric synonym (Meade and Craig 2012) is gebruikt om kunstmatige en willekeurige responses te identificeren. Deze consistentiemaat wordt berekend door eerst alle itemparen te selecteren die over de gehele dataset > .60 correleren. In deze dataset zijn 12 itemparen geselecteerd. Daarna wordt voor iedere respondent de psychometric synonym score berekend die gelijk is aan de binnen-persoonscorrelatie van de geselecteerde itemparen.

De door Meade & Craig (2012) gehanteerde cut-off waarde van 0.2 is gebruikt om kunstmatige responses en responses met een willekeurig antwoordpatroon uit de dataset te filteren. In de histogram hieronder zijn de verwijderde responses grijs gearceerd.

Analyse

In de uiteindelijke dataset zijn 12.582 respondenten opgenomen.

Ruwe scores

In dit hoofdstuk worden de ruwe scores van de verschillende facetten en factoren weergegeven. X-assen zijn weggelaten in verband met mogelijke ongewenst hergebruik van de normgegevens.

Factoren

De histogrammen van de ruwe factorscores laten alle vijf een normaalverdeling zien.

Facetten

De histogrammen van de ruwe facetscores laten meestal een normaalverdeling zien, met soms een vloer- en/of plafondeffect bij schalen met een hoog sociaal-wenselijk gehalte.

Openheid voor ervaringen

Gewetensvolheid

Extraversie

Meegaandheid

Natuurlijke reacties

Correlaties

Correlaties tussen factoren

De vijf factoren laten over het algemeen minimale correlaties zien. Extraversie en Natuurlijke reacties laten een duidelijk negatief verband zien.

Correlaties tussen facetten

De 30 facetten laten over het algemeen minimale correlaties zien buiten de eigen facetten, en gemiddelde correlaties binnen het eigen facet.

De eerder geconstateerde negatieve correlatie tussen Extraversie en Natuurlijke reacties is op facetniveau vooral terug te leiden tot negatieve verbanden tussen Opgelatenheid (N4) en Toegankelijkheid (E1), en Neerslachtigheid (N3) en Opgewektheid (E6).

Deze resultaten komen overeen met de wetenschappelijke literatuur en bieden een goede eerste indicatie voor de interne structuur.

Betrouwbaarheid

Cronbachs alpha (Cronbach and Shavelson 2004) is een maat voor de betrouwbaarheid van psychometrische tests of van vragenlijsten. De waarde van alpha is een schatting voor de ondergrens van de betrouwbaarheid van de betrokken test.

Factoren

De COTAN heeft als criterium voor instrumenten die worden ingezet bij adviessituaties dat de betrouwbaarheidscoëfficiënt Cronbach’s alpha niet lager dan .60 mag zijn. Scores hoger dan .80 worden door de COTAN beoordeeld als ‘goed’.

Gemiddeld over de vijf factoren is de betrouwbaarheidscoëfficient 0.859, dat als zeer hoog mag worden bestempeld.

Factoren	Aantal items	Cronbach’s Alpha
Openheid voor ervaringen	24	0.80506
Gewetensvolheid	24	0.87578
Extraversie	24	0.87795
Meegaandheid	24	0.84113
Natuurlijke reacties	24	0.89305

Wanneer een item niet voldoende met de andere items van eenzelfde factor correleert, schaadt dit de betrouwbaarheid. Hieronder wordt weergegeven wat er met de Cronbach’s Alpha van een factor gebeurt wanneer één van de 24 items wordt verwijderd.

Als item wordt verwijderd	O	C	E	A	N
1	0.793	0.869	0.869	0.837	0.885
2	0.791	0.872	0.870	0.837	0.885
3	0.796	0.871	0.871	0.838	0.885
4	0.800	0.874	0.872	0.836	0.883
5	0.786	0.871	0.870	0.831	0.889
6	0.794	0.869	0.868	0.833	0.887
7	0.796	0.866	0.875	0.832	0.888
8	0.793	0.866	0.871	0.836	0.890
9	0.808	0.871	0.872	0.835	0.885
10	0.801	0.874	0.878	0.834	0.887
11	0.805	0.873	0.876	0.832	0.884
12	0.805	0.872	0.875	0.836	0.888
13	0.799	0.872	0.876	0.842	0.891
14	0.796	0.874	0.875	0.839	0.891
15	0.800	0.873	0.873	0.832	0.892
16	0.803	0.872	0.875	0.832	0.894
17	0.794	0.869	0.873	0.832	0.902
18	0.792	0.869	0.874	0.838	0.894
19	0.799	0.871	0.881	0.834	0.893
20	0.801	0.872	0.876	0.835	0.892
21	0.796	0.877	0.872	0.840	0.884
22	0.803	0.870	0.871	0.838	0.888
23	0.800	0.868	0.873	0.833	0.885
24	0.804	0.869	0.873	0.838	0.888

Facetten

De gemiddelde Cronbach’s Alpha van de 30 facetten is 0.708, wat voor schalen met 4 items een goede prestatie is.

Factoren	Facetten	Aantal.items	Cronbach.s.Alpha
Openheid voor ervaringen	Verbeeldingskracht	4	0.80575
	Artistieke interesse	4	0.69799
	Diepte van gevoelens	4	0.51662
	Bereidheid tot verandering	4	0.71298
	Intellectuele nieuwsgierigheid	4	0.60086
	Niet conservatief	4	0.46357
Gewetensvolheid	Gevoel van bekwaamheid	4	0.61639
	Ordelijkheid	4	0.84224
	Verantwoordelijkheidsgevoel	4	0.60795
	Prestatiegericht	4	0.67093
	Zelf-discipline	4	0.64350
	Bedachtzaamheid	4	0.80478
Extraversie	Toegankelijk	4	0.79242
	Sociabel	4	0.73985
	Assertief en dominant	4	0.77397
	Energiek	4	0.71821
	Spanningsbehoefte	4	0.76320
	Opgewektheid	4	0.83387
Meegaandheid	Vertrouwen in anderen	4	0.79850
	Eerlijk en oprecht	4	0.68103
	Altruïsme	4	0.68537
	Vredelievend	4	0.57411
	Bescheidenheid	4	0.78346
	Medeleven	4	0.64168
Natuurlijke reacties	Zorgelijkheid	4	0.82453
	Boosheid en ergernis	4	0.81763
	Neerslachtigheid	4	0.83746
	Opgelatenheid	4	0.62206
	Ongematigheid	4	0.61864
	Stressgevoeligheid	4	0.74755

Constructvaliditeit: Factoranalyse

Screeplot

Een screeplot of eigenwaardendiagram is in de factoranalyse een grafiek waarin de eigenwaarden van de mogelijke variabelen voor de factoren in volgorde van afnemende grootte uitgezet zijn.

In onderstaande screeplot is te zien dat er 5 duidelijke componenten (PC) te onderscheiden zijn met een eigenwaarde > 1.0. Dit komt overeen met de bekende wetenschappelijke literatuur die stelt dat persoonlijkheid 5 componenten bevat.

Principale Componenten Analyse

Principale-componentenanalyse is een multivariate analysemethode in de statistiek om een grote hoeveelheid gegevens te beschrijven met een kleiner aantal relevante grootheden, de hoofdcomponenten of principale componenten.

In onderstaande tabel worden de resultaten van een PCA met varimax rotatie weergegeven. De 30 facetten zijn duidelijk terug te brengen tot de vijf componenten waar ze volgens het theoretische model van de Big Five bij horen. De dominante factor Extraversie trekt veel variantie naar zich toe, vooral in de vorm van negatieve ladingen van Natuurlijke reacties. Er zijn slechts een aantal facetten die een hogere primaire lading hebben op een andere component.

Al met al laat de analyse een zeer herkenbaar en bevredigend beeld zien.

Factor	Code	Facet	RC1	RC2	RC3	RC4	RC5
Extraversie	E1	Toegankelijk	0.801
	E2	Sociabel	0.778
	E3	Assertief en dominant	0.453
	E4	Energiek	0.511
	E5	Spanningsbehoefte	0.531
	E6	Opgewektheid	0.69
Meegaandheid	A1	Vertrouwen in anderen		0.394
	A2	Eerlijk en oprecht		0.686
	A3	Altruïsme		0.704
	A4	Vredelievend		0.65
	A5	Bescheidenheid		0.644
	A6	Medeleven		0.569
Gewetensvolheid	C1	Gevoel van bekwaamheid			0.768
	C2	Ordelijkheid			0.614
	C3	Verantwoordelijkheidsgevoel			0.584
	C4	Prestatiegericht			0.659
	C5	Zelf-discipline			0.737
	C6	Bedachtzaamheid			0.452	-0.508
Natuurlijke reacties	N1	Zorgelijkheid				0.682
	N2	Boosheid en ergernis				0.683
	N3	Neerslachtigheid				0.566
	N4	Opgelatenheid	-0.699
	N5	Ongematigheid				0.463
	N6	Stressgevoeligheid				0.651
Openheid voor	O1	Verbeeldingskracht					0.586
ervaringen	O2	Artistieke interesse					0.731
	O3	Diepte van gevoelens		0.556
	O4	Bereidheid tot verandering	0.478				0.451
	O5	Intellectuele nieuwsgierigheid					0.743
	O6	Niet conservatief					0.608

Normering

Beroepsbevolking volgens het CBS

Voor een correcte normering moet de dataset een goede afspiegeling zijn van de beoogde gebruikersgroep, in dit geval de Nederlandse beroepsbevolking. Omdat een dataset vrijwel nooit dezelfde samenstelling heeft als de geoogde gebruikersgroep wordt gebruikt gemaakt van weging.

De dataset is gewogen volgens de verdeling van onderstaande tabel. Deze gegevens zijn verkregen uit recente cijfers van het CBS.

Criterium	Groepen	NL beroepsbevolking (CBS)
Geslacht	Vrouw	50,50%
	Man	49,50%
Opleiding	Middelbaar opgeleid	62,60%
	Hoger opgeleid	37,40%
Leeftijd	15-24	17,40%
	25-44	45,50%
	45-64	37,10%

De maatstaf van de COTAN voor normgroepen voor gebruik in ‘advies’ situaties is dat de normgroep uit >200 respondenten dient te bestaan. Voor werving- en selectiedoeleinden is dat >400. In deze dataset zijn 12.582 respondenten opgenomen en voldoet dus zeer ruim aan de door de COTAN gehanteerde maatstaf.

Groepsverschillen

Als er binnen een normgroep significante verschillen bestaan tussen relevante groepen, kan hiervoor worden gecorrigeerd door seperate normgroepen te hanteren.

Voor het vergelijken van groepsgemiddelden en het bepalen van effect size is Cohen’s d gebruikt (Cohen 1992). Effectgroottes in de buurt van de nul zijn klein, effectgroottes groter dan 0,8 of kleiner dan -0,8 worden veelal als groot gezien.

Geslacht

Om te bepalen of normen voor specifieke groepen nodig zijn is gekeken naar groepsverschillen tussen geslachten. Hieronder zijn de resultaten van deze analyses weergegeven.

Effect size

Factor	Cohen’s D (Man-Vrouw)
Openheid voor ervaringen	0.146
Gewetensvolheid	0.096
Extraversie	-0.173
Meegaandheid	0.676
Natuurlijke reacties	0.327

Gezien het feit dat er geen effectgroottes van -0.8 of 0.8 zijn gevonden kan geconcludeerd worden dat het gebruik van één norm voor opleidingsniveau gerechtvaardigd is.

Leeftijd

Om te bepalen of normen voor specifieke groepen nodig zijn is gekeken naar groepsverschillen tussen leeftijdsgroepen. Hieronder zijn de resultaten van deze analyses weergegeven.

Effect size

Factor	Cohen’s D (Oud-Jong)
Openheid voor ervaringen	-0.579
Gewetensvolheid	-0.446
Extraversie	0.305
Meegaandheid	-0.355
Natuurlijke reacties	0.423

Gezien het feit dat er geen effectgroottes van -0.8 of 0.8 zijn gevonden kan geconcludeerd worden dat het gebruik van één norm voor opleidingsniveau gerechtvaardigd is.

Opleidingsniveau

Om te bepalen of normen voor specifieke groepen nodig zijn is gekeken naar groepsverschillen tussen opleidingsniveaus Hieronder zijn de resultaten van deze analyses weergegeven.

Effect size

Factor	Cohen’s D (Hoog-Laag)
Openheid voor ervaringen	-0.539
Gewetensvolheid	-0.069
Extraversie	-0.053
Meegaandheid	0.012
Natuurlijke reacties	0.089

Gezien het feit dat er geen effectgroottes van -0.8 of 0.8 zijn gevonden kan geconcludeerd worden dat het gebruik van één norm voor opleidingsniveau gerechtvaardigd is.

Conclusie

Uit de resultaten van dit onderzoek blijkt dat de Big Five Persoonlijkheidstest van 123test een betrouwbaar en valide instrument is met een gedegen normering om in te zetten bij Nederlandse respondenten met een gemiddeld tot hoger opleidingsniveau, met een leeftijd tussen de 18 en 67 jaar voor zelfanalyse, bij loopbaanbegeleiding of in andere professionele settings.

Betrouwbaarheid

Uit de resultaten van dit onderzoek blijkt dat de Big Five Persoonlijkheidstest van 123test goed tot zeer goed scoort op de in de wetenschap gebruikelijke betrouwbaarheidscoëfficienten.

Validiteit

Uit de resultaten van dit onderzoek blijkt dat de Big Five Persoonlijkheidstest van 123test goede constructvaliditeit laat zien van de gemeten constructen.

Normering

Uit de resultaten van dit onderzoek blijkt dat de Big Five Persoonlijkheidstest van 123test over een goede normering beschikt die geen verschillen tussen groepen laat zien.

Referenties

CBS. 2008. “Banen van Werknemers; Bedrijfsgrootte En Economische Activiteit.” CBS.nl SBI.

Cohen, Jacob. 1992. “A Power Primer.” Psychological Bulletin 112 (1). American Psychological Association: 155.

Cronbach, Lee J., and Richard J. Shavelson. 2004. “My Current Thoughts on Coefficient Alpha and Successor Procedures.” Educational and Psychological Measurement 64 (3): 391–418.

Meade, Adam W, and S Bartholomew Craig. 2012. “Identifying Careless Responses in Survey Data.” Psychological Methods 17 (3). American Psychological Association: 437.

Wageindicator.org. 2009. “EurOccupations.”

Technische handleiding Persoonlijkheidstest

Bart Dekker MSc. Dr. Edwin van Thiel

Inhoudsopgave

Inleiding

Methode

Gebruikte instrumenten

Verkenning en selectie van de onderzoeksdata

Leeftijd

Geslacht

Opleidingsniveau

Nationaliteit

Arbeidsmarktpositie

Werksector/branche

Afnameduur

Responsevariatie

Menselijke response

Analyse

Ruwe scores

Factoren

Facetten

Openheid voor ervaringen

Gewetensvolheid

Extraversie

Meegaandheid

Natuurlijke reacties

Correlaties

Correlaties tussen factoren

Correlaties tussen facetten

Betrouwbaarheid

Factoren

Facetten

Constructvaliditeit: Factoranalyse

Screeplot

Principale Componenten Analyse

Normering

Beroepsbevolking volgens het CBS

Groepsverschillen

Geslacht

Leeftijd

Opleidingsniveau

Conclusie

Referenties

Technische handleiding
Persoonlijkheidstest

Bart Dekker MSc.
Dr. Edwin van Thiel