Sozial erwünschte Antworttendenzen in Persönlichkeitsfragebögen – neue empirische Erkenntnisse

Prof. Dr. Christof Obermann, Levi Kuhlmann, Maurice Valbert

Im Kontext von Personalauswahl ist die Tendenz zum sozial erwünschten Antworten weiterhin ein problematischer Aspekt der Persönlichkeitsmessung (Preiss et al., 2015). Um den Einfluss dieser Tendenz genauer zu erfassen, wurde eine experimentelle Studie mit 151 Probanden durchgeführt. Für jedes einzelne Item wurden die Probanden gebeten, die Fragen unter zwei Bedingungen zu beantworten: nämlich in einer „ehrlichen“ Form und in einer zweiten Variante. Sie sollten sich vorstellen, sie seien in einer Bewerbungssituation und so antworten, dass ein möglichst guter Eindruck erzielt wird. Für diese Untersuchung wurde der bewährte Leadership Potential Assessment (LPA) Test verwendet, ein berufsbezogener Persönlichkeitsfragebogen nach dem Big 5 Konzept.

Dieser ist, so wie andere Persönlichkeitsfragebögen, immer als Selbsteinschätzung aufgebaut (z. B. „Ich gehe gerne auf Kollegen zu“ ja / nein / vielleicht). Trotz dieses Charakters der Selbsteinschätzung sagen Persönlichkeitsfragebögen Joberfolg ähnlich gut oder schlecht voraus wie z.B. Verhaltenssimulationen oder AC-Gruppendiskussionen (Obermann, 2018).

Durch das gewählte Studiendesign wurde nun empirisch belastbar erkennbar, in welchem Umfang sozial erwünschtes Antwortverhalten die Ergebnisse von Persönlichkeitsfragebögen tatsächlich beeinflusst. Im Durchschnitt existiert auf Skalen eine Verschiebung durch die Antworttendenz von M=11.33% (SD=3.83%) in Richtung sozialer Erwünschtheit. In allen Dimensionen der Persönlichkeit existiert nach der Erhebung ein statistisch signifikanter Gruppenunterschied bei beispielsweise der Persönlichkeitsdimension „Neurotizismus“ mit t(150) = 12,63, p<.05, d= 1,02. Nach wissenschaftlicher Konvention kann man hier schon von einem hohen Effekt sprechen. Die T-Tests der anderen Dimensionen ergaben ebenfalls einen mindestens mittelstarken bis starken Effekt nach Cohens d, wobei ein geringer Effekt ab 0,3, ein mittlerer ab 0,5 und ein starker Effekt ab 0,8 zu erkennen ist (Tabelle 1).

Tab. 1: T-Test der Persönlichkeitsdimensionen

 

Es konnte ein mittelstarker bis starker Effekt bezüglich sozial erwünschtem Antwortverhalten erhoben werden.

Am meisten wird unehrlich geantwortet bei emotionaler Belastbarkeit und Integrität

Eine weitere Erkenntnis mit Blick auf die Daten: Der Grad, sich vorteilhafter darzustellen, ist nicht gleich, sondern variiert zwischen den verschiedenen Persönlichkeitsmerkmalen.

Vor allem Persönlichkeitsskalen, welche die Konstrukte Neurotizismus und Integrität abfragen, zeigten sich als besonders von sozialer Erwünschtheit betroffen. In der Bewerbungsbedingung gaben die Probanden für Neurotizismus – offenbar eine negativ konnotierte Eigenschaft – im Schnitt einen Wert an, der 26,5% unter dem der ehrlichen Bedingung liegt. Für Integrität – eine positive Eigenschaft – waren die Werte in der Bewerbungsbedingung im Schnitt 19,1% höher als in der ehrlichen Bedingung. Bewerbende wollen sich also als besonders emotional stabil und ehrlich darstellen.

Als besonders „fälschungssicher“ zeigte sich hingegen die Skala, die Dominanz misst. Hier beträgt der Unterschied zwischen den Bedingungen lediglich 8,3 %. Da in psychometrisch konstruierten Fragebögen die Antworten der Teilnehmenden jeweils mit einer Vergleichsnorm aus anderen Personen in Bezug gesetzt werden, ist es für die Praxis wichtig sicherzustellen, dass von dem jeweiligen Testanbieter Normen aus anderen Bewerbenden – und etwa nicht Studierenden – zur Verfügung gestellt werden. Dadurch relativiert sich die Tendenz zur sozialen Erwünschtheit wieder – die positive Übertreibung verglichen mit den positiven Übertreibungen anderer Bewerbender.

Abb. 1: Mittlere Gesamtscores auf den Persönlichkeitsdimensionen in ehrlicher und Bewerbungsbedingung

 

In einem nächsten Schritt wurden die beiden kritischen Skalen tiefer auf der Ebene der einzelnen Items beleuchtet. Dabei wurde ersichtlich, dass die Items der Skala Neurotizismus, die eher „fälschungssicher“ waren, also eine besonders niedrige Differenz, zwischen der Bewerbungs- und der ehrlichen Bedingungen aufweisen, in ihrer Formulierung eine spezielle Begründung für den Stresszustand liefern (Zeitdruck, viel Aufwand). In dieser Bedingung besteht offensichtlich eine Hemmung bei Testteilnehmern, sich überzogen positiv darzustellen. Sehr generalisierend formulierte Items laden mehr zum Faking ein. Beispiele für Items mit besonders großer Tendenz zu sozial erwünschtem Antworten sind dazu in Abbildung 2 mit einem Minus markiert.

Abb. 2: Beispielitems für hohe (-) und niedrige (+) Differenzen aus den Dimensionen Stressempfinden und Dominanz

Ehrlichkeit variiert – sozial erwünschte Antworttendenz ist auch Personensache

In unserer Studie haben wir den Probanden zusätzlich eine Skala zur individuellen sozial erwünschten Antworttendenz vorgelegt. Früher hieß dies „Lügenskala“. Dabei werden Fragen gestellt, die ehrliche Personen eigentlich nur eine Richtung beantworten können, zum Beispiel: „Ich sage immer die Wahrheit“. Jeder müsste eigentlich ein „Nein“ antworten. Wer dies nicht tut, dem würde man nachdiesem Vorgehen eine Tendenz zu sozial erwünschten Antworten unterstellen.

Aus dem Umfang, indem dennoch solche unrealistischen Antworten gegeben werden, kann man dann für jeden Testteilnehmer einen Score ableiten, wie individuell unterschiedlich unehrlich oder sozial erwünscht geantwortet wird.

Dabei zeigte sich, dass die Scores auf der Skala für soziale Erwünschtheit in der Bewerbungsbedingung im Mittel um 29,3% gegenüber der ehrlichen Bedingung gestiegen sind. Ein T-Test ergab einen statistisch signifikanten Unterschied mit t(150) = -13,63, p<.05, d= 1,08. Wie zu erwarten war, hat sich die Streuung hingegen um 22,2% verringert. Also wird in der Bewerbungsbedingung sozial erwünschter und homogener von den Probanden beantwortet. Zurück zu den zuvor gemessenen Differenzen zeigte sich ebenfalls, dass es offenbar verschiedene Typen von Beantwortungsmustern gibt. Diese sind in Abb. 3 beschrieben und die Verteilung der Typen in der Stichprobe dargestellt. Mit den Differenzen in dieser, sind die Verschiebungen des Antwortverhaltens auf einer Skala von 1-7 gemeint.

Abb.3: Erklärungen und Aufteilung zu den 4 erfassten Typen von Antworttendenzen in der Bewerbungsbedingung

 

Es ist erkennbar, dass die beiden überwiegenden Typen entweder einen Großteil (Hoch) oder mindestens ein Viertel der Items (Selektiv 1) in der Bewerbungsbedingung in die gleiche Richtung verfälscht haben. Diese machen mehr als drei Viertel der Probanden aus. Die restlichen Probanden haben entweder die meisten Items nicht verfälscht (Niedrig) oder in unterschiedliche Richtungen verfälscht (Selektiv 2; manchmal höher, manchmal sogar niedriger in der Bewerbungsbedingung beantwortet). Mit diesem Wissen um die interpersonellen Differenzen “in der Tasche“, kann man dieses nun mit den Erkenntnissen über die unterschiedliche Fälschungssicherheit der Skalen kombinieren.

Die weniger ehrlichen Personen übertreiben in ihren Testantworten

Schließlich ist es auch von Interesse, ob die Personen mit hohen Werten in der „Lügenskala“ (individuellen Tendenz zu sozial erwünschten Antworten) auch in der Bewerbungsbedingung systematisch anders geantwortet haben als in der ehrlichen Bedingung. Ergebnis: Es gibt einen mittelschwachen korrelativen Zusammenhang von r=,27. Je nach einzelner Fragebogenskala gibt es jedoch auch höhere Zusammenhänge – etwa in der ein Zusammenhang von r=,38 zwischen der Lügenskala und den Differenzen zwischen ehrlicher und Bewerbungsbedingung.

In einzelnen Persönlichkeitsfragebögen wird anhand der Beantwortung der „Lügenitems“ ausgewiesen, ob die Ergebnisse zuverlässig sind oder die betreffenden Personen deutlich übertrieben haben.

Also: Die Mehrheit von uns schlägt aus in der „Lügenskala“ und übertreibt ihre Antworten. Es gibt eine stille Minderheit von etwa einem Viertel, die absolut ehrlich antwortet. Die Personen mit sozial erwünschter Antworttendenz beantworten dann auch systematisch in der Bewerbungsbedingung in unserem Experiment anders als in der ehrlichen Bedingung. Gleichwohl erklärt dies nur einen Teil der unterschiedlichen Antworten. Eine Ursache liegt auch in dem Design der Fragen: Sind diese zu undifferenziert und offensichtlich („ich bin ein emotional stabiler Mensch“), dann übertreiben alle.

Praxisfazit – Nutzen von Persönlichkeitsfragebögen

Die Fragebögen von Obermann Consulting, wie der verwendete LPA, sind bereits sehr valide mit beispielsweise einer konvergenten Validität in der Dimension Neurotizismus von r=.62 (p<.001).  Bei aller Problematik mit sozial erwünschten Antworten sind Persönlichkeitsfragebögen im Schnitt genauso gut oder schlecht in der Vorhersage von Leistung oder Potenzial wie beliebte Rollenspiele, Fallstudien oder Gruppendiskussionen (Obermann, 2018). Dennoch sind Tendenzen zu sozial erwünschtem Antwortverhalten nicht 100% zu eliminieren, aber sie sind kontrollierbar. Demnach ist auch kein Selbsteinschätzungsfragebogen von sozial erwünschtem Antwortverhalten verschont, es bleibt nur die Erhebungsinstrumente methodisch noch besser zu gestalten.

Tab. 2: Praxisfazit - Umgang mit sozialer Erwünschtheit

Wie sich durch die Untersuchung gezeigt hat, variiert die Stärke der Tendenz sowohl über die abgefragten Dimensionen hinweg als auch auf Personen Ebene. Die sogenannte „Lügenskala“, welche bisher das Instrument der Wahl ist, um die Stärke der Antworttendenz einer Person zu identifizieren, hat bereits gezeigt, dass sich die Stärke der Tendenz je nach Individuum in ihrer Ausprägung unterscheidet – Menschen haben also verschieden starke Tendenzen in Richtung sozial erwünschten Antworten.

Zuletzt bleibt noch die Frage offen, wie methodische Verbesserungen im Design der Fragebögen aussehen können. Hier bieten sich gleich mehrere Möglichkeiten an. Die erste Variante bestünde darin, die einzelnen Items innerhalb des Tests unterschiedlich zu gewichten, nämlich nach ihrer Beeinflussbarkeit, welche wir durch die zwei Bedingungen (Bewerbersituation vs. ehrlich) erhoben haben. Hierbei werden allerdings die individuellen Tendenzen der einzelnen Teilnehmer vernachlässigt und in eine Gewichtung zusammengefasst.

Die zweite Möglichkeit besteht darin, die Items so zu designen, dass die erwähnten pauschalen Selbstaussagen („Ich bin emotional stabil“) vermieden werden, welche zu besonders großen Verfälschungen führen.

Drittens gibt es die Möglichkeit, den Fragebogen als sogenannten Forced-Choice-Test zu gestalten. Dabei wird nicht gefragt „Sind Sie emotional stabil ja / nein / vielleicht“, sondern den Bewerbenden werden verschiedene sozial ähnlich attraktive Alternativen vorgelegt („Bitte verteilen Sie insgesamt 10 Punkte auf die Adjektive – dominant -, – pedantisch -, -ehrgeizig-, – unruhig“).  Bei dieser Variante wird dem Probanden die Möglichkeit genommen, alles mit der Tendenz zu sozial erwünschtem Antwortverhalten zu beantworten, da er/sie sich auf Grund der zuzuordnenden Rangordnung auf eine Priorisierung festlegen muss. Der Nachteil besteht allerdings darin, dass alle Probanden im Durschnitt aller Skalen immer ein mittleres Ergebnis haben: auch wenn z. B. „ehrgeizig“ immer relativ zu anderen Facetten der gleichen Person abgewählt wird (intrapersoneller Vergleich), kann die betreffende Person immer noch relativ ehrgeiziger als Dritte sein (interpersoneller Vergleich).

Grundsätzlicher wird die Frage, ob – so wie in diesem Artikel bisher unterstellt – sozial erwünschte Antworten im Sinne von Faking oder Lügen als schlecht anzusehen sind. Verbal umformuliert ist dies eine Form von „Impression Management“. Sich im sozialen Umfeld positiv und selbstbewusst darzustellen, eine positive Ausstrahlung zu haben, all das wird im beruflichen Umfeld goutiert.

Voss et al. (2014) untersuchten genau diese Fragestellung und kamen zu dem Ergebnis, dass jene, die es wissen, sich selbst gut zu verkaufen, später im Berufsleben tendenziell erfolgreicher sind. Auch Blickle et al. (2012) kamen zu dem Schluss, dass die Tendenz zum Faking beziehungsweise Impression Management mit späterem beruflichem Erfolg und Karriere in positivem Zusammenhang steht.

Literatur

Blickle, G., Diekmann, C., Schneider, P. B., Kalthöfer, Y., & Summers, J. (2012). When modesty wins: Impression management through modesty, political skill, and career success: A two-study investigation. European Journal of Work and Organizational Psychology, 21, 899-922.

Obermann C. (2017) Assessment Center: Entwicklung, Durchführung, Trends Mit neuen originalen AC-Übungen (6. Aufl. 2018 Aufl.). Springer Gabler.

Preiss, M., Mejzlíková, T., Rudá, A., Krámský, D., & Pitáková, J. (2015). Testing the level of social desirability during job interview on white-collar profession. Frontiers in psychology, 6, 1886.

Voss, B. E., Alshanski, S., & Christiansen, N. (2014). Convergence and Discrimination of Observer Personality Ratings From Work Simulations. Honolulu: SIOP, 29th Annual Conference.

Weitere Artikel zu diesem Thema:

Consent Management Platform von Real Cookie Banner