Intelligenz – Teil 3: Warum man nicht nur einen IQ hat und wir lange Zeit immer schlauer wurden

Vorab: Was ist eigentlich “der IQ”?

Der so genannte Intelligenzquotient, kurz IQ, ist im Grunde schon der Schlüssel zu der Art und Weise, wie er berechnet wird – und doch wird diese Tatsache im alltäglichen Sprachgebrauch viel zu selten berücksichtigt. Ursprünglich erfolgte die Berechnung dieses Maßes für menschliche Intelligenz allerdings auf etwas andere Weise als heute. Geprägt wurde der Begriff des Intelligenzquotienten nämlich durch den Psychologen William Stern, der den von Alfred Binet geprägten Begriff des Intelligenzalters aufgriff und weiterentwickelte. Das Intelligenzalter ergibt sich nach Binet, grob gesagt, durch die Summe der gelösten Aufgaben in einem Intelligenztest. Aufschluss über die kognitive Leistungsfähigkeit gibt dann der Vergleich von Intelligenzalter und tatsächlichem Lebensalter: Wenn ein 8-jähriges Kind z.B. deutlich mehr (d.h. schwierigere) Aufgaben löst, als andere 8-jährige Kinder es im Durchschnitt tun, dann könnte sein Intelligenzalter z.B. 9,5 Jahre betragen – mit anderen Worten: Dieses Kind wäre in seiner kognitiven Entwicklung schon überdurchschnittlich weit fortgeschritten. William Stern setzte schließlich diese beiden Größen (also das Lebensalter und das Intelligenzalter nach Binet) einfach ins Verhältnis (bildete also einen Quotienten), multiplizierte sie mit dem Faktor 100 – und schon war der IQ geboren. Für unser Beispiel-Kind ergäbe sich somit ein IQ von (9,5/8)*100 = 118,75 (bzw. 119, da es aufgrund der nicht perfekten Reliabilität von Intelligenztests unüblich ist, IQ-Werte mit Nachkommastellen anzugeben).

Heutzutage berechnet man den IQ nicht mehr auf diese Weise, wenngleich das Grundprinzip der Berechnung erhalten geblieben ist: Weiterhin werden zwei verschiedene Werte miteinander ins Verhältnis gesetzt, weshalb der Begriff “Quotient” auch heute noch gerechtfertigt ist. Dies ist mit einer ganz wichtigen Tatsache verbunden, die in der Öffentlichkeit und in den Medien leider so oft untergeht: Es gibt nicht den IQ, und es ist keineswegs so, dass ein Mensch genau einen IQ hat. Derartige Aussagen kann man guten Gewissens als Unsinn bezeichnen. In der Tat kann man einer jeden Person unzählige IQ-Werte zuweisen; aber um zu verstehen, warum das so ist, muss man sich vor Augen führen, wie der IQ berechnet wird.

Wie schon gesagt, basiert die IQ-Berechnung auf dem Bilden von Verhältnissen. Was wird nun ins Verhältnis gesetzt? Grob gesagt wird (egal mit welchem Intelligenztest) immer ein Rohwert zu einem bestimmten Mittelwert und einer Standardabweichung gesetzt. Der Rohwert meint meist die Anzahl der in einem Intelligenztest gelösten Aufgaben (was deshalb Sinn macht, weil fast alle diese Tests so aufgebaut sind, dass die Aufgaben im Verlauf immer schwieriger werden). Bei unserem Beispiel-Kind von oben könnten das z.B. 21 von 30 Aufgaben sein. So, dieser Rohwert sagt einem zunächst einmal gar nichts. Um an einen IQ-Wert zu gelangen, braucht man zusätzlich eine Normstichprobe, d.h. eine repräsentative Stichprobe anderer Menschen, mit der man das Kind nun vergleichen kann. Von dieser Normstichprobe braucht man zwei Informationen: den Mittelwert (d.h. die durchschnittliche Zahl der gelösten Aufgaben in dieser Gruppe von Menschen, hier z.B. 18,1) und die Standardabweichung (d.h. die “durchschnittliche” Abweichung von diesem Mittelwert, z.B. 2,6). Nun muss die Zahl der von unserem Beispiel-Kind gelösten Aufgaben ins Verhältnis zu dieser Normstichprobe gesetzt werden . Hierzu berechnet man zunächst die Differenz zwischen dem Rohwert des Kindes und dem Mittelwert der Normstichprobe: 21-18,1 = 2,9. Dies ist die also die “Abweichung” unseres Kindes vom Mittelwert der Normstichprobe – und diese muss man nun ins Verhältnis setzen zur “durchschnittlichen Abweichung” vom Mittelwert der Normstichprobe (also deren Standardabweichung); d.h. man rechnet: 2,9/2,6 = 1,12. Man sagt: Das Kind liegt etwas mehr als eine Standardabweichung über dem Mittelwert der Normstichprobe. Nun fehlt nur noch die Umrechung in IQ-Werte. Hierzu nutzt man die Tatsache, dass IQ-Werte eine Art Maßzahl sind – deren Mittelwert und deren Standardabweichung festgelegt sind. D.h., man kann sie nutzen, um die Ergebnisse unterschiedlichster Tests (die alle andere Skalierungen verwenden), in ein und derselben Metrik anzugeben. Der Mittelwert des IQ ist auf 100 festgelegt, und die Standardabweichung auf einen Wert von 15. Um unserem Kind nun einen IQ-Wert zuweisen zu können, muss man nur noch den Wert 1,12 mit 15 multiplizieren und 100 addieren – und es ergibt sich ein IQ von 116,8 (bzw. 117).

Und schon hat man das, was in der Praxis meist noch in viel gravierender Form auftritt: Die beiden IQ-Werte (119 und 117) sind nicht gleich. Während es in unserem konstruierten Fall natürlich daran liegt, dass ich bei der obigen Berechnung die Werte ins Blaue hinein erfunden habe, liegt es in der Realität an einem anderen Faktor – nämlich an der Frage, welche Normstichprobe ich heranziehe, um die Person, deren IQ ich messen will, mit ihr zu vergleichen. Im Allgemeinen sollte man hierzu immer diejenige Normstichprobe wählen, die der Person bezüglich Alter und Geschlecht am ähnlichsten und zudem möglichst aktuell ist. Es finden sich aber auch noch feiner aufgegliederte Normen, z.B. auch bezüglich des Bildungsstands oder der besuchten Schulform. Ein IQ-Wert bedeutet immer nur, wie gut oder schlecht die Leistungen einer Person im Vergleich mit einer ihr möglichst ähnlichen Gruppe von Menschen sind. Und das ist genau der Grund, aus dem man für ein und denselben Menschen unzählige IQ-Werte berechnen kann – und ein IQ-Wert völlig ohne Aussage ist, solange man nicht mit angibt, zu welcher Normstichprobe man die Person ins Verhältnis gesetzt hat: Wenn der IQ unseres Kindes aus dem Vergleich mit einer Stichprobe Fünfjähriger resultiert, würde man den IQ von 118 nicht als besonders hoch einstufen; stammt er jedoch aus einem Vergleich mit einer Gruppe 16-Jähriger, kann man sich ziemlich sicher sein, dass das Kind wohl hochbegabt ist. Das ganze noch einmal in Kürze: Wenn jemand Ihnen das nächste Mal erzählt, er habe einen IQ von 150 – dann fragen Sie ihn doch bitte, aus dem Vergleich mit welcher Normstichprobe dieses Ergebnis resultiert.

Wie ist Intelligenz in der Menschheit verbreitet?

Wie oben bereits erwähnt, handelt es sich bei IQ-Werten um eine standardisierte Skala, auf der sich durch einfache Umrechnung alle möglichen Werte abbilden lassen, solange man die zwei wichtigen Angaben vorliegen hat: den Mittelwert und die Standardabweichung der betreffenden Stichprobe. Wann immer ich im Rest dieses Artikels von IQ-Werten spreche, bitte ich, dieses zu berücksichtigen.

Wie man aus zahlreichen Untersuchungen an großen repräsentativen Stichproben weiß, folgen IQ-Werte in der menschlichen Bevölkerung ziemlich genau einer so genannten Gauss’schen Normalverteilung (auch Gauss’sche Glockenkurve oder einfach kurz Normalverteilung genannt). Bei diesem Begriff handelt es sich im Grunde um eine Art “Etikett”, da es eine besondere Form von Verteilung bezeichnet, der (statistische) Werte (wie eben IQ-Werte) folgen können. Eine Normalverteilung lässt sich anhand zweiter Werte genau beschreiben, und zwar wiederum anhand des Mittelwertes und der Standardabweichung, die maßgeblich die Form der Kurve beeinflussen. Was ich im vergangenen Abschnitt noch verschwiegen habe, ist der sehr wichtige Umstand, dass die Tatsache, dass IQ-Werte einer solchen Normalverteilung folgen, einen ganz entscheidenden Vorteil mit sich bringt: nämlich den, dass die Berechnungen und Umrechnungen, die ich oben dargestellt habe, dadurch überhaupt erst mathematisch zulässig sind. Würden IQ-Werte keiner Normalverteilung folgen, hätten wir es um einiges schwieriger. So jedoch lässt sich (wie oben schon erwähnt) guten Gewissens sagen: IQ-Werte haben in der menschlichen Bevölkerung einen Mittelwert von 100 und eine Standardabweichung von 15. Um das ganze einmal ein bisschen plakativer zu machen, habe ich einmal eine entsprechende Abbildung gebastelt.

Verteilung des IQ in der Bevölkerung Verteilung des IQ in der Bevölkerung

Um diese Glockenkurve nun zu verstehen, ist es wichtig, dass man nicht versucht, die y-Achse zu interpretieren (weshalb ich sie auch weggelassen habe). Mathematisch betrachtet handelt es sich bei dieser Kurve um eine Dichte-Funktion, d.h. auf der y-Achse ist die schwer interpretierbare Dichte abgetragen. Man darf und kann diese Kurve daher nicht direkt so lesen, dass sie einem Aufschluss darüber gibt, wie vielen Prozent der Menschen welcher IQ-Wert zugordnet ist (das geht daher nicht, weil die Intelligenz hier mathematisch als stetiges Merkmal konzipiert ist – aber nun genug mit dem statistischen Wirrwarr).

Sinnvoll interpretierbar ist hingegen das Integral, also die Fläche unter der Glockenkurve. Mit deren Hilfe kann man zumindest Aussagen darüber treffen, wie viele IQ-Werte sich in einem bestimmten Bereich bewegen. So liegen z.B. im Bereich einer Standardabweichung unter- und überhalb vom Mittelwert von 100 (also zwischen den IQ-Werten von 85 und 115) rund 68% aller IQ-Werte, und somit auch aller Menschen. Zwischen 70 und 130 liegen derweil z.B. rund 95% aller Werte, d.h. es liegen nur 2,5% unter 70 und 2,5% über 130. Als Konvention hat sich daher eingebürgert, alle IQ-Werte zwischen 85 und 115 als “durchschnittlich” zu bezeichnen, Werte zwischen 70 und 85 als “niedrig” und Werte zwischen 115 und 130 als “hoch”. “Hochintelligent” ist daher streng genommen etwas anderes als “hochbegabt”, was sich als Begriff für IQ-Werte über 130 etabliert hat. Zur Erinnerung: Diese Menschen liegen bzgl. ihrer kognitiven Leistungen mehr als zwei Standardabweichungen über dem Mittelwert ihrer (hoffentlich) alters- und geschlechtsspezifischen Normstichprobe. Ähnliches gilt in umgekehrter Richtung für IQ-Werte unter 70. Hier bewegen wir uns (allerdings noch mit bedeutenden Abstufungen!) im Bereich der geistigen Behinderung (für deren Definition vorrangig der IQ herangezogen wird). Diese praktischen Prozentangaben haben einen weiteren Vorteil: Man kann jedem IQ-Wert einen Prozentrang zuweisen und somit z.B. Aussagen der Sorte “besser als 84% aller Mitglieder der Normstichprobe” (bei einem IQ von 115) treffen. Um zu der Anmerkung von vorhin zurückzukommen: Ein IQ von 150 würde bedeuten, dass 99,96% der Menschen in der Normstrichprobe (und somit gewissermaßen auch in der Bevölkerung, für die die Normstichprobe ja repräsentativ sein soll) einen niedrigeren Wert aufweisen: Und das ist, wie sie auch an der Abbildung sehen können, hochgradig unwahrscheinlich – mal davon abgesehen, dass kein Intelligenztest einen so hohen Wert vernünftig messen kann (Thema des nächsten Artikels).

Exkurs: Männer & Frauen

Ein ganz heikles Thema ist es natürlich, ob nun Männer oder Frauen im Durchschnitt intelligenter sind. Der mir bekannte aktuelle Forschungsstand hierzu ist der, dass es – bezüglich der allgemeinen Intelligenz – einen marginalen Unterschied dahingehend gibt, dass Männer ein paar wenige IQ-Punkte vorne liegen, gleichzeitig aber die Varianz bei Männern höher ist: Sowohl in den sehr hohen als auch in den sehr niedrigen IQ-Bereichen überwiegen Männer. Dazu sei noch gesagt, dass dieser Unterschied durch zwei Aspekte an Bedeutung verliert: Zum einen ist die Varianz innerhalb jeder der beiden Gruppen um ein Vielfaches größer als der Unterschied zwischen den Gruppen, und zum anderen ist es gut möglich, dass jener Unterschied dadurch zustande gekommen ist, dass viele Intelligenztests bestimmte Aufgaben in den Vordergrund stellen, die Männer bevorteilen. Denn was als gut gesichert gilt, ist, dass Männer und Frauen sich deutlich hinsichtlich ihrer kognitiven Stärken und Schwächen unterscheiden: Es gilt als sehr robuster Befund, dass Männer z.B. im Mittel besser im visuell-räumlichen Denken abschneiden als Frauen, die wiederum im Durchschnitt die Nase vorn haben, was die verbale Intelligenz betrifft.

Der Flynn-Effekt: Wird die Menschheit wirklich immer intelligenter?

Eine andere Fragestellung ist die, ob der durchschnittliche IQ der Menschheit tatsächlich zunimmt – ein Phänomen, das in Anlehnung an den neuseeländischen Politologen James R. Flynn als Flynn-Effekt bezeichnet wird. Dieser Fragestellung auf den Grund zu gehen, ist aufgrund der beschriebenen Berechnungsweise des IQ gar nicht so einfach – denn um herauszufinden, ob der IQ im Mittel steigt, darf man Menschen eben nicht mit aktuellen Normstichproben vergleichen, sondern muss ältere heranziehen: Nur so kommt man dem Flynn-Effekt auf die Schliche.

In der Tat haben groß angelegte Studien ergeben, dass der mittlere IQ in der westlichen Bevölkerung zwischen den 1930er und den 1990er Jahren um 0,2 – 0,5 Punkte pro Jahr gestiegen ist. Dieser Anstieg ergibt sich natürlich aus dem Vergleich mit den immer gleichen Normen aus den 1930er Jahren – anders wäre ein Anstieg ja gar nicht messbar. Dabei nahmen die Leistungen in nicht-sprachlichen Tests (die vor allem fluide Intelligenz messen) deutlich stärker zu als die in sprachlich basierten Tests (die vor allem kristalline Intelligenz messen). Für diesen Befund wurden diverse Erklärungshypothesen diskutiert, die im Folgenden kurz angeschnitten werden sollen.

Dauer des Schulbesuchs und Erfahrung mit typischen Intelligenztestaufgaben

In der Tat nahm die durchschnittliche Dauer des Schulbesuchs in dieser Zeit deutlich zu – was deshalb wichtig ist, weil somit auch die Erfahrung und die Geübtheit im systematischen Lösen von schulischen Aufgaben zunahm, die typischen Intelligenztests sehr ähnlich sind. Der Anteil dieser Faktoren am Flynn-Effekt ist jedoch eher als gering zu einzustufen.

Erziehungsstil

Weiterhin wurde in den Raum geworfen, dass der typische elterliche Erziehungsstil in dieser Zeitspanne natürlich auch einem erheblichen Wandel unterlegen war. Konkret wird von den Vetretern dieser Hypothese angeführt, dass von Eltern zunehmend Wert darauf gelegt wurde, ihre Kinder schon früh in ihrer kognitiven Entwicklung zu fördern. Dieser Trend fand aber nicht nur im familiären Rahmen, sondern auch in viel größerem Maße in den Medien (Beispiel “Sesamstraße”) und in der Politik statt. Die Befunde hierzu sind widersprüchlich. Während man weiß, dass große, national initiierte Bildungsprogramme eher keine Wirksamkeit bezüglich der Erhöhung des durchschnittlichen IQs vorweisen können, wirkt sich frühe Förderung auf der individuellen Ebene durchaus positiv auf die kognitive Entwicklung aus.

Weniger Fälle geistiger Behinderung

Zu bedenken ist sicherlich auch, dass aufgrund besserer medizinischer Versorgung die Zahl der mit geistigen Behinderungen geborenen Kinder in der beschriebenen Zeitspanne zurückgegangen ist. Einige Studien hierzu messen diesem Aspekt im Hinblick auf den Flynn-Effekt eine zentrale Bedeutung bei: Durch den überproportionalen Wegfall sehr niedriger IQ-Werte (<70) in der Bevölkerung stieg der durchschnittliche IQ im Mittel an.

Ernährung

Es ist gut belegt, dass bessere Ernährung (z.B. vitaminreiche Kost, weniger Schadstoffe, etc.) die geistige Entwicklung von Kindern positiv beeinflusst. Durch ungesunde Ernährung kann es z.B. zu Schilddrüsenunterfunktionen kommen (gekennzeichnet durch einen Mangel an Triiodthyroxin und Triiodthyronin), die dann wiederum eine Verzögerung der geistigen Entwicklung bedingen können, sodass der mittlere IQ infolgedessen gestiegen sein könnte.

Vermutlich ist es tatsächlich nicht einer dieser Faktoren, die den Flynn-Effekt erklären, sondern ihr Zusammenspiel. Interessanterweise ist es derweil übrigens so, dass der Anstieg des mittleren IQ seit Anfang der 1990er Jahre als “gestoppt” gilt, sodass man zumindest momentan sagen kann, dass der Flynn-Effekt der Vergangenheit angehört. Manche deuten dies als Beleg für die Richtigkeit der Ernährungshypothese (da die Nahrungsversorgung in der westlichen Gesellschaft gewissermaßen nicht noch viel besser werden kann), ich jedoch würde eher sagen, dass diese Tatsache der “Sättigung” in entsprechender Weise auf alle Erklärungsansätze zutrifft.

In diesem Artikel habe ich mehrfach schon das Thema der Intelligenzmessung gestreift. Ob, wie – und vor allem – wie genau man die Intelligenz eines Menschen tatsächlich messen kann, wird daher der Inhalt des nächsten Artikels sein.

© Christian Rupp 2014

Jenseits psychischer Störungen: Wo Psychologen sich sonst noch überall auskennen

Im vorherigen Artikel habe ich dargestellt, warum Psychologen ebenso wie Physiker, Chemiker, Biologen oder Soziologen Ahnung davon haben, wie man (Natur-)Wissenschaft betreibt und daraus abgeleitetes Wissen dahingehend beurteilen kann, ob es vertrauenswürdig ist oder nicht. In diesem Artikel soll es nun darum gehen, wovon Psychologen neben ihrer wissenschaftlichen Kompetenz sonst noch so Ahnung haben und in welche beruflichen Bereiche verschiedene Schwerpunktsetzungen und Spezialisierungen führen können. Dabei nutze ich diesen Artikel ganz bewusst, um all die Bereiche vorzustellen, die nichts direkt mit psychischen Störungen zu tun haben (was ja leider die verbreitete Auffassung über den Inhalt des Psychologiestudiums ist). Die Klinische Psychologie werde ich daher gesondert im nächsten Artikel vorstellen und diese Gelegenheit nutzen, um endlich das größte Irrtum überhaupt aufzuklären. Aber nun zurück zu den vielen anderen Unterbereichen der Psychologie, bei deren Darstellung ich mich in etwa an die Reihenfolge im Studium halten und mich von den Grundlagen- zu den Anwendungsfächern bewegen werde.

Allgemeine Psychologie & Kognitive Neurowissenschaft

Dieses Grundlagenfach mit dem Doppelnamen, unter das ich die Fächer “Biologische Psychologie” und “Physiologie” einmal subsumieren möchte, betrachtet den Menschen als Wesen, das Informationen aus seiner Umwelt verarbeitet und interessiert sich im Groben für die Art und Weise, wie diese Informationsverarbeitungsprozesse im Gehirn ablaufen. Daher gehört hierzu als Thema zu allererst die Wahrnehmung – von unseren Sinnesorganen bis zu den höchsten Verarbeitungsstufen im Gehirn. Dabei stößt man dann z.B. auf Gehirnareale, die auf die Verarbeitung von Gesichtern oder Schachmustern spezialisiert sind oder erfährt etwas über spezielle, auf Hirnschäden zurückgehende Störungen der Wahrnehmung, wie z.B. die Prosopagnosie – die Unfähigkeit, Gesichter wahrzunehmen und zu unterscheiden (wobei die visuelle Verarbeitung ansonsten völlig intakt ist). Eine weitere wichtige Sparte in diesem Fach ist das Gedächtnis. So lernt man im Studium beispielsweise Modelle über den Aufbau und die Funktionsweisen der verschiedenen Teile unseres Gedächtnisses (u.a. Arbeitsgedächtnis & Langzeitgedächtnis) kennen, ebenso wie natürlich die dazu gehörigen Forschungsmethoden und Störungen des Gedächtnisses (Amnesien und Demenzen). Eine Studie, die sich mit den dem Gedächtnis zugrunde liegenden Prozessen im Gehirn beschäftigt, habe ich im vorletzten Artikel beschrieben. Des Weiteren gehören zu diesem Fach die Themen Aufmerksamkeit, Denken & Problemlösen, Emotion & Motivation und Sprache. Ja, Psychologen beschäftigen sich auch intensiv mit der menschlichen Sprache, was kaum jemand weiß. Dabei sind die Fragen danach, wie wir im Gehirn Sprache verarbeiten (sowohl verstehen als auch selbst produzieren) ein ziemlich altes und sehr etabliertes Forschungsgebiet der Psychologie. Und auch hierzu gehört natürlich die Kenntnis über Störungen der Sprache (genannt Aphasien), die z.B. nach Schlaganfällen auftreten können.

Insgesamt erklärt sich aus der Existenz dieses Faches, warum alle Psychologen in ihrem Studium eine Menge von Dingen lernen müssen, die z.B. Medizinstudierenden auch begegnen. So kommt keiner durchs Psychologiestudium, ohne ziemlich genau den Aufbau des Gehirns und die Funktion verschiedener Gehirnareale, den Aufbau des gesamten Nervensystems, die Funktionsweise seiner Nervenzellen, die Eigenschaften von Hormonen und Neurotransmittern und die Funktionsweise von Untersuchungsverfahren für das Gehirn (EEG, MEG, PET, fMRT, etc.) zu kennen. Da man die Wege der Wahrnehmung kennen muss, gehört auch die Kenntnis des Aufbaus unserer Sinnesorgane (Augen, Ohren inkl. Gleichgewichtsorgan, Nase, Zunge, Berührungs- und Schmerzwahrnehmung) dazu. Wenn man sich auf diesem Gebiet spezialisiert, landet man als Psychologe entweder in der Wissenschaft und forscht zu einem der beschriebenen Themen, oder aber man ergreift das praktische Berufsfeld des Neuropsychologen, dessen Tätigkeit die präzise Diagnostik und darauf folgende Therapie von neurologisch bedingten Störungen in den oben beschriebenen Bereichen ist, wie sie z.B. nach einem Schlaganfall auftreten.

Entwicklungspsychologie

In diesem Fach lernt man im Wesentlichen, wie die normale psychische Entwicklung bei Kindern ablaufen sollte und ab wann etwas als nicht mehr normal anzusehen ist. Hierzu gehören z.B. die sprachliche Entwicklung, die kognitive und Intelligenzentwicklung, die emotionale Entwicklung und auch die Entwicklung motorischer Fähigkeiten. Ein zentraler, für die Praxis relevanter Punkt ist hierbei das Erkennen von Entwicklungsverzögerungen, die beispielsweise auf eine geistige Behinderung oder eine tiefgreifende Entwicklungsstörung hinweisen können. Die Entwicklungspsychologie hat aber auch sehr interessante Experimente zu bieten, die uns eine Einsicht darin gewähren, wie kleine Menschen die Welt um sich herum so wahrnehmen. Bekannt geworden ist vor allem der “Spiegeltest”, bei dem man schaut, wie ein Kind auf sein Spiegelbild reagiert, d.h. ob es erkennt, dass es sich selbst betrachtet. Dieses Erkennen setzt das Vorhandenensein eines Selbstkonzeptes voraus, d.h. eines “Ich-Bewusstseins”. Dieses weisen Kinder in der Regel im Verlauf des zweiten Lebensjahres auf, was man im Spiegeltest z.B. damit nachweisen kann, dass das Kind sich einen roten Punkt, den man ihm auf die Stirn geklebt hat, selbst wieder abnimmt. Das Fehlen dieses Selbstkonzeptes wird übrigens auch als eine Ursache für das Phänomen diskutiert, dass wir uns an unsere ersten 2 Lebensjahre in der Regel nicht erinnern können – weil vorher Erinnerungen nicht in Bezug auf das Selbst abgespeichert werden können (was wiederum nötig ist, um sie später im Leben noch abrufen zu können).

Zeitlich nach dem Selbstkonzept entwickelt sich derweil erst die Theory of Mind, die, kurz gesagt, die Fähigkeit beschreibt, anderen Menschen Gedanken, Absichten, etc. zuzuschreiben und hierauf zu reagieren (eine Fähigkeit, die bei z.B. bei Autismus eingeschränkt ist). Der bekannteste wissenschaftliche Vertreter der Entwicklungspsychologie ist sicherlich bis heute Jean Piaget, dessen Befunde zur kognitiven Entwicklung von Kindern großen Einfluss auf die Pädagogik genommen haben. Allerdings deutet inzwischen eine Vielzahl von neueren Forschungsergebnissen darauf hin, dass Piaget, ganz grob gesagt, die kognitiven Fähigkeiten von Kleinkindern stark unterschätzt hat. Psychologen, die sich heutzutage in der Entwicklungspsychologie spezialisieren, sind entweder auch in der Forschung tätig oder üben ähnliche diagnostische Tätigkeiten wie Neuropsychologen aus, nur eben mit Kindern. Das Fach ist zudem mit der Pädagogischen Psychologie verwandt (siehe weiter unten).

Sozialpsychologie

Wie schon im vorletzten Artikel vorgestellt, beschäftigt sich die Sozialpsychologie damit, wie das menschliche Verhalten und Erleben durch das Verhalten anderer Menschen, oder, allgemeiner gesagt, durch soziale Situationen beeinflusst wird. Aus der Sozialpsychologie stammt z.B. viel Forschung dazu, wie sich Menschen in Gruppen verhalten und wie insbesondere immenser sozialer Druck (z.B. durch Befehle in einem autoritären System) das Verhalten von Menschen auch gegen deren eigene Überzeugungen oder Persönlichkeitseigenschaften steuern können. So waren nach dem zweiten Weltkrieg viele Studien davon geprägt, dass man verstehen wollte, wie es in Deutschland zu einer so verheerenden Kastastrophe wie dem Emporkommen der Nazis und der Shoa kommen konnte. Viele dieser Experimente haben auch in der Laiengesellschaft große Berühmtheit erlangt, darunter z.B. das Stanford-Gefängnisexperiment von Zimbardo aus dem Jahr 1971.

Zimbardo untersuchte unter realistischen Bedingungen, wie Probanden, denen zufällig entweder die Rolle eines Insassen oder eines Gefängniswärters zugewiesen wurde, sich über die Zeit hinweg verhielten, wenn sie selbst während des gesamten Experiments anonym handelten. Das Experiment lieferte jedoch so massive Einblicke in die Grausamkeiten menschlichen Verhaltens (Gewaltexzesse, Folter…), dass es vorzeitig abgebrochen wurde. Es hat jedoch gezeigt, wie groß der Einfluss von Regeln und Vorschriften sowie von Anonymität (bzw. Deindividuierung) und der Übernahme einer Rolle (Insasse vs. Gefängniswärter) auf zwischenmenschliches Verhalten ist. Die gewaltsamen Exkalation des Experiments hat nicht zuletzt auch dazu beigetragen, dass die Ethikrichtlinien für psychologische Forschung sehr viel strenger geworden sind. Heutzutage ist es selbstverständlich, dass die Teilnehmer an einem psychologischen Experiment vor ihrer Zustimmung zur Teilnahme über das informiert werden, was passieren wird (informed consent), dass ihnen kein Schaden zukommt und dass sie jederzeit aus dem Experiment aussteigen können. Sozialpsychologen sind typischerweise Wissenschaftler, eine praktische Berufsrichtung gibt es nicht direkt. Allerdings werden sehr viele sozialpsychologische Ergebnisse in der Organisationspsychologie, einem primär anwendungsorienerten Fach, das ich gleich noch vorstellen werde, verwendet.

Differentielle Psychologie bzw. Persönlichkeitspsychologie

Im Gegensatz zur Sozialpsychologie versucht dieses Fach, das Verhalten von Personen nicht durch die soziale Situation zu erklären, sondern durch relativ stabile, der Person innewohnende Persönlichkeits- oder Charaktereigenschaften (auf Englisch traits). Sie untersucht daher zum einen, in welchen Eigenschaften sich Personen unterscheiden (das meint differentielle Psychologie), und zum anderen, welcher Art der Zusammenhang zwischen Persönlichkeitseigenschaften und tatsächlichem Verhalten ist. Zum ersten Thema ist der wohl bekannteste, auf Faktorenanalysen beruhende Befund der “Big 5” zu nennen  –  fünf globaler Eigenschaften, unter denen sich sämtliche Charaktereigenschaften, die wir im Alltag zur Beschreibung einer Person verwenden, zusammenfassen lassen. Eine Beschreibung der Big 5 finden Sie hier. Zum zweiten Thema lässt sich sagen, dass Persönlichkeitseigenschaften zwar nicht irrelevant in der Vorhersage von Verhalten sind (dass ein introvertierter Mensch freitags abends eher nicht in die Disco gehen wird, leuchtet ein), jedoch keine so guten Vorhersagen liefern wie persönliche Motive, die manche ebenfalls zur Persönlichkeitspsychologie rechnen und andere eher zur Allgemeinen Psychologie. Eine weitere ganz zentrale Domäne der Differentiellen Psychologie (und wahrscheinlich die am besten erforschte) ist außerdem die Intelligenz, inklusive ihrer Unterformen und Facetten. Die Erkenntnisse der Persönlichkeitspsychologie werden sowohl in der Arbeits- und Organisationspsychologie (z.B. als Variablen zur Beurteilung der Passung zwischen Bewerber und Arbeitsplatz) als auch in der klinischen Psychologie und Psychotherapie (z.B. als relevanter Faktor in Bezug auf die Entstehung einer psychischen Störung) sowie in der forensischen Psychologie (Warum werden Menschen kriminell?) genutzt.

Psychologische Diagnostik

In diesem Fach lernt man nicht primär, psychische Störungen zu diagnostizieren, sondern es geht darum, wie sich verschiedene Merkmale einer Person durch Tests, Fragebögen, Verhaltensbeobachtung, zielorientierte Gesprächsführung etc. erfassen bzw. möglichst verlässlich und präzise messen lassen. Die wichtigsten Mermale hierbei sind die allgemeine Intelligenz (auch bezeichnet als kognitive Leistungsfähigkeit) sowie ihre verschiedenenen Unterfacetten und die Persönlichkeitsstruktur einer Person (Charaktereigenschaften, Einstellungen, Motive, etc.). Darüber hinaus gibt es natürlich Tests, die weitere kognitive Leistungen wie Aufmerksamkeit und Konzentration messen, und klinische Fragebögen, die Symptome verschiedener psychischer Störungen erfassen. Zum Fach “Psychologische Diagnostik” gehört auch die Testtheorie, die sich damit beschäftigt, wie man solche psychologische Tests konstruiert, die gültige Aussagen über eine Person liefern. Was man unter psychometrischen Gütekriterien versteht, die solche Tests erfüllen müssen, können sie hier nachlesen; was Beispiele für gute und schlechte Tests sind, finden Sie zudem hier bzw. hier erklärt. Die Kenntnis darüber, wie man solche Tests und Fragebögen konstruiert (was alles andere als trivial ist), erachte ich neben den grundlegenden wissenschaftlichen und statistischen Kenntnissen als eine der wertvollsten, die man sich im Psychologiestudium aneignet.

Im Rahmen der psychologischen Diagnostik gibt es eine Menge von beruflichen Anwendungsfeldern. So kommen diagnostische Verfahren z.B. in der Auswahl von Bewerbern zum Einsatz, oft im Rahmen von Assessment Centern. Ebenso ist psychologische Diagnostik z.B. bei der Agentur für Arbeit oder bei Berufsförderungswerken gefragt, um zu entscheiden, ob z.B. jemand für eine bestimmte Umschulung geeignet ist. Ebenso ergänzen standardisierte klinisch-diagnostische Verfahren die Diagnostik in der Psychotherapie. Ein wichtiges Anwendungsfeld der psychologischen Diagnostik ist zudem die Verkehrspsychologie: Im Rahmen der medizinisch-psychologischen Untersuchung (kurz MPU, auch bekannt als “Idiotentest”) spielen die diagnostischen Kompetenzen von Psychologen eine entscheidende Rolle dabei, z.B. zu beurteilen, ob auffällig gewordenen Verkehrsteilnehmern die Fahrerlaubnis wieder erteilt werden sollte oder nicht. Viele Psychologen sind zudem auch als Gutachter vor Gericht tätig, wobei die Themen sehr verschieden sein und von Sorgerechtsentscheidungen (“Was entspricht dem Wohl des Kindes?”) über verkehrspsychologische Fragestellungen bis hin zur Glaubhaftigkeitseinschätzung von Zeugenaussagen reichen können. Bei solchen Fragenstellungen werden, um die diagnostischen Fragen zu beantworten, dann eher bestimmte diagnostische Gesprächsführungstechniken als Tests und Fragebögen zum Einsatz kommen, die ebenfalls Teil der Ausbildung in psychologischer Diagnostik sind und welche daher auch zum absoluten Standardrepertoire eines jeden Psychologen gehören.

Arbeits- & Organisationspsychologie

Dieses, neben der Klinischen Psychologie zweite große Anwendungsfach der Psychologie wendet psychologische Erkenntnisse in der Arbeitswelt an. Die Arbeitspsychologie fußt dabei eher auf der Allgemeinen Psychologie und ist konzeptuell mit den Ingenieurwissenschaften verwandt. So kümmern sich Arbeitspsychologen z.B. darum, Arbeitsabläufe in einer Fertigungshalle zu optimieren, Maschinen ergonomisch zu gestalten (also so, dass die Bedienbarkeit möglichst an den Menschen angepasst wird) oder Arbeitsabläufe durch Veränderungen an Menschen und Maschinen sicherer zu machen. Die Organisationspsychologie beschäftigt sich derweil hauptsächlich mit dem Personal (genannt human resources) in einer Organisation (meist einem Unternehmen) und basiert stark auf der Sozialpsychologie. Wichtige Felder innerhalb der Organisationspsychologie sind die Personalauswahl (wofür diagnostisch-psychologische Kenntnisse besonders wichtig sind, siehe oben) und die Personalentwicklung, die darauf abzielt, die Kompetenzen vorhandener Mitarbeiter durch Trainings- und Coachingmaßnahmen auszubauen, damit diese z.B. überzeugender auftreten oder besser mit Kunden interagieren können – ergo, um dem Unternehmen mehr Profit zu bringen. Zentral ist auch die Anwendung der sozialpsychologischen Befunde zur Gruppeninteraktion, da Teamarbeit in der freien Wirtschaft gerade absolut en vogue ist. Angegliedert an dieses Fach ist auch die Wirtschaftspsychologie, die sich z.B. mit Werbetechniken und den psychologischen Prozessen beschäftigt, die Phänome wie der Finanzkrise erklären können.

Pädagogische Psychologie

Auch wenn ich (Achtung Sarkasmus) im Studium nicht so richtig die Daseinsberechtigung dieses weiteren Anwendungsfaches verstanden habe, was ich größtenteils auf seine allumfassende Schwammigkeit zurückführe, möchte ich hier kurz beschreiben, worum es so in etwa geht. Die Pädagogische Psychologie (kurz PP) könnte man am ehesten als die empirische Mutter der Pädagogik bezeichnen – d.h., das, was angehende Lehrer in ihrem Studium lernen, basiert zu einem Großteil auf Befunden der PP. So werden z.B. die optimale Interaktion zwischen Lehrern und Lernenden oder die effektivste Art der Wissensvermittlung untersucht (ironischerweise genau das, was ich hier gerade tue). Daraus abgeleitet ist auch die Forschung zu den Merkmalen, die eine effektive Beratung kennzeichnen. Zudem ist ein weiterer Zweig der PP die Hochbegabungsforschung, die sich vor allem mit der Vorhersage und der Förderung von Hochbegabung beschäftigt. Die Anwendungsbereiche der PP sind vielfältig. Psychologen mit dieser Orientierung arbeiten z.B. in Erziehungs- oder Paarberatungsstellen, in der Hochbegabtenförderung oder in Schulen als Schulpsychologen, die meistens aber eine hoch undankbare Stellung zwischen Lehrern und Schülern einnehmen.

Soft-Skills: Gesprächsführung, soziale Kompetenzen & Co.

Wie in fast jedem Studium auch nimmt man aus dem Psychologiestudium eine Menge so genannter soft skills mit, also Fertigkeiten und Kompetenzen, die man mehr oder weniger automatisch mit auf den Weg bekommt. Dazu gehören bei Psychologen vor allem soziale Kompetenzen, sowohl eine effektive Teamarbeit betreffend als auch z.B. das selbstsichere Auftreten und Sprechen beim Halten einer Referatspräsentation vor anderen. Gesprächsführung ist, wie oben ja schon mehrfach angeklungen ist, wohl im Psychologiestudium die kennzeichnendste dieser Fertigkeiten, die je nach Uni unterschiedlich ausführlich vermittelt wird. Gemeint ist damit zum einen die diagnostische Gesprächsführung, mit der man möglichst viel über einen Menschen erfahren will, und zum anderen die therapeutische Gesprächsführung, die darauf abzielt, Veränderungsmotivation aufzubauen (“Motivational Interviewing”), Dinge zu hinterfragen und Veränderungen einzuleiten. Diese Grundlagen schon im Studium zu erlernen, ist sinnvoll, da man, wenn man z.B. anschließend noch die Ausbildung zum Psychologischen Psychotherapeuten machen will, auch schon zu Beginn der Ausbildung relativ selbstständig Therapien durchführen muss. Und auch in anderen Bereichen wie der Beratung oder der Personalentwicklung ist Gesprächsführung das Werkzeug Nr 1. Letztlich ist diese, neben der wissenschaftlichen Kompetenz und dem breiten Fachwissen, diejenige Kompetenz, für an Psychologen in der Arbeitswelt am meisten geschätzt wird. Und auch wenn es sich trivial anhört (“Gespräche führen kann doch jeder”), so ist es alles andere als das – was jeder schnell merkt, der es sich zu einfach vorstellt und dann vollends gegen die Wand fährt.

Und um zum Cliché des Analysierens zurückzukehren, ist zumindest mein Eindruck, dass man nach dem Studium einen anderen Blick auf Menschen hat. Man hinterfragt viel mehr, warum Menschen sich so verhalten, wie sie es tun, macht sich Gedanken über die bewussten oder unbewussten Ziele, die jene damit verfolgen, und fragt sich vielleicht auch, welche Erfahrungen in der Vergangenheit die Person zu dem gemacht haben, was sie heute ist. So kommt man z.B. eher als andere Menschen auf die Idee, dass ein angeberisches, egoistisches A*schloch vielleicht über eine narzisstische Persönlichkeitsstörung verfügt, die eigentlich auf einem furchtbar niedrigen Selbstwert fußt. Ob man denjenigen danach weniger hasst, ist die andere Frage. Als Psychologe muss man dann meiner Erfahrung nach in zweierlei Hinsicht aufpassen. Erstens muss man in der Lage sein, den “analytischen Blick” ausschalten zu können, weil sich Freunde oder Familie sonst zurecht in die Ecke gedrängt fühlen werden. Zweitens muss man aufpassen, sich selbst nicht zu stark zu “analysieren”, da man unglaublich schnell auf Dinge stößt, die man vielleicht aufgrund seines Fachwissens als gefährlich einstuft. Meine Erfahrung ist, dass man darüber sehr schnell ins Grübeln kommt und man sich in der Folge schlecht fühlt, weshalb es wichtig ist, sich von solchen Gedanken auch wieder distanzieren zu können. Was ich hier mit “analysieren” meine, ist übrigens nicht dasselbe, was Sigmund Freud hierunter verstanden hat. Darüber erfahren Sie mehr im nächsten Artikel.

Eine weitere wichtige Sache, die man im Psychologiestudium lernt, ist, mit der Situation umzugehen, dass man permanentem Leistungsdruck ausgesetzt ist, der einerseits aufgrund der extrem hohen Anforderungen und des massiven Lernaufwands (der meistens leider ein Auswendiglern-Aufwand ist) objektiv besteht, aber andererseits durch die Charakteristika der Menschen, die Psychologie studieren, noch verschlimmert wird. Stellen Sie sich vor, Sie sind in der Mehrzahl von Leuten umgeben, die ihr Abitur mit ca. 1,3 oder besser gemacht haben (oder im Masterstudium ihren Bachelor, was nochmal eine ganz andere Hausnummer ist). Im Normalfall sind das nicht die sympathischsten Menschen: Viele sind von ihrem Ehrgeiz leider so besessen, dass das inhaltliche Interesse am Fach in den Hintergrund rückt. Hauptsache top-Noten und Hauptsache besser als die anderen. Sie können sich vorstellen, was für Themen Sie in der Cafeteria erwarten, wenn man es nicht schafft, sich ein paar normale Freunde zu suchen. In der Folge und zum Abschluss ein kleiner typischer, von mir mit Sarkasmus und Zynismus gespickter Dialog, der einem dort begegnen könnte:

“Und, was hattest du für eine Note in Physiologie? Ich hatte ja eine 1,3.” (Gedanklich: “Wehe, die blöde Kuh hat was Besseres!”)

“Ich hatte eine 1,0, dabei war ich mir totaaal sicher, dass ich durchgefallen bin, hihi!” (Gedanklich: “Chakka!”)

“Hey cool, herzlichen Glückwunsch! Vielleicht sollte ich mal zur Klausureinsicht gehen, um zu gucken, ob die vielleicht was übersehen haben” (Gedanklich: “Dass diese dumme Pute besser ist als ich, geht einfach mal GAR nicht. Ich hasse sie!”)

“Ja, mach das doch. Hast du denn eigentlich schon angefangen, für Entwicklungspsychologie zu lernen?” (Gedanklich: “Hoffentlich bin ich ihr schon um Meilen voraus!”)

“Ja klar, bin schon längst fertig und muss nur nochmal wiederholen; jetzt erst anzufangen mit dem Auswendiglernen, wäre ja wohl von vornherein zum Scheitern verurteilt” (Gedanklich: “Als ob ich der jetzt auch noch den Trumpf erlauben würde! Warum sollte ich ihr sagen, dass ich erst vorgestern angefangen habe?”)

“Achso, ja cool. Ich komme auch super voran” (Gedanklich: “Mist, ich muss mich echt beeilen – Wie soll ich das bloß schaffen? Ich verkacke bestimmt und schreibe eine 2,0 oder so. Ich bin einfach zu dumm!”)

Ergebnis: Beide fühlen sich beschissen.

Wie Sie sehen: In dieser widrigen Umwelt muss man sich erst einmal zurechtfinden. Daher ist vielleicht das Wichtigste, das man im Psychologiestudium lernt, an sich selbst zu glauben. Aber der Fairness halber muss ich doch sagen, dass zum Glück nicht alle so drauf sind und ich in meinem Studium bisher auf viele sehr nette Leute gestoßen bin:-).

© Christian Rupp 2013

Psychologische Tests – Teil 3: Von diesen “Tests” sollten Sie lieber die Finger lassen

Nach den “echten” psychologischen Tests folgen nun die “unechten” – in dem Sinne, dass diese keine validen Aussagen über Sie als Person treffen können. Auch in diesem Teil habe ich die vielen verschiedenen Vertreter wieder zu möglichst übersichtlichen Kategorien zusammengefasst. Beginnen wir also.

“Tests” aus Klatschzeitschriften

Wer kennt das nicht? Auf der Titelseite der “Woman”, “Tina”, “Frau im Spiegel”, und wie sie sonst noch alle heißen, locken Schlagzeilen wie “So finden Sie heraus, welcher Persönlichkeitstyp Sie sind!” oder “Wie eifersüchtig sind Sie?”. Wie deutlich erkennbar ist, handelt es sich hierbei um vermeintliche “Tests” aus dem Bereich der Persönlichkeitsdiagnostik. Aber auch “Intelligenztests” werden von Zeit zu Zeit angeboten (“Testen Sie, wie schlau sie sind!” / “Wie hoch ist Ihr IQ?”).

Fallen Sie hierauf nicht herein. Diese Tests wurden zwar manchmal tatsächlich von Psychologen entwickelt und sind somit teilweise nicht völlig ohne Substanz, aber sämtliche Gütekriterien, die einen psychologischen Tests ausmachen, sind meistens nicht gegeben. Die objektive Anwendung ist nicht gewährleistet, die Normierung fehlt, die Reliabilität und die Validität sind nicht untersucht. Wie auch? Ein solcher Fragebogen muss in wenigen Tagen oder sogar Stunden entstehen – bis ein echter psychologischer Test veröffentlicht wird, muss er viele aufwendige Entwicklungsstadien durchlaufen – Studien zur Reliabilität, Validität und Normierung.
Manchmal sind Tests in solchen Zeitschriften aber auch “echten” Tests entnommen – das muss aber dann vermerkt werden. Weil dabei aber Lizenzgebühren fällig werden, ist es oft billiger, sich “schnell mal selbst” etwas aus den Fingern zu saugen.

Projektive Testverfahren

Projektiven Tests (die in der Psychologie tatsächlich angewendet wurden und teilweise noch werden) ist gemeinsam, dass der Teilnehmer mit unstrukturiertem, d.h. mehrdeutigem Material konfrontiert wird. Im TAT (siehe Reihe zu “Motivation”) erzählt der Teilnehmer eine Geschichte zu einem mehrdeutigen Bild, und im relativ bekannten Rorschach-Test werden die Teilnehmer aufgefordert, zu sagen, was ein bestimmter Tintenklecks darstellt (Der Rorschach-Test wurde übrigens ursprünglich nur dazu entwickelt, die Wahrnehmung von Schizophreniepatienten zu untersuchen).

Das Problem, das bei all diesen Verfahren besteht, ist die Annahme, dass der Teilnehmer etwas auf das mehrdeutige Material projiziert, was ihm nicht bewusst ist. Gemäß Sigmund Freuds Theorie wären das vor allem verdrängte Triebe und Wünsche (meistens: Sex). Wenn jemand nun sagt, er erkenne in einem Tintenklecks ein männliches Geschlechtsorgan, wird das als eine Projektion der unterdrückten Libido angesehen. Wie welche Antwort zu deuten ist, hängt größtenteils von der Erfahrung des Testleiters ab und ist deshalb wenig objektiv.

Zudem konnte die Theorie Freuds nie wirklich bestätigt werden, weshalb er übrigens auch in der modernen wissenschaftlichen Psychologie keine bedeutende Rolle spielt (obwohl man ihm zugute halten muss, dass er durch seine kontroversen Theorien viele fruchtbare Diskussionen angeregt und viel Forschung angestoßen hat). Es ist unklar, was da projiziert wird: verdrängte Wünsche und Bedürfnisse oder vielleicht doch einfach Ideen, die einem durch den Kopf gehen, weil man sich gerade zuvor damit beschäftigt hat? Oder projiziert der Teilnehmer vielleicht eigene Eigenschaften auf das Material? Oder einfach nur seinen aktuellen Gefühlszustand, z.B. Angst?

Was ich damit sagen will, ist, dass das größte Problem dieser Verfahren die fehlende Validität ist, wobei der TAT (oder vielmehr dessen Weiterentwicklung – die Picture Story Exercises von McClelland) hierbei eine Ausnahme darstellt, da dort die Objektivität, die Realiabilität und die Validität im Hinblick auf implizite Motive zumindest teilweise gesichert sind. Da sie keine quantitativen Daten (=Zahlen) liefern, ist auch keine Normierung möglich (siehe auch Teil 1). Von Objektivität bei der Deutung und Interpretation kann keine Rede sein, und die Untersuchung der Reliabilität ist kaum möglich, da man sonst Teilnehmer bitten müsste,  zweimal hintereinander dieselbe Geschichte zu erzählen oder denselben Klecks zu deuten.

Anbei gibt es noch ein wunderschönes Beispiel für einen völlig unsinnigen Test, der sogar von Hogrefe (dem Verlag, der die meisten psychologischen Tests veröffentlicht) verkauft wird, obwohl sämtliche Gütekriterien nicht erfüllt sind: der Baum-Test. Hier soll angeblich die Art und Weise, wie der Teilnehmer einen Baum zeichnet (z.B. vereinfacht-schematisch oder realistisch mit Blättern und Ästen) Aufschluss geben darüber, wie erwachsen bzw. reif ein Mensch ist.

Die unten stehenden Bilder zeigen zwei entsprechende Baum-Bilder (links die Zeichnung, die als “infantil gelten würde, rechts die “erwachsene” Version) sowie einen (von mir selbst gezeichneten, keinen originalen) Rorschach-Klecks (Was meinen Sie, was der Klecks darstellt: einen Fisch, eine Wolke, ein Raumschiff,…?).

IMG_2869 IMG_2871

Der kinesiologische Muskeltest

Dieser Test gehört zu den diagnostischen Methoden der spirituell-alternativer Heilmethoden. Der Begriff “Kinesiologie” bezeichnet sowohl diese der Chiropraktik und Körpertherapie entstammenden Methoden als auch die seriöse Wissenschaft der motorischen Abläufe im Körper. Der oben genannte Test ist ein wunderbares Beispiel für einen unvaliden Test, der, obwohl er keinerlei gültige Aussagen über eine Person zulässt, trotzdem immer mehr Anhänger (darunter auch wissenschaftlich ausgebildete Personen wie Psychologen und Ärzte) findet.

Dieser Test wird für nahezu alle Fragestellungen angewendet, die den Menschen betreffen, was für sich alleine genommen schon sehr zweifelhaft ist. Vereinfacht gesagt, läuft es so ab: Der Patient hält seinen Arm so hoch, dass er parallel zum Boden verläuft, und der Kinesiologe (oft sind das Heilpraktiker mit einer Affinität zu esoterischen und spirituellen Methoden) stellt eine Frage. So gut wie immer handelt es sich um binäre Fragestellungen, d.h. solche, die nur mit ja oder nein beantwortet werden können (auch sehr sinnvoll im diagnostischen Prozess – Vorsicht Sarkasmus). Diese können seriös-biologischer Natur sein (“Ist das Immunsystem intakt?”, “Ist der Körper mit Schwermetallen belastet?”), oder aber spirituell-esoterischer Qualität (“Ist der Körper mit Erdstrahlen belastet?”, “Liegen innere Blockaden vor?”, “Ist die Aura durch den Geist eines Verstorbenen angegriffen?”, oder auch “Ist die Entscheidung des Patienten für X die falsche”). Dann versucht der Kinesiologe, den Arm des Patienten herunterzudrücken. Wenn er dies schafft, ist die Antwort auf all die Beispielfragen “ja”, wenn er es nicht schafft, “nein”.

Die Idee dahinter ist, dass sämtliche negative Ereignisse und Zustände im Körper (Erdstrahlen, Schwermetalle, innere Blockaden, falsche Entscheidungen…) den Muskeltonus mindern und somit dafür sorgen, dass im Moment nach der Fragestellung die Muskelanspannung verschwindet und der Arm gegen den Willen des Patienten heruntergedrückt werden kann.

Der Test wurde natürlich wissenschaftlich untersucht und erwies sich bezüglich all der Dinge, die man tatsächlich erfassen kann (Erdstrahlen & Co. fallen hier natürlich raus ) als völlig unvalide, was bedeutet, dass er keinerlei korrekte Aussagen über den Zustand einer Person zulässt. Zudem muss angemerkt werden, dass es für das Erschlaffen der Muskeln in einem solchen Moment zahlreiche andere Erklärungen gibt, z.B. dass durch die Fokussierung der Aufmerksamkeit auf ein unangenehmes Thema die Spannung im Arm nachlässt. Die meisten Kinesiologen lehnen diese Befunde sowie die naturwissenschaftliche Denkweise schlichtweg ab, ohne dabei triftige Gründe nennen zu können.

 “Lügendetektortests”: Kann man tatsächlich überprüfen, ob das Gegenüber flunkert?

Wenn ich vom klassischen “Lügendetektor” spreche, meine ich das Gerät, welches in Fachkreisen als Polygraph bekannt ist. Dieses Gerät zeichnet verschiedene physiologische Parameter auf, darunter z.B. die Herzrate (= Herzschläge pro Minute bzw. Puls) und die Hautleitfähigkeit (= wie stark schwitzt die Haut?). Diese Maße spiegeln den Erregungszustand des Körpers wider und sind ein Anzeichen für Angst. Die Logik hinter dem Test ist die, dass ein Mensch, wenn er verhört/befragt wird und dabei lügt, ein erhöhtes Erregungsniveau aufweist, weil er fürchtet, dass seine Lügen auffliegen.

Das Problem an diesem Test ist die nur sehr eingeschränkte Validität und die Ermangelung eines klaren Testwerts, ab dem man davon ausgehen soll, dass derjenige lügt. Der Test liefert immer wieder viele falsch-positive (Der Test sagt “Lüge”, der Verhörte lügt aber gar nicht) und falsch-negative Ergebnisse (Der Test sagt “Wahrheit”, der Verhörte lügt aber), weshalb er als Beweismittel vor Gericht (inzwischen!) nicht mehr zugelassen ist, nachdem es lange Zeit Gang und Gäbe war. Warum jemand in einer solchen Situation aufgeregt ist und Angst empfindet, kann etliche Ursache haben: z.B. die Angst davor, Angst zu zeigen, weil einem genau dies negativ ausgelegt wird, die Angst, allgemein ins Gefängnis zu kommen, die Angst, dass niemand einem glaubt, etc.

Da jedoch viele Menschen glauben, der Lügendetektortest liefere korrekte Aussagen, machte sich der US-amerikanische Psychologe Harold Sigall dies zunutze und entwickelte das so genannte Bogus-Pipeline-Paradigma. Hierbei handelt es sich um eine Methode zur wissenschaftlichen Erforschung von z.B. Einstellungen. Gerade wenn es um die Einstellung zu Randgruppen wie Migranten, Homosexuellen und Angehörige bestimmter Religionen geht, sagen viele Menschen nicht ehrlich, welche Einstellung sie dazu haben, weil sie wissen, dass ihre Meinung sozial nicht konform ist und daher verurteilt werden würde. Um an die wahren Einstellungen dieser Menschen heranzukommen, schloss Sigall sie an einen angeblichen Lügendetektor an und forderte sie auf, die Wahrheit zu sagen, da das Gerät eine Lüge ohnehin entdecken würde. Der Plan ging auf – und Sigall konnte zeigen, wie ehrlich Menschen sind, wenn sie glauben, dass sie nicht unentdeckt lügen können. Inzwischen ist das Bogus-Pipeline-Paradigma aber aufgrund der ethischen Einwände (Versuchspersonen werden aufgrund eines Tricks/Betrugs sensible Informationen entlockt) verboten.

Andere Verfahren zur Entdeckung von Lügen richten sich auf Verhaltensbeobachtungen und postulieren, dass Lügen z.B. mit nicht vorhandenem Blickkontakt, bestimmten minimalen und nicht bewusst steuerbaren Mimiken (also Gesichtsausdrücken) oder bestimmten Bewegungen (wie dem Kratzen an der Nase) einhergehe. Die Erforschung der Validität solcher Hinweise ist aber zum momentanen Augenblick noch sehr unausgereift. Im Vergleich zum Forschungszustand werden diese Methoden aber schon sehr häufig angewendet – vor allem im Kriminalbereich.

Noch neuer sind neurowissenschaftliche Verfahren zur Aufdeckung von Lügen. Mittels funktioneller Magnetresonanztomographie (umgangssprachlich auch als ” funktionaler Kernspin” bekannt, kurz fMRT) konnten bestimmte Gehirnareale identifiziert werden, die während des Lügens ihre Aktivität steigern. Hierin steckt natürlich ein großes Potenzial, und Justiz & Co. werden sicherlich bald Interesse anmelden. Es ist hierbei aber aus zwei Gründen Vorsicht geboten: Erstens, weil die fMRT-Technik fehleranfällig ist und falsch-positive wie falsch-negative Ergebnisse somit vorprogrammiert sind – denn zwischen den ursprünglichen Daten und den Gehirnbildern mit den hell aufleuchtenden Punkten, die gesteigerte Aktivität anzeigen, liegen unglaublich viele statistische Umrechnungs- und Mittelungsprozesse, bei denen eine Menge schief gehen kann. Zweitens, weil ein solches Vorgehen gegen ethische Richtlinien verstoßen kann: Darf es zulässig sein, einen Menschen zum Verhör einer vergleichbar unangenehmen Prozedur wie der MRT zu unterziehen? Insgesamt gibt es also nicht wirklich einen Grund zur Euphorie.

Graphologie – die Persönlichkeit aus der Handschrift lesen

Die Graphologie beschreibt die vermeintliche Wissenschaft, die sich damit beschäftigt, aus der Handschrift einer Person deren Persönlichkeit “herauszulesen”. Zurecht hat die Graphologie inzwischen den Status einer Pseudowissenschaft, weil sich dieses Verfahren als absolut nicht valide herausgestellt hat. Daher ist auch der häufig synonym verwendete Begriff “Schriftpsychologie” hierbei nicht korrekt.

Wie viele andere nachweislich unvalide Verfahren wird es aber tatsächlich in manch einem Unternehmen noch angewendet, wenn es um die Auswahl geeigneter Bewerber geht. Und das, obwohl die Wissenschaftler Schmidt und Hunter in einer Metaanalyse (die sehr viele Einzelstudien zusammenfasst) zeigen konnten, dass die mittlere Validität von Graphologie genau 0,02 (!) beträgt – was bedeutet, dass dieses Verfahren praktisch keinerlei Zusammenhang mit späterem Berufserfolg hat. Warum sich diese Methode so hartnäckig hält, liegt zum Großteil daran, dass ihre Verfechter unzählige Anekdoten von ehemaligen Bewerbern auf Lager haben, die die angebliche Validität belegen (anekdotische Evidenz). Diese ist aber, weil durch die eigene subjektive Wahrnehmung, das Ausblenden von Gegenbeispielen und die eigene Einstellung verzerrt, nicht einmal ansatzweise mit objektiven wissenschaftlichen Befunden zu vergleichen. Wenn also einmal ein Unternehmen einen handgeschriebenen Lebenslauf von Ihnen verlangt, würde ich Ihnen raten: Finger weg von dem Laden!

Warum diese Methode totaler Unsinn ist, wird schon deutlich, wenn man überlegt, wie leicht man seine eigene Schrift ändern und verstellen kann. Ich habe in meiner Schulzeit bestimmt zehn Mal die Handschrift einfach von einem auf den anderen Tag geändert, weil ich wiedermal was Neues ausprobieren wollte. Aber ok, ich war vielleicht auch extrem.

Physiognomie –  die Persönlichkeit aus dem Gesicht lesen

Die Physiognomie bezeichnet eigentlich die Lehre vom menschlichen Körperbau und ist Teil der Anatomie. An dieser Stelle meint es aber die ebenfalls pseudowissenschaftliche Methode, mit der bestimmte Menschen versuchen, aufgrund des Körperbaus Rückschlüsse über die Persönlichkeit einer Person zu ziehen. Insbesondere das Gesicht wird hierbei sehr häufig als Quelle herangezogen. Ausgeprägte Wangenknochen werden dann z.B. zum Indiz für Durchsetzungsvermögen, kleine Ohren gelten als Zeichen für Geiz und eine große Nase enthüllt, dass deren Besitzer sehr nachdenklich ist. Es existieren hierüber hunderte Bücher, meist geschrieben von selbst ernannten Experten, die einem sagen, welches Merkmal für welche Persönlichkeitseigenschaft steht. Genau so gibt es auch solche “Experten”, die man dann eines Tages bei Markus Lanz oder Johannes B. Kerner (ich weiß, der ist abgeschafft) sitzen sieht und die dort fröhlich ihre Pseudo-Weisheiten verbreiten. Natürlich wird dann im Gesicht des Moderators gelesen, wie es um dessen Persönlichkeit bestellt ist, und – oh Wunder – es stimmt! Natürlich nicht, weil man aus den äußeren Eigenschaften eines Gesichts die Persönlichkeit ablesen kann, sondern weil 1) grundsätzlich nur positive Eigenschaften genannt werden, die dem Betreffenden schmeicheln, der dann kaum widersprechen wird, 2) die “Gesichtsleserin” aus Vorinformationen und auf Basis des Verhaltens des Moderator schon viel über dessen Persönlichkeit weiß, was ihre Deutung maßgeblich beeinflusst, und 3) sie die gleiche Technik anwendet wie (gute) Kartenleger, Kristallkugelinterpreten und sonstige Menschen mit der vermeintlichen Gabe, in die Zukunft zu sehen: Sie nennt allgemeine Eigenschaften, die sowieso auf fast jeden zutreffen und denen somit kaum widersprochen wird, und sie tastet sich vorsichtig an ihre Deutungen heran, indem sie immer nur eine Behauptung aufstellt und dann auf die Rückmeldung des Betreffenden wartet. So vermeidet sie es, sich in eine völlig falsche Richtung zu bewegen. Das Ergebnis des ganzen ist natürlich das Staunen der gesamten Talkrunde, verblüffte Anerkennung – und ein typisches Stück anekdotische Evidenz (oben erklärt) für eine eigentlich komplett unvalide Methode.

Natürlich treffen manche Sachen tatsächlich zu, z.B. wenn über einen großen Mann mit breiten Schultern gesagt wird: “Er ist durchsetzungsfähig und selbstbewusst”. Es ist gut möglich, dass das stimmt. Aber die Kausalität ist eine andere: Er ist nicht groß und hat breite Schultern, weil er selbstbewusst und durchsetzungsstark ist (Das wäre die Deutung von Physiognomie-Experten). Er hat diese Eigenschaften sehr wahrscheinlich, weil sein Körperbau entsprechend ist! Genauso, wie es gut sein kann, dass jemand mit einem eher weniger hübschen Gesicht garstig im Umgang mit anderen ist: Die Eigenschaft ist vielmehr Folge der Beschaffenheit des  Gesichts und den damit hervorgerufen Reaktionen anderer als die Ursache dessen!

Während diese Art des Persönlichkeits-Lesens völliger Quatsch ist, weil unsere körperlichen Merkmale durch ganz andere Gene und Umwelteinflüsse bestimmt werden als unsere Persönlichkeit, sind die Schlussfolgerungen aufgrund von Mimik und Gestik kein Unsinn. Zwar lassen unsere Gesichtsausdrücke und unsere Gesten vielmehr Rückschlüsse auf momentane Emotionen zu als auf unsere Persönlichkeit, allerdings haben viele Studien gezeigt, dass Menschen das Gesicht als Quelle für sehr viele Informationen über eine Person benutzen (jetzt mal unabhängig davon, ob diese Informationen zutreffen). So ist z.B. gut untersucht, dass Menschen in Bruchteilen einer Sekunde (!) einen ersten Eindruck eines unbekannten Gesichts formen und entscheiden, ob sie dieses mögen oder nicht. Das heißt, es ist in der Tat so, dass wir aufgrund der unbewussten Verrechnung von zahlreichen Informationen sehr schnell ein Urteil über eine Person bilden. Dies hat aber nichts mit den Behauptungen von Physiognomie-Verfechtern zu tun, die oft viele Gesichtsmerkmale heranziehen, die Menschen bei der Fällung dieses Urteils gar nicht berücksichtigen, und die sehr spezifische Eigenschaften benennen, die unser Gehirn in so kurzer Zeit gar nicht bedenken kann. Insgesamt gilt also auch hier: Vorsicht vor Unsinn!

Damit wäre ein weiteres großes Anliegen von mir abgehakt – darüber aufzuklären, was echte psychologische Tests sind und was nicht. Und wenn ich auch nur ein bisschen dazu beigetragen habe, dass Sie als Leser nun ein bisschen besser bewerten können, was seriös und was Unsinn ist, habe ich mein Ziel schon voll erreicht.

© Christian Rupp 2013

Psychologische Tests – Teil 2: Diesen Tests können Sie trauen

Nachdem ich in Teil 1 beschrieben habe, welche Merkmale einen “echten” psychologischen Test ausmachen, stelle ich in diesem Teil verschiedene Gruppen “gängiger” psychologischer Testverfahren inklusive einiger prototypischer Vertreter vor.

Intelligenztests

Intelligenztests sind das Flaggschiff der Psychologie. Kein Thema wurde in der modernen Psychologie der letzten 100 Jahre intensiver beforscht als Intelligenz und ihre Messung, sodass heute eine Vielzahl sehr guter und auch präzise messender Intelligenztests vorliegen, die entweder Aussagen über die generelle Intelligenz liefern oder aber über spezifische Intelligenzfacetten (z.B. logisches Schlussfolgern und mentales Rotieren). Da ich das Thema “Intelligenz” noch ausführlich behandeln werde, wobei ich auch einige Intelligenztests vorstellen werde, belasse ich es an dieser Stelle dabei.

Persönlichkeitstests

Seriöse Persönlichkeitstests basieren auf Mehr-Faktoren-Modellen der Persönlichkeit, die durch das statistische Verfahren der Faktorenanalyse (siehe Exkurs unten) entstanden sind. Dasjenige Modell, über das in der Wissenschaft am meisten Einigkeit besteht, ist das Modell der “Big Five”. Es basiert auf etlichen faktorenanalytischen Studien und besteht aus fünf Kerneigenschaften, anhand derer Menschen sich hauptsächlich unterscheiden:

Extraversion

Ja, es heißt nicht Extroversion – das Gegenteil ist aber die Introversion; Beispielaussagen für Extraversion wäre z.B. “Ich bin gerne unter Menschen” und “Ich bringe Leben in eine Gesprächsrunde”.

Neurotizismus

Dies bedeutet emotionale Stabilität; ein sehr neurotischer Mensch ist eher emotional instabil.

Verträglichkeit

Kommt jemand gut mit anderen klar oder zieht er eher Konflikte an?

Offenheit für Erfahrungen

Ist jemand offen für Neues oder bleibt er lieber bei Altbekanntem?

Gewissenhaftigkeit

Habe ich im unten stehenden Exkurs erklärt.

Alle anderen Eigenschaften lassen sich gemäß diesem Modell den “Big Five” unterordnen. Gute Persönlichkeitstests (Achtung: Die Namen von psychologischen Persönlichkeitstests sind fast immer Abkürzungen!) sind z.B. der “NEO-PI-R”, der “NEO-FFI”, der “TIPI”, der “BFI” und der “FPI-R”. Der “BIP” erfasst, weil für die berufliche Bewerberauswahl entwickelt, berufsrelevante Persönlichkeitseigenschaften, und der “PSSI” erfasst das Kontinuum zwischen Persönlichkeitseigenschaft und Persönlichkeitsstörung.

Eine Sonderform der Persönlichkeitstests stellen die so genannten “Integrity”-Tests dar (z.B. der “IBES”). Diese erfassen, wie integer (= ehrlich, aufrichtig) ein Mensch ist – und tatsächlich können sie sehr gut unlauteres Verhalten am Arbeitsplatz (z.B. Diebstahl) vorhersagen, was verblüffend ist.

Persönlichkeitstests liegen meist in Fragebogenform vor, d.h. die Teilnehmer kreuzen an, wie sehr sie entsprechenden Aussagen (siehe oben) zustimmen. Es gibt aber auch Fremdbeurteilungsverfahren, d.h. Persönlichkeitstests, bei denen das Verhalten von Psychologen beobachtet und Rückschlüsse auf die Persönlichkeit desjenigen gezogen werden (was größte Sorgfalt und Vorsicht erfordert). Ebenso gibt es so genannte objektive Persönlichkeitstests wie den “OLMT”, die die Persönlichkeit indirekt erfassen, d.h. ohne dass der Teilnehmer weiß, dass es um seine Persönlichkeit geht. Beim OLMT wird z.B. die Leistungsmotivation des Probanden erfasst, in dem man ihn eine recht simple, aber auf Dauer anstrengende Aufgabe an einem Computerbildschirm lösen lässt, die inhaltlich nichts dem zu tun hat, was erfasst wird: Je länger der Proband “durchhält”, desto höher laut diesem Test die Leistungsmotivation. Auch hierbei wird also aus dem Verhalten auf die Persönlichkeit geschlossen. Fremdbeurteilungsverfahren und objektive Persönlichkeitstests bieten den Vorteil, dass sie nicht willentlich durch die Teilnehmer verfälscht werden können, was bei den Fragebögen natürlich möglich ist. Ihre Validität ist meist vorhanden, stellt jedoch teilweise ein Problem dar.

Auch unter diese Rubrik einzuordnen sind übrigens Tests zur Erfassung der Motive eines Menschen (wie der TAT, in der Reihe zu Motivation vorgestellt) sowie dessen Einstellungen gegenüber bestimmten Themen, Phänomenen und Menschengruppen (z.B. Migranten, Homosexualität, Esoterik, Übernatürliches…). Bei Letzterem wäre ich allerdings vorsichtig, den Begriff “Test” zu verwenden und würde eher für die Bezeichnung “spezifischer Fragebogen” plädieren, weil es sich ja immer um ein bestimmtes Thema dreht. Es gibt aber auch die Möglichkeit, Einstellungen, ebenso wie Motive, indirekt zu erfassen, d.h. ohne dass der Teilnehmer das Ergebnis verfälschen kann und ohne dass er weiß, dass es um seine Einstellungen geht. Ein bekanntes und recht valides Verfahren hierfür ist z.B. der IAT, der implizite Assoziationstest.

Die Validität von Persönlichkeitstests wird z.B. durch den Zusammenhang mit anderen Persönlichkeitstests oder mit bestimmten Verhaltensweisen, die zu der jeweiligen Eigenschaft passen, gesichert.

Exkurs “Faktorenanalyse”

Grob gesagt passiert bei der Faktorenanalyse Folgendes: Nachdem Probanden einen Fragebogen mit sehr vielen Aussagen (z.B. “Ich mag es, unter Leuten zu sein” / “Ich erledige alle meine Arbeiten gründlich”) beantwortet haben, indem sie mit Hilfe einer Skala (die z.B. von 1-7 reicht) angaben, wie sehr diese Aussage auf sie zutrifft, werden statistische Analysen angewendet, die ausspüren, welche Aussagen des Fragebogens stark zusammenhängen (korrelieren). Zwei Aussagen sind dann korreliert, wenn Personen dazu tendieren, sie gleich oder ähnlich zu beantworten. Meistens hängen mehr als zwei Fragen zusammen, und diese werden dann zu einem “Faktor” zusammengefasst. So gehören z.B. die Aussagen “Ich erledige alle meine Arbeiten gründlich” und “Ich hasse es, wenn Unordnung entsteht” zum Faktor “Gewissenhaftigkeit” – einem der fünf großen Persönlichkeitsfaktoren, in dem sich Personen unterscheiden. Die Faktorenanalyse ist aber auch die Basis der Intelligenzforschung: Hier bearbeiten Probanden verschiedenste Aufgaben anstelle von Aussagen, und es werden diejenigen Aufgaben zusammengefasst, die häufig zusammen gelöst werden. Da Menschen z.B. sehr häufig sowohl in Wortschatz- als auch in Analogieaufgaben gute Leistungen bringen, werden beide Aufgabenarten, vereinfacht gesagt, oft zu dem Faktor “sprachliche Intelligenz” zusammengefasst. Dass Leute, die gut in Wortschatzaufgaben sind, auch gute Leistungen in Rechenaufgaben bringen, ist derweil weniger häufig der Fall – sodass man hier von zwei verschiedenen Faktoren (z.B. “sprachliche Intelligenz” vs. “mathematische Intelligenz”) ausgeht. Mehr dazu in den Artikeln zum Thema “Intelligenz”.

Tests zur Erfassung von Aufmerksamkeit, Konzentration & Gedächtnis

Hierunter fallen sämtliche Tests, die kognitive Funktionen wie Wahrnehmung, Aufmerksamkeit, Gedächtnis und Konzentration erfassen. Der “VLMT” z.B. erfasst verbale Lern- und Merkfähigkeiten und ist in der Alzheimer – und Demenzdiagnostik wichtig. Die “TAP” ist eine Testbatterie, mit der die selektive Aufmerksamkeit, das Arbeitsgedächtnis und die Konzentrationsleistung überprüft werden. Auch der “d2” und der “FAIR” erfassen die Konzentrationsleistung, in dem sie den Teilnehmer vor die Aufgabe stellen, eine vergleichsweise einfache Aufgabe, die aber viel Konzentration erfordert, unter Zeitdruck zu bearbeiten, ohne Fehler zu machen. Ebenso gibt es Tests, die die Belastbarkeit einer Person unter Stress und die motorischen Fähigkeiten erfassen. In diese Gruppe von Tests fallen all die Tests, die Teil der Aufnahmeprüfung in Berufen sind, in denen mangelnde Konzentration etc. fatal sein können – bei Piloten, Fluglotsen, Zugführer, LKW-Fahrer, etc. Auch bei der MPU, der medizinisch-psychologischen Untersuchung, die z.B. auf Verkehrsteilnehmer wartet, die zu viele Punkte in Flensburg haben, kommen viele von diesen Tests zum Einsatz.

Fragebögen zu klinischen Symptomen

Auch hier sollte man mit dem Begriff “Test” vorsichtig sein und die Bezeichnung “Fragebogen” wählen. Klinische Fragebögen erfassen Symptome psychischer Störungen und liegen entweder als Selbstbeurteilungsvariante (der Patient kreuzt selbst an) oder als Fremdbeurteilungsvariante (ein_e Psychologe_in beurteilt das Verhalten und die Schilderungen des Teilnehmers und kreuzt an) vor. Es gibt Fragebögen, die Symptome mehrerer Störungsbilder gleichzeitig abfragen (z.B. die “SCL-90-R”) und Fragebögen, die Symptome nur jeweils einer Störung erfassen – hier ein paar Beispiele von qualitativ hochwertigen diagnostischen Fragebögen:

Depression

  • Selbstbeurteilung: “BDI”, “ADS” (hat nichts mit AD(H)S zu tun, sondern steht für “allgemeine Depressionsskala”)
  • Fremdbeurteilung: “MADRS”, “HAMD”

Angststörungen/Ängstlichkeit

  • Selbstbeurteilung: “STAI” und “ACQ”
  • Fremdbeurteilung: “HAMA”

Zwangsstörungen

  • Selbstbeurteilung: “HZI”

AD(H)S bei Erwachsenen

  • Selbstbeurteilung: “WURS-K” (für Symptome in der Kindheit), “ADHS-SB” (für Symptome im Erwachsenenalter)
  • Für AD(H)S bei Kindern stehen zahlreiche Fremdbeurteilungsverfahren vor, die auch von Eltern und Lehrern ausgefüllt werden können.

und viele mehr…

Der wichtige Grundsatz bei den klinischen Fragebögen lautet: Sie sind als zusätzliche Quelle von diagnostischen Informationen sinnvoll, aber eine Störungsdiagnose sollte niemals alleine auf dieser Basis vergeben werden! Deshalb sollte hier auch nicht von Tests die Rede sein – denn die liefern sehr viel eindeutigere und vor allem unumstößliche Ergebnisse.

Im dritten Teil stelle ich dann abschließend eine Reihe von Tests vor, die die in Teil 1 dargestellten Gütekriterien von psychologischen Tests kaum oder gar nicht erfüllen. Sie glauben gar nicht, auf wie viele so genannte “Tests” dies zutrifft…

© Christian Rupp 2013

Psychologische Tests – Teil 1: Woran erkennt man die echten unter ihnen?

Da auch hierüber in der Gesellschaft sehr weit verbreitete falsche Annahmen zu finden sind, fand ich es sehr wichtig, einmal darzustellen, was eigentlich einen “richtigen” psychologischen Test ausmacht . Deshalb geht es in diesem und in den zwei folgenden Artikeln darum, was psychologische Tests überhaupt sind und was Beispiele für gute und weniger gute Vertreter sind.

Ich möchte fast wetten, dass Sie, liebe_r Leser_in, schon einmal in Ihrem Leben an einem psychologischen Test oder einem, der behauptete, einer zu sein, teilgenommen haben. Tatsächlich trennt sich hier aber die Spreu vom Weizen – denn es gibt seriöse, “echte” psychologische Tests, die gültige Aussagen über eine Person zulassen, und “falsche”, die genau dies nicht erlauben. Ziel aller psychologischer Tests ist es, ein bestimmtes, “in der Person liegendes” und daher von außen nicht direkt beobachtbares Merkmal (Persönlichkeit, Intelligenz, Gedanken…) mehr oder weniger indirekt zu messen. Doch was unterscheidet nun die “echten” von den “falschen” Tests?

Merkmale von echten psychologischen Tests

Quantitative Daten

Ein guter psychologischer Test liefert, wenn auch auf Umwegen, immer Zahlen als Daten. Das bedeutet, selbst wenn die Antworten des Teilnehmers nicht direkt als Zahlen vorliegen (wie es z.B. in einem Fragebogen mit einer 7-stufigen Skala der Fall ist), muss der Test eine Möglichkeit bieten, wie der Testleiter den Antworten oder dem Verhalten eines Probanden Zahlen zuweisen (= das Verhalten quantifizieren) kann. Dieses System muss standardisiert sein (siehe “Objektivität”), und es ist die Grundlage für das Kriterium der Normierung.

Objektivität

Dieses Merkmal bedeutet, dass der Test, unabhängig von der durchführenden Person, immer gleich angewendet und ausgewertet und das Ergebnis immer gleich interpretiert wird. Durchführung, Auswertung und Interpretation sind fest vorgeschrieben. Das Ergebnis unterliegt somit keinen subjektiven Eindrücken, Deutungen oder Manipulationen – der gesamte Testablauf ist standardisiert.

Reliabilität

Dieser Begriff bedeutet Zuverlässigkeit. Im Klartext ist dieses Kriterium erfüllt, wenn der Test bei wiederholter Durchführung dasselbe oder annähernd dasselbe Ergebnis liefert. Wenn jedoch das gemessene Merkmal von Natur aus schwankt (z.B. Einstellungen), kann es passieren, dass dieses Kriterium keinen Sinn macht. Dann kann man höchstens schauen, ob das Merkmal innerhalb sehr kurzer Zeiträume stabil bleibt. Die Reliabiliät wird durch einen Wert zwischen 0 und 1 beschrieben, wobei 1 für maximale Zuverlässigkeit steht (der Testwert stimmt bei beiden Messungen exakt überein). In der Realität sind Werte zwischen 0,7 und 0,9 normal und ausreichend für die Praxis. Von diesem Wert hängt die Größe des so genannten “Konfidenzintervalls” ab. Dieses gibt, da ein psychologischer Test nie so präzise misst wie beispielsweise eine Waage, den Bereich an, in dem der tatsächliche Testwert mit 95%iger Wahrscheinlichkeit liegt. So könnte ein Intelligenztest z.B. einen IQ-Wert von 104 liefern, und das Konfidenzintervall könnte bei einer Reliabilität von 0,9 von 100 bis 108 reichen. Hierzwischen liegt dann sehr wahrscheinlich der “wahre” Wert der Person.

Streng genommen ist mit Reliabilität übrigens eigentlich nicht gemeint, dass zweimal hintereinander derselbe Wert rauskommt, denn auch wenn alle untersuchten Personen bei der zweiten Messung z.B. 5 Punkte dazugewonnen haben, ergibt das eine Reliabilität von 1. Es geht genau genommen nur um die Einhaltung der Rangfolge der Personen: Wird diese bei beiden Messungen eingehalten, ist der Test reliabel. Aber wie gesagt: Für das Alltagsverständnis reicht die obige Definition.

Normierung

Normierung bedeutet, dass der erreichte Testwert einer Person nie losgelöst betrachtet wird, sondern immer mit einer repräsentativen Normierungsstichprobe verglichen wird. Diese besteht aus Personen, die der getesteten Person bezüglich Alter und Geschlecht ähnlich sind. Dazu berechnet man den Abstand zwischen dem Testwert der Person und dem Mittelwert der Normierungsstichprobe. Ein Beispiel: Der neunjährige Theo erreicht in einem Intelligenztest eine Punktzahl von 144, insgesamt sind in dem Test 220 Punkt zu erreichen. Achtung – das ist der Rohwert, nicht der IQ-Wert. Der ergibt sich erst durch weitere Berechnungen, bei der Theos Punktzahl, die durchschnittliche Punktzahl in der Normierungsstichprobe der neunjährigen Jungen und die durchschnittliche Abweichung von dieser Durchschnittspunktzahl (die Standardabweichung) mit einbezogen werden. So erhält man IQ-Werte, die so standardisiert sind, dass der Mittelwert 100 beträgt und die Standardabweichung 15. Weil bei diesen Umrechnungsprozessen dividiert wird, spricht man vom Intelligenzquotienten. Da IQ-Werte daher keine festen, sondern relative Werte darstellen, ist unbedingt zu beachten, mit welcher Normierungsstichprobe jemand verglichen wird: So kann ein Gymnasiast beim Vergleich mit einer Stichprobe aus der breiten Normalbevölkerung einen IQ von 130 aufweisen (wäre demnach also “hochbegabt”), im Vergleich mit anderen Gymnasiasten wäre er hingegen nicht so weit über dem Mittel und hätte einen IQ von 115.

Validität

Dieses vierte Kriterium bedeutet “Gültigkeit”. Ein Test besitzt Validität bzw. ist valide, wenn er tatsächlich misst, was er zu messen vorgibt. Wenn es dabei um ja/nein-Entscheidungen geht (z.B. bei der Frage, ob jemand lügt oder nicht), kann man die Validität damit bestimmen, wie oft der Test eine korrekte Aussage liefert (d.h. jemand lügt, und der Test sagt auch, dass die Person lügt – oder die Person lügt nicht, und der Test sagt auch, dass die Person nicht lügt), und wie oft er daneben liegt (Die Person lügt nicht, aber der Test besagt, dass sie lügt – und andersrum).Wenn der Test jedoch ein Merkmal messen soll, welches nicht nur zwei Kategorien hat (z.B. Intelligenz), dann betrachtet man, wie der Testwert mit anderen Merkmalen zusammenhängt. Hierzu betrachtet man die Korrelation (abgekürzt durch den Buchstaben “r”), das heißt den linearen Zusammenhang von Testwert und einem anderen Wert. Auch die Korrelation variiert zwischen 0 und 1, während 1 für einen perfekten Zusammenhang zwischen zwei Merkmalen steht.

Das unten stehende Foto zeigt als Beispiel die (hypothetische, nicht realitätsgetreue) Korrelation zwischen der Abiturdurchschnittsnote und dem Ergebnis in einem Intelligenztest. Diese beträgt hier 0,5, was in Bezug auf Validität ein sehr hoher Wert ist. Wenn man die Validität eines Tests bestimmt, ist es wichtig, dass der Testwert einen eindeutigen Zusammenhang mit verwandten Merkmalen aufweist (bei Intelligenz wären dies z.B. Schulleistung oder die Leistung in anderen Intelligenztests). Dieser Zusammenhang muss und kann aber gar nicht perfekt ( = 1) sein, weil sämtliche Merkmale (wie Schulleistung) noch durch viele andere Faktoren bestimmt werden. Die Validität eines Tests bestimmt man dabei nie nur durch die Korrelation mit einem anderen Merkmal, sondern immer mit mehreren. Validitäten von 0,3 sind dabei schon als zufriedenstellend, welche über 0,5 bereits als sehr hoch einzustufen.

Hier habe ich einmal aufgemalt, was man sich unter einer Korrelation vorzustellen hat. Die grünen Kreuze stehen alle für jeweils eine Person, von der sowohl das Ergebnis aus einem Intelligenztest (in IQ-Werten, auf der x-Achse) und die Abiturdurchschnittsnote (auf der y-Achse) vorliegen. Diese “Wolke” von Datenpunkten (bzw. –kreuzen) zeigt einen klaren Trend von links unten nach rechts oben, der durch die rote Linie verdeutlicht wird. Das heißt, im Mittel gehen höhere IQ-Werte mit besseren Noten einher, aber natürlich gibt es auch Ausnahmen. Bei einer Korrelation von 1 lägen alle Datenpunkte auf der roten Linie – das würde bedeuten, dass Abinote und Intelligenz in einem perfekten Zusammenhang zueinander stehen und dass das eine linear (d.h. in Form einer Geraden wie der roten Linie) mit dem anderen ansteigt. Bei einem Zusammenhang von r = 0 wäre der gesamte Raum innerhalb des Graphen hingegen gleichmäßig mit Kreuzchen ausgefüllt, es wäre kein Trend in irgendeine Richtung und somit kein Zusammenhang der beiden Merkmale zu erkennen.
Auch die Reliabilität ist übrigens ein Korrelationswert. Hier würde man auf der x-Achse die Testwerte aus der ersten Durchführung abtragen und auf der y-Achse die der zweiten Durchführung. Hierbei würden die grünen Kreuzchen viel näher an der roten Linie liegen als hier im Foto, weil der Zusammenhang viel größer ist (meistens mindestens r = 0,7).

Fiktive Korrelation zwischen Intelligenzquotient und Abiturnote
Fiktive Korrelation zwischen Intelligenzquotient und Abiturnote

Die Validität ist dasjenige Kriterium, das hauptsächlich darüber entscheidet, ob es sich um einen “echten” psychologischen Test handelt oder nicht. Im zweiten und dritten Teil werde ich ein paar Beispiele für valide und nicht valide Tests geben.

© Christian Rupp 2013

Motivation – Teil 4: Wie bewusst ist unser Handeln? Von expliziten und impliziten Motiven.

Bisher haben wir gesehen, wie Motivation grundsätzlich entsteht, wie sie mit Emotionen zusammenhängt und was benötigt wird, wenn es an Motivation fehlt. Nun soll es um das wohl spannendste Thema gehen, nämlich die Frage, inwiefern uns unsere Motive bewusst sind oder nicht. Wie bewusst treffen wir unsere Entscheidungen? Wie bewusst sind uns unsere Beweggründe, in einer bestimmten Situation so und nicht anders zu handeln? Warum lesen Sie gerade diesen Text?

In der Tat gibt es fast jedes Motiv in einer bewussten und einer unbewussten Form, und man spricht dementsprechend von expliziten (d.h. bewussten) und impliziten (d.h. unbewussten) Motiven. Aber was heißt “bewusst” und was heißt “unbewusst”?

Was ist die Hauptstadt von Frankreich?

Nun, in Ihrem Kopf wird sich die Antwort “Paris” breit machen. Dieser Teil ist daher bewusst, er ist Teil Ihres Bewusstseins. Die Such- und Abrufprozesse, die hierzu erst in Ihrem Gehirn stattfinden mussten, sind hingegen nicht Teil Ihres Bewusstseins, sie sind unbewusst. Genau so sind auch implizite Motive unbewusst, d.h. wenn man Menschen fragt: “Warum machst du das?”, können Sie einem über ihre impliziten Motive im Normalfall keine Auskunft geben. Dass dies so ist, sollte man nicht meinen, denn Menschen sind oftmals in der Lage, einem durchaus eloquent die Beweggründe für ihr jeweiliges Handeln darzulegen. Zugriff haben sie dabei aber lediglich auf ihre expliziten Motive, was erklärt, dass wir oft aus anderen Gründen handeln als wir meinen.

Warum ist das so? Eine Frage der Kapazität.

Es ist dabei in der Tat zwingend nötig, dass viele motivationale Vorgänge unbewusst, d.h. implizit gesteuert werden – denn unser Bewusstsein hat eine sehr begrenzte Kapazität, die ca. das Lesen des Satzes “Paris ist die Hauptstadt von Frankreich” umfasst. Unglaublich viele Entscheidungen werden von uns unbewusst getroffen, geleitet durch implizite Motive. Denn der unbewusste Teil der in unserem Gehirn ablaufenden Prozesse hat eine vergleichsweise gigantische Kapazität, die es ihm ermöglicht, in der gleichen Zeit viel mehr Informationen zu verrechnen und zu einem Entschluss zu gelangen als der bewusste Teil. Unser Gehirn wäre sonst schlichtweg überfordert.

Eine knackige Gegenüberstellung: explizite vs. implizite Motive

Explizite Motive sind Teil des Selbstbilds, das praktisch die eigene Definition einer Person darüber beinhaltet, wer sie ist. Das Selbstbild oder Selbstkonzept gibt u.a. Antworten auf die Fragen: “Wer bin ich?”, “Was ist mir wichtig?” und “Was will ich erreichen?”. Es enthält also eigene Bedürfnisse, Wünsche und Ziele, die man auch als explizite Motive bezeichnen kann. Implizite Motive haben mit diesen expliziten Motiven kaum etwas zu tun – es handelt sich tatsächlich um zwei unabhängige Motionssysteme. Implizite Motive regulieren Verhalten, so wie in den vorherigen Teilen beschrieben, durch die Erwartung (meist kurzfristiger) positiver emotionaler Konsequenzen. Explizite Motive tun dies hingegen durch das Streben nach einem konsistenten Selbstbild und einem positiven Selbstwertgefühl. Das heißt, wenn es z.B. Teil meines Selbstbildes ist, gute Leistungen zu erbringen, werde ich mich deshalb besonders anstrengen, um mein Selbstbild zu bestätigen. Das wiederum tue ich, weil von solch einem konsistenten Selbstbild mein Selbstwert abhängt.
Auch das Verhältnis zum Verhalten ist bei den zwei Sorten von Motiven grundsätzlich unterschiedlich. Implizite Motive bedingen Verhalten direkt, explizite Motive ermöglichen es uns eher, zwischen verschiedenen Handlungsalternativen zu wählen und Ziele zu setzen. Interessant ist außerdem, dass implizite Motive so genannte “Tätigkeitsanreize” haben, während explizite Motive eher “Ergebnisanreize” haben. Das bedeutet, dass implizite Motive durch sehr kurzfristige emotionale Konsequenzen der Tätigkeit bedingt sind – die Tätigkeit selbst (z.B. Prüfungsliteratur lesen) “macht Spaß”, während das “Antreibende” bei den expliziten Motiven die erwarteten Emotionen sind, die durch das Ergebnis der Tätigkeit eintreten (z.B. eine gute Note in der Klausur). Außerdem unterscheiden sich die beiden Motivarten noch hinsichtlich ihrer Entwicklung bzw. Entstehung: Implizite Motiv entwickeln sich bereits in der frühen Kindheit, bevor das Kind sich sprachlich ausdrücken kann, durch emotionale Lernerfahrungen (man lernt, was zu positiven Gefühlszuständen führt und was nicht). Explizite Motive hingegen entstehen später, parallel zum Selbstbild des Menschen, das sich generell erst entwickelt, wenn der Mensch über sprachlichen Ausdruck verfügt.

Ein Beispiel: implizites und explizites Leistungsmotiv

Wie oben bereits angedeutet, unterscheiden sich das implizite und das explizite Leistungsmotiv grundsätzlich. Von einem impliziten Leistungsmotiv spricht man, wenn es einer Person Freude (kurzfristige, positive emotionale Konsequenzen) bereitet, ihre eigenen Fähigkeiten zu steigern und auszubauen, den Lernstoff zu verstehen, sich selbst Herausforderungen zu setzen, etc. Das explizite Leistungsmotiv hingegen strebt vielmehr danach, eine Bestätigung für ein Selbstkonzept der Sorte “Ich will zur Spitze gehören” zu bestätigen. Wie im letzten Absatz beschrieben, geht es hier um die Ergebnisse des Handelns, nicht um das Handeln selbst. Die erwarteten Gefühlskonsequenzen des Ergebnisses (z.B. eine bestimmte Prüfungsnote) sind hier die treibende Kraft, und die vorwiegend angestrebte Emotion ist Stolz, d.h. eine Erhöhung des Selbstwerts. Das explizite Leistungsmotiv führt zu einer bewussten Zielsetzung (z.B. “Ich will mein Abitur mit einer “1” vor dem Komma machen), das implizite Leistungsmotiv entzieht sich gemäß seiner Definition jeder bewussten Verarbeitung. In einem späteren Teil werden wir das implizite und explizite Leistungsmotiv noch einmal wieder treffen und uns den Fall anschauen, dass die beiden sich nämlich völlig widersprechen.

Wie greifen implizite und explizite Motive nun ineinander?

Explizite Motive bestimmen maßgeblich, in welchen Bereichen implizite Motive angeregt werden. Wieder Beispiel Leistungsmotiv: Das implizite Leistungsmotiv richtet sich unspezifisch auf alle Tätigkeiten, die man, plakativ gesagt, gut oder schlecht machen kann. Je nach Selbstkonzept und damit verbundenem expliziten Motiv (z.B. “guter Sportler” oder aber “guter Schüler”) kann sich das implizite Motiv dann eher im einen oder im anderen Bereich entfalten. Das bedeutet: Explizite Motive bleiben wirkungslos, wenn nicht gleichzeitig ein passendes implizites Motiv besteht, das die Tätigkeit emotional “auflädt”. Die Forschung zeigt: Ca. die Hälfte aller expliziten Motive haben keinen impliziten “Partner” und damit eine schlechte Chance, tatsächlich umgesetzt zu werden. Da sich dazu aber noch vielmehr sagen lässt, verweise ich auch hier wieder auf die noch folgenden Teile, wo sich diesbezüglich noch sehr spannende Erkenntnisse ergeben werden.

Und zum Schluss: Wie kann man Motive überhaupt erfassen?

Die Forschung zur Messung von Motiven war es tatsächlich, die überhaupt erst zur Unterteilung zwischen impliziten und expliziten Motiven führte. Kurz zusammengefasst ist es so, dass man explizite Motive mit geeigneten Fragebögen oder Interviews erfragen kann, da diese bewusst zugänglich sind und sprachlich wiedergegeben werden können. Implizite Motive müssen hingegen mit indirekten Verfahren erfasst werden. Bewährt hat sich hierbei vor allem der TAT, der Thematische Apperzeptionstest. Hierbei handelt es sich um eines der wenigen projektiven psychologischen Testerfahren, das zufrieden stellende psychometrische Testeigenschaften aufweist und somit valide (d.h. tatsächlich) gültige Aussagen über eine Person erlaubt (Streng genommen gilt dies jedoch sehr viel mehr für die moderne Weiterentwicklung des TAT, die Picture Story Exercises, die dem gleichen Prinzip folgen, aber bessere psychometrische Gütekriterien aufweisen). Der Test ist so aufgebaut, dass Personen mehrdeutige Bilder präsentiert werden (z.B. eines, das einen Mann und eine Frau auf einer Parkbank zeigt) und die Personen dann eine Geschichte zu diesem Bild erzählen sollen. Die recht gut belegte Annahme dabei ist die, dass sich in den Geschichten die impliziten Motive der Erzählenden niedergeschlagen – oder mit anderen Worten: Die Erzählenden projizieren (deshalb “projektives” Testverfahren) ihre unbewussten Motive auf die neutrale Situation. So würde in unserem Beispiel z.B. ein stark anschlussmotivierter Mensch eine Geschichte erzählen, in der das Knöpfen sozialer Beziehungen eine Rolle spielt, ein Mensch mit starkem Machtmotiv würde vielleicht eine Konkurrenzsituation in seine Geschichte einbauen. Die Antworten der Personen in diesem Test werden aufgezeichnet und hinterher entsprechenden Kategorien zugeordnet, was die Auswertung sehr aufwendig macht. Im letzten Teil dieser Themenreihe werde ich aber auch noch ein paar einfachere Tricks verraten, mit denen man seinen impliziten Motiven auf den Grund gehen kann.

In Teil 5 geht es um einen wichtigen Verdienst unserer impliziten Motive – die neurowissenschaftliche Ergründung unseres so genannten “Bauchgefühls”.

© Christian Rupp 2013