Intelligenz – Teil 6: „The Bell Curve“ & das dunkelste Kapitel der Psychologie

1994 veröffentlichten die beiden US-Amerikaner Richard Herrnstein und Charles Murray ein Buch namens „The Bell Curve: Intelligence and Class Structure in American Life“, wobei es sich bei der „bell curve“ natürlich um eine Anspielung an die Gauß’sche Glockenkurve handelt, der die IQ-Werte in der Population zumindest annähernd folgen (siehe auch hier). Dieses Buch hat für eine breite Kontroverse und heftige Kritik gesorgt, die man heutzutage wahrscheinlich als shit storm bezeichnen würde. Und das nicht ohne Grund, ziehen die Autoren doch auf Basis wackliger Prämissen Schlussfolgerungen, die schon im Nationalsozialismus en vogue waren.

Ethnische Unterschiede bezüglich der allgemeinen Intelligenz

Der wohl am kritischsten zu betrachtende Aspekt in der Darstellung von Herrnstein und Murray ist die Art und Weise, wie sie auf ethnische Unterschiede hinsichtlich des allgemeinen Intelligenzquotienten verweisen. So gelangen sie auf Basis der gesichteten Studienlage zu dem Schluss, dass in den USA Menschen asiatischer Herkunft in klassischen Intelligenztests wie den Wechsler-Tests durchschnittlich fünf IQ-Punkte mehr erzielen als „weiße“ US-Amerikaner, während Menschen afroamerikanischer Abstammung im Schnitt 15-18 Punkte (d.h. eine ganze Standardabweichung) weniger als „weiße“ Amerikaner erlangen. Nun kann man sich vorstellen, dass diese Befunde vor dem Hintergrund der Art und Weise, wie Afroamerikaner in der Vergangenheit in den USA behandelt wurden, gewaltigen sozialpolitischen Sprengstoff lieferten. Zudem weisen die Autoren darauf hin, dass der IQ von Einwandern zum Zeitpunkt der Immigration im Durchschnitt bei 95 und somit unterhalb des Populationsmittelwerts von 100 liege.

Sozialpolitische Schlussfolgerungen: Afro-Amerikaner und Immigranten loswerden

Nun, diese gefundenen Unterschiede sind zunächst einmal nicht so einfach wegzudiskutieren (worauf sie wahrscheinlich zurückzuführen sind, werde ich später noch beschreiben!), aber das Skandalöse an dem Buch „The Bell Curve“ ist etwas anderes: die sozialpolitischen Schlussfolgerungen und Forderungen, die Herrnstein und Murray daraus ableiten. Insgesamt zielt ihre Argumentation darauf ab, deutlich zu machen, dass durch eine Reihe von Faktoren die mittlere Intelligenz der US-Bürger heruntergedrückt werde und die Gesellschaft somit quasi zugrunde gehe. Hierfür seien eine Reihe von Faktoren verantwortlich. Neben dem nicht geringer werdenden Strom von Einwanderern, die mit ihrer geringeren Intelligenz den Durchschnitt „drücken“ (ebenso wie die afroamerikanische Bevölkerung), liege eine weitere Ursache in der Tatsache, dass Mütter mit unterdurchschnittlichem IQ mehr Kinder bekämen als solche mit durchschnittlichem IQ (was ein korrekter Befund ist). Da Intelligenz größtenteils erblich sei, vermehre sich somit die „dumme“ Bevölkerung immer mehr, während die „schlaue“ immer weniger werde. Aufgrund der angeblich hohen Heritabilität von Intelligenz seien ferner sämtliche großangelegte Fördermaßnahmen mit dem Ziel, Intelligenzunterschiede auszugleichen, völlige Fehlinvestitionen. Und es geht noch weiter: Antidiskriminierungsmaßnahmen, die dazu dienen sollen, Chancengleichheit in der Bevölkerung herzustellen (indem gezielt traditionell benachteiligte Gruppen wie Afroamerikaner gefördert werden), seien nicht nur unnütz, sondern auch ungerecht, da so z.B. Angehörige dieser Gruppen Studienplätze oder Jobs erhielten, für die sie aufgrund ihrer geringen Intelligenz gar nicht qualifiziert seien. Dies wiederum führe nur zu sozialen Spannungen und wachsendem Hass der eigentlich benachteiligten, „weißen“ Bevölkerung auf die afroamerikanische. Außerdem trüge diese Art von Fördermaßnahmen zur Verdummung von Schulen und Universitäten bei. Man solle, so Herrnstein und Murray, lieber die Ungleichbehandlung fortführen, da diese schlichtweg der Realität entspreche. Geld solle man lieber in die Förderung der Begabten (= hoch Intelligenten) stecken, da diese ohnehin bald in der absoluten Minderheit seien. Falls Ihnen diese Argumentationslinie bekannt vorkommt, wird das sehr wahrscheinlich daran liegen, dass ein ehemaliger deutscher Politiker namens Thilo Sarrazin in seinem Buch „Deutschland schafft sich ab“ vor einigen Jahren fast genau die gleichen Thesen aufgegriffen und auf die Einwanderungssituation in Deutschland angewendet hat.

Die Kritik

Die Kritik an „The Bell Curve“ ist allem voran eine Kritik an den von Herrnstein und Murray vorausgesetzten Prämissen. Denn ein Grundkonzept der Philosophie lautet nun einmal, dass ein Argument nur dann Gültigkeit besitzt, wenn die Wahrheit der Prämissen zwangsläufig zur Wahrheit der Schlussfolgerung (Konklusion) führt. Die wichtigsten nicht korrekten Prämissen sind, wie auch bereits von Stephen Jay Gould beschrieben, im Folgenden dargestellt.

Überschätzte Heritabilität

Einer der größten Schwachpunkte an der oben beschriebenen grotesken Argumentation ist in der Tat, dass Intelligenz auf Basis des heutigen Wissensstandes bei weitem nicht so stark erblich bedingt ist wie lange angenommen (was Sie hier nachlesen können). Und selbst wenn dies so wäre, wäre die Schlussfolgerung, die gemessenen IQ-Unterschiede zwischen den verschiedenen Bevölkerungsgruppen seien im unterschiedlichen genetischen Material der Gruppen begründet, immer noch falsch, denn: Die Gruppen unterscheiden sich ganz offenbar auch stark hinsichtlich ihrer Umweltbedingungen (sozioökonomischer Status etc.), sodass man selbst im Sinne der klassischen Verhaltensgenetik folgern muss, dass die Ursache für die Unterschiede unklar ist. Heutzutage gibt es viele Belege dafür, dass die gemessenen IQ-Unterschiede eher nicht auf genetische Unterschiede zurückzuführen sind, sondern sehr viel stärker durch Umweltfaktoren zu erklären sind, vor allem durch den z.B. in der afroamerikanischen Bevölkerung im Durchschnitt deutlich geringeren sozioökonomischen Status, den damit verbundenen schlechteren Zugang zu (in den USA meist sehr teuren) Bildungsangeboten sowie durch diverse psychologische Effekte wie die sich selbsterfüllende Prophezeiung und geringe Leistungserwartungen von Lehrern an afroamerikanische Kinder (die oft von Beginn an mit dem Vorurteil konfrontiert werden, dass sie weniger leistungsfähig sind als „weiße“ Kinder). Hinzu kommen wahrscheinlich Effekte durch schlechtere Englischkenntnisse, die zur Bearbeitung der Intelligenztests erforderlich sind, sowie möglicherweise kulturelle Unterschiede (siehe weiter unten).

Annahme eines für alle Menschen geltenden g-Faktors

Herrnstein und Murray gründen ihre Argumentation unter anderem auf die Prämisse, dass es einen für alle Menschen geltenden Generalfaktor der Intelligenz (g-Faktor) gibt, der im Wesentlichen auch von allen gängigen Intelligenztests gemessen wird. Beide Prämissen sind auf Basis des aktuellen Standes der Wissenschaft nur schwer haltbar, wie Sie auch hier nachlesen können.

Intelligenztests sind für alle ethnischen Gruppen gleich schwierig

Auch diese wichtige Prämisse wird zwar kontrovers diskutiert, ist aber durchaus als heikel einzustufen. Zum einen gibt es Hinweise darauf, dass Menschen in westlich geprägten Kulturen vertrauter sind mit typischen Intelligenztestaufgaben, sodass Menschen aus anderen Kulturen eine Benachteiligung bei der Aufgabenbearbeitung erfahren. Ein sehr pragmatisches Beispiel hierfür sind Untertests zur kristallinen Intelligenz, in denen allgemeines Wissen oder Wortschatz dadurch erfragt wird, dass den getesteten Personen Bilder der jeweiligen Objekte gezeigt werden (wie z.B. im WIE). Hier liegt es auf der Hand, dass die Bilder (z.B. Autos, Armbanduhren, Häuser) stark von derjenigen Kultur geprägt sind, in der der Test entwickelt wurde – und dass Menschen aus anderen Kulturkreisen hiermit weitaus weniger vertraut sein mögen. Verknüpft damit ist der zweite Aspekt, der beinhaltet, dass das Verständnis von Intelligenz, auf dem etablierte Intelligenztests beruhen, stark durch die westliche Kultur geprägt ist, die Intelligenz weitgehend als Ausmaß der Effizienz der Informationsverarbeitung sieht. Wie Sie hier nachlesen können, hängt die Definition von „Intelligenz“ jedoch stark vom kulturellen Umfeld ab, sodass eine Benachteiligung dadurch entsteht, dass eines von vielen verschiedenen Intelligenzkonzepten gleichsam auf alle Menschen angewendet wird. Ein ganz zentrales Element, das eine Benachteiligung nach sich zieht, sind zudem die ungleich guten Sprachkenntnisse der getesteten Menschen, also z.B. bei Einwanderern in die USA die Englischkenntnisse. Es erscheint relativ logisch, dass bei mangelndem sprachlichen Verständnis der Aufgaben (und das ist bei jedem Intelligenztest erforderlich) schlechtere Testergebnisse resultieren, weil die Voraussetzung dafür, dass Intelligenz überhaupt gemessen werden kann, gar nicht erfüllt ist.

Fehler in der Analyse der zugrunde gelegten Studien

Zusätzlich zu den bereits genannten Punkten muss man den Autoren von „The Bell Curve“ außerdem noch eine Reihe methodischer und statistischer Fehler bei der Analyse der herangezogenen Studien vorwerfen. Zum einen wäre da der wirklich sehr grobe Schnitzer, einen Korrelationszusammenhang, der grundsätzlich ungerichtet ist, auf kausale Weise zu interpretieren. Gemeint ist hier der Zusammenhang zwischen dem sozioökonomischen Status und Intelligenz, wobei Herrnstein und Murray verzweifelt versuchen, scheinbar zu beweisen, dass ein niedriger IQ die Ursache eines niedrigen sozioökonomischen Status ist und nicht umgekehrt. Was hierbei jedoch Ursache und was Wirkung ist, ist nicht eindeutig geklärt, und das Allerwahrscheinlichste und zugleich Logischste ist, dass beide Faktoren sich im Laufe eines Menschenlebens gegenseitig beeinflussen: Intelligenz ist förderlich dabei, einen hohen Bildungsstand zu erreichen und somit das Armutsrisiko zu reduzieren, aber ebenso beeinflussen der sozioökonomischen Status und die damit verbundenen Förderbedingungen in der Ursprungsfamilie maßgeblich, wie sich die Intelligenz eines Menschen entwickelt. Meiner Meinung nach muss man sogar sagen, dass es letztlich unmöglich ist, diese beiden Variablen zu trennen, weil sie derart stark verflochten und voneinander abhängig sind. Und da wir es hier sowohl auf Seiten der Intelligenz als auch auf Seiten des sozioökonomischen Status mit zahlreichen anderen Variablen zu tun haben, die mit beidem zusammenhängen, aber so gut wie nie in Studien berücksichtigt und kontrolliert wurden, werden vernünftige Schlussfolgerungen noch zusätzlich erschwert.

Zweitens kann man Herrnstein und Murray für die Auswahl der zugrunde gelegten Originalarbeiten kritisieren: So beziehen sie sich auf mehrere Studien, die methodisch mehr als zweifelhaft sind (z.B. weil lediglich IQ-Unterschiede zwischen Gruppen, aber keine Gruppenmittelwerte berichtet werden oder weil die gemessenen niedrigeren IQ-Werte von südafrikanischen Kindern offensichtlich auf kaum vorhandene Englischkenntnisse zurückgehen). Drittens muss man den beiden Autoren vorhalten, dass sie bei der Analyse der Studien selektiv solche aussortierten, die nicht ins Bild passten – z.B. Daten von südafrikanischen (schwarzen) Schülern, die in einem Intelligenztest im Durchschnitt besser abschnitten als weiße Schüler. Somit ist die Analyse von Herrnstein und Murray alles andere als ausgewogen.

Eugenik – künstliche Selektion zur Rettung der Menschheit

Die Eugenik ist zweifelsohne das dunkelste und grausamste Kapitel der Psychologie, das traurigerweise kaum Inhalt der akademischen Lehrpläne in diesem Fach ist. Gemeint ist mit diesem Begriff eine Form der künstlichen Selektion der Art, dass die Fortpflanzung dahingehend beeinflusst wird, dass Nachkommen mit gewünschten Eigenschaften (z.B. hoher Intelligenz) entstehen – entweder durch Förderung der Fortpflanzung „wertvoller“ Menschen (positive Eugenik) oder durch die Hinderung „minderwertiger“ Menschen daran, sich fortzupflanzen (negative Eugenik). Ein leidenschaftlicher Verfechter dieser Konzepte war in der zweiten Hälfte des 19. Jahrhunderts Sir Francis Galton, der, begeistert vom Werk „Die Entstehung der Arten“ seines Cousins Charles Darwin, die These aufstellte, dass die natürliche Selektion des Menschen dadurch behindert werde, dass die Gesellschaft ihre schwachen Mitglieder schütze. Daher, so Galton, sei eine künstliche Selektion im Sinne der Eugenik nötig, weil sich sonst die weniger intelligenten Menschen stärker vermehren und so zum Niedergang der menschlichen Rasse führen würden (man merkt: Sowohl die Ideen von Herrnstein und Murray als auch die Thilo Sarrazins sind schon recht alt). Niedrige Intelligenz war bereits damals mit der Einwanderungsgesellschaft und der afroamerikanischen Bevölkerung assoziiert, und Galton war fest davon überzeugt, dass Intelligenz erblich bedingt sei. Daher lag die Schlussfolgerung nahe, die Selektion (und so die „Rettung der Menschheit“) dadurch voranzutreiben, dass man jene „minderintelligenten“ Gruppen von der Fortpflanzung abhalten möge.

Konkret war die politisch bald durchgesetzte Folgerung hieraus die Sterilisation entsprechender Personengruppen. Diese bezog sich allerdings nicht auf alle oben genannten Bevölkerungsgruppen, sondern laut dem US-amerikanischen Model Eugenic Sterilization Law (1922) u.a. auf „Minderbegabte“, „Wahnsinnige“, Blinde, Behinderte, Kriminelle, Epileptiker, Obdachlose und Waisenkinder. Und man sollte nicht davon ausgehen, dass diese nicht durchgeführt wurde: So schätzte das Journal of the American Medical Association, dass allein in den USA zwischen 1941 und 1942 über 42000 Personen zwangssterilisiert wurden. Aber damit nicht genug: Neben den USA etablierte eine Fülle weiterer Länder in der Folge eigene Eugenik-Programme (sowohl positive als auch negative), darunter auch Schweden, Kanada, Australien, Norwegen, Finnland und die Schweiz. Trauriger Spitzenreiter war in der Zeit des Nationalsozialismus Deutschland, wo bis zum Ende des 2. Weltkriegs mehr als eine halbe Million Menschen wegen „Verdachts auf Erbdefekte“ oder „Gefahr der Rassenverunreinigung“ zwangssterilisiert wurden – worunter neben geistig und körperlich behinderten Menschen auch „Asoziale“ wie Sinti, Roma und Alkoholiker sowie Homosexuelle (hier entzieht sich mir selbst der vermeintliche Sinn), Prostituierte und Fremdrassige (v.a. Menschen afrikanischer und arabischer Abstammung) fielen. Dies gipfelte schließlich in den rund 100.000 Euthanasiemorden, die die Nazis im Rahmen der „Aktion T4“ an behinderten Menschen verübten. Ein Beispiel für positive Eugenik war zudem der vom NS-Regime ins Leben gerufene Lebensborn, der zum Ziel hatte, die Geburtenrate „reinrassig-arischer“ Kinder zu steigern.

Das einzig Gute an alldem war (wenn man in diesem Zusammenhang überhaupt das Wort „gut“ verwenden darf), dass nach Ende des 2. Weltkriegs das internationale Ansehen der Eugenik drastisch abnahm, weil kaum ein Land mit den Gräueltaten Deutschlands in Verbindung gebracht werden wollte. Die Eugenikprogramme der meisten Länder wurden eingestellt, und 1948 verabschiedeten die Vereinten Nationen eine Resolution, gemäß derer es allen Männern und Frauen unabhängig von ihrer Nationalität, Ethnie, etc. erlaubt sein sollte, zu heiraten und eine Familie zu gründen.

Eine Warnung: Damit Deutschland sich nicht abschafft

Es wäre falsch, zu sagen, dass das Buch von Herrnstein und Murray direkt zur Eugenik aufruft. Dennoch finden sich in der Argumentationslinie und den gezogenen Schlussfolgerungen ganz klar Parallelen zu den Konzepten und Praktiken der Eugenik (keine Förderung der Schwachen, Bewahrung der Menschheit vor der Überbevölkerung durch die „Minderintelligenten“), die von Thilo Sarrazin gleichermaßen für Deutschland übernommen wurden. Auch nicht gerade ein gutes Licht auf „The Bell Curve“ wirft die Tatsache, dass Herrnstein und Murray sich einer großen Zahl von Originalarbeiten Richard Lynns bedienen, der nicht nur als bekannter Intelligenzforscher, sondern auch als bekennender Verfechter der Eugenik bekannt ist und z.B. befürwortet, Embryonen bei der künstlichen Befruchtung auf genetische Eigenschaften hin zu untersuchen und nur die „besten“ zu verwenden.

Auffällig ist bei Lynn, dass er kein Demagoge ist, der die Gesellschaft aufhetzen will. Er ist Wissenschaftler und hat größtenteils die unbegrenzte Nutzung wissenschaftlich angesammelten Wissens als Ziel vor Augen. Diese mechanistische Denkweise ist allerdings eine, die meiner Ansicht nach niemals Macht erlangen sollte. Denn was Lynn völlig außer Acht lässt, sind all die ethischen Probleme und Menschenrechtskontroversen, die dies mit sich führen würde. Aber was ist die Alternative? Politiker wie Thilo Sarrazin, die mit menschenverachtendem Vokabular zur „Eugenik 2.0“ aufrufen? Bitte nicht. Was bleibt, ist die Hoffnung in die wirklich klugen Köpfe unserer Gesellschaft, die in der Lage sind, Weltanschauung und wissenschaftliche Befunde auf konstruktive Art und Weise miteinander zu verbinden, anstatt immer neue Katastrophen herbeizuschwören und noch katastrophalere Lösungen vorzuschlagen.

 

Intelligenz – Teil 5: Ist unser IQ ausschließlich genetisch bedingt?

Vielen Lesern mag diese Frage allein schon seltsam vorkommen, herrscht doch in vielen Bereichen unserer Gesellschaft doch die Meinung vor, dass Menschen hinsichtlich ihrer Fähigkeiten stark formbar sind. Schließlich schicken wir unsere Kinder in die Schule, regen sie bei schlechten Noten an, sich anzustrengen und besorgen ihnen eine nette Nachhilfelehrerin. Die in der Überschrift gestellte Frage ist jedoch berechtigt, herrschte (und herrscht oft heute noch) in der Psychologie doch die Ansicht vor, dass die allgemeine Intelligenz des Menschen ein Merkmal darstellt, das zu einem vergleichsweise großen Anteil vererbt wird, d.h. genetisch determiniert ist. Da man in der Psychologie ebenso wie in der gesamten Wissenschaft ziemlich sicher ist, dass kaum ein menschliches Merkmal (mit Ausnahme von Dingen wie Augenfarbe und Blutgruppe) zu 100% genetisch bestimmt ist, begann man vor einigen Jahrzehnten, sich der Frage nach dem Anteil zu widmen, der auf genetische einerseits und Umwelteinflüsse andererseits zurückzuführen ist. Der Wissenschaftszweig, der sich hieraus entwickelte, nennt sich Verhaltensgenetik.

Das Konzept der Heritabilität

Den Grad der Erblichkeit eines Merkmals wie Intelligenz vernünftig zu berechnen, ist alles andere als einfach. In der Regel wird als Anhaltspunkt die so genannte Heritabilität berechnet, welche zweifelsohne zu den Messgrößen gehört, die am häufigsten falsch und vor allem überinterpretiert werden. Meistens wird die Heritabilität auf Basis von Zwillingsstudien berechnet. Das sind Studien, in denen eineiige (die zu 100% dieselben Gene besitzen) oder aber zweieiige Zwillinge (die durchschnittlich, aber nicht immer genau, 50% der Gene teilen – genau wie „normale“ Geschwister) dahingehend untersucht werden, inwieweit jedes der untersuchten Zwillingspaare hinsichtlich eines bestimmten Merkmals übereinstimmt. In unserem Fall bedeutet das: Bei beiden Zwillingen wird der IQ gemessen, und dann wird über die gesamte Stichprobe von Zwillingspaaren die Korrelation berechnet, sodass man ein Maß dafür erhält, wie groß über alle Zwillingspaare hinweg die durchschnittliche Übereinstimmung zwischen Zwilling A und Zwilling B ist. Wenn ein Merkmal stark genetisch bedingt ist, würde man erwarten, dass die Korrelation bezüglich dieses Merkmals bei eineiigen Zwillingen sehr viel größer ausfällt als bei zweieiigen. Diese Korrelation wird nun für eineiige und zweieiige Zwillinge separat berechnet, und die Heritabilität stellt ein Maß dar, das diese beiden Korrelationen zueinander ins Verhältnis setzt. Daher variiert auch die Heritabilität zwischen 0% und 100%, wobei der errechnete Prozentsatz, genau gesagt, den Anteil an der Gesamtvarianz eines bestimmten messbaren Merkmals (wie Intelligenz) in einer Population wiedergibt, der auf genetische Unterschiede zurückgeführt werden kann. Mit anderen Worten: Eine Heritabilität von 50% würde z.B. bedeuten, dass 50% der Varianz (also der Streuung) der Intelligenzwerte in der gesamten Population (wofür die Stichprobe stellvertretend ist) auf genetische Unterschiede der Menschen zurückgeführt werden kann. Oder noch anders ausgedrückt: Es bedeutet, dass 50% der IQ-Unterschiede innerhalb der gemessenen Gruppe mit den genetischen Unterschiedenen der Gruppenmitglieder (linear) zusammenhängen. Für das Merkmal Intelligenz wurden so in der Vergangenheit meist Heritabilitätswerte zwischen 70 und 80% berichtet, was ziemlich hohe Werte sind.

Kritik am Konzept der Heritabilität

Keine Aussagen über einzelne Personen

Der wichtigste Aspekt ist hierbei, dass die Heritabilität sich immer nur auf die Population oder, genau genommen, auf die Stichprobe von Individuen bezieht, bei denen das Merkmal erhoben wurde. Die Prozentzahl kann somit nicht herangezogen werden, um Aussagen über eine einzelne Person zu treffen: Die Aussage „Bei jeder einzelnen Person ist die Intelligenz zu 80% genetisch bedingt“ ist daher nicht korrekt.

Mutmaßung statt Messung und irreführende Prozentzahlen

Außerdem ist es wichtig, anzumerken, dass bei alledem der Grad der genetischen Übereinstimmung einfach auf einen bestimmten Wert festgelegt wird. Das ist bei eineiigen Zwillingen (da sind die 100% unumstößlich) weit weniger problematisch als bei zweieiigen: Da nämlich ist der durchschnittliche Wert 50%, aber dieser kann erheblich variieren. Es würde also mehr Sinn machen, die tatsächliche Übereinstimmung zu messen anstatt sie zu schätzen – das allerdings würde den Aufwand einer solchen ohnehin komplexen Studie ins nahezu Unermessliche steigern. Übrigens: Die Zahl 50% ist hochgradig irreführend, weil alle Menschen (egal welcher ethnischer Abstammung) 100% aller Gene gemeinsam haben. Die Unterschiede liegen in den Genvarianten, den Allelen – und selbst diese sind bei allen Menschen zu 99,9% gleich. Die gesamte Varianz des menschlichen Erscheinungsbildes spielt sich also in diesen 0,1% ab – und wenn es heißt, zweieiige Zwillinge hätten 50% ihrer Gene gemeinsam, so bezieht sich das lediglich auf 50% dieser 0,1% der Allele. Korrekt wäre also eigentlich die Aussage: Zweieiige Zwillinge teilen 99,95% ihrer Allele, und eineiige 100%.

Aussagen sind zeitlich beschränkt

Der zweite Kritikpunkt betrifft die Tatsache, dass die Schätzung der Heritabilität immer nur eine Momentaufnahme darstellt, d.h. immer nur die Rolle des aktuell aktivierten genetischen Materials wiederspiegelt. Wie man aber inzwischen weiß, werden die unterschiedlichen Gene im Laufe eines menschlichen Lebens ziemlich häufig an- und wieder abgeschaltet, sodass die Heritabilität keine Schätzung über zum Zeitpunkt der Messung nicht aktiviertes genetisches Potenzial erlaubt.

Nicht mehr als ein Verhältnismaß

Das wohl wichtigste Argument gegen die Heritabilität, welches deren Interpretierbarkeit stark eingrenzt, ist die Tatsache, dass es sich hierbei, wenn man die Formel einmal übersetzt, um nicht mehr als ein Verhältnismaß handelt, das die genetische Varianz in einer Stichprobe ins Verhältnis setzt zur Umweltvarianz (also der Unterschiedlichkeit der Umweltbedingungen) in derselben Stichprobe. Das bedeutet, die berechnete Heritabilität ist von beidem abhängig. Das scheint trivial, ist aber von großer Bedeutung: Wenn nämlich aus Gründen der mangelnden Repräsentativität der Stichprobe z.B. die Umweltvarianz sehr gering ist (weil sich in der Stichprobe z.B. nur nordamerikanische Männer aus der Mittelschicht befinden, die alle unter ähnlichen Umweltbedingungen leben), dann wird die Heritabilität zwangsläufig hoch ausfallen, weil die genetische Varianz in der Regel größer ist. Und in der Tat ist es so, dass viele der Studien, die zur Berechnung der Heritabilität durchgeführt wurden, genau diesen Schwachpunkt haben, was den Schluss nahelegt, dass die Heritabilität durch diese deutlich überschätzt wird – weil in den Stichproben gar nicht genug Umweltvarianz vorliegt, um dieses Maß sinnvoll zu deuten. Tatsächlich führt dieser Umstand oft zu seltsamen Phänomen und mitunter auch zu bildungspolitischen Fehlentscheidungen. So kam es z.B. bereits vor, dass Regierungen durch diverse Maßnahmen die Chancengleichheit von Kindern verbesserten und somit quasi die Umweltvarianz reduzierten, weil sich die Bedingungen, unter denen die Kinder lebten, dadurch ähnlicher wurden. Wenn dann z.B. durch Schultests der Bildungserfolg (der nun als weiteres Merkmal analog zur Intelligenz zu sehen ist) der Kinder gemessen und damit die „Heritabilität des Bildungserfolgs“ berechnet wird, kommt natürlich ein hoher Wert dabei heraus – der dann von (dummen) Politikern dahingehend fehlgedeutet wird, dass das Schaffen von Chancengleichheit völliger Quatsch ist, da der Bildungserfolg ja offenbar doch nur von der genetischen Ausstattung der Kinder abhängt. Ein Beispiel für einen grandiosen Fehlschluss.

Weitere Kritik an der Verhaltensgenetik

Neben diesen eklatanten Nachteilen des Konstrukts „Heritabilität“ gibt es diverse weitere Kritikpunkte an der klassischen Verhaltensgenetik. Diese Punkte betreffen vor allem die eher steinzeitliche Auffassung von Genetik und die ziemlich stiefmütterliche Behandlung des Umweltfaktors.

Konzeption von „Genetik“

Wie schon beschrieben, wird in der klassischen Verhaltensgenetik der Grad der genetischen Übereinstimmung zwischen Menschen nicht gemessen bzw. erfasst, sondern aufgrund bestimmter Annahmen geschätzt (z.B. auf 50%). Das allein ist bereits wissenschaftlich ziemlich unbefriedigend. Hinzu kommt, dass man inzwischen (z.B. in der molekularen Verhaltensgenetik) sehr viel weiter ist und eine Fülle verschiedener Arten von „Genvarianz“ unterscheidet – unter anderem die Varianz, die dadurch entsteht, dass unterschiedliche Allele an weit voneinander entfernten Orten im Genom (d.h. der Gesamtheit aller Gene) miteinander interagieren. Im Rahmen von so genannten Kopplungs- und Assoziationsstudien wird zudem durch den Scan des menschlichen Genoms untersucht, welche bestimmten Allele in Zusammenhang mit bestimmten Merkmalen wie z.B. psychischen Störungen stehen.

Konzeption von „Umwelt“

Man muss wohl zugeben, dass der Begriff „Umwelt“ so ziemlich einer der schwammigsten in der gesamten Psychologie ist. Gemeint ist hiermit die Summe an externen Faktoren, die einen Menschen in seiner Entwicklung von Geburt an beeinflussen – d.h. ungefähr alles von Ernährung und Klimabedingungen über Einkommen und Bildungsniveau der Eltern (oft zusammengefasst zum sozioökonomischen Status) bis hin zum elterlichen Erziehungsstil, den zur Verfügung gestellten Förderbedingungen und der Art der Eltern-Kind-Bindung. Das Problem hieran: Die Gleichheit oder Unterschiedlichkeit der Umwelt wurde und wird in der klassischen Verhaltensgenetik nie ausreichend präzise erfasst. Stattdessen verlässt man sich auch hier viel zu oft auf Daumenregeln, wie z.B. in den auch sehr beliebten Adoptionsstudien. Diese wurden lange als die beste Art von Studien gesehen, um den Einfluss von Umwelt und Genetik auf ein bestimmtes Merkmal voneinander zu trennen. Untersucht wurden hierbei eineiige Zwillingspaare (die also genetisch identisch ausgestattet sind), die jedoch von jeweils unterschiedlichen Familien adoptiert wurden. Die Annahme, die man hierbei meist getroffen hat, ist, dass die Umwelt der beiden Zwillinge im Gegensatz zum genetischen Faktor somit unterschiedlich ist. Sehr viele Psychologen haben in der Vergangenheit immer wieder betont, dass später gefundene Übereinstimmungen der Zwillinge, z.B. bzgl. des IQs, somit auf die gemeinsamen Gene zurückgeführt werden können. Dieser Schluss ist jedoch falsch: In Wirklichkeit ist es umgekehrt, weil vielmehr die gefundenen Unterschiede interessant sind – denn diese müssen zwangsläufig auf die Umwelt zurückzuführen sein. Die Schlussfolgerung ist aber aus noch einem zweiten Grund nicht korrekt: Übereinstimmungen zwischen solchen getrennt aufgewachsenen Zwillingen können ebenso auch auf die Umweltbedingungen zurückzuführen sein, denn diese sind in der Tat bei weitem nicht so unterschiedlich wie oft vermutet. Dies geht unter anderem zurück auf die bei Adoptionen weit verbreitete Praktik der selektiven Platzierung, die beinhaltet, dass die zuständigen Behörden darauf achten, dass die Adoptivfamilie der biologischen Familie des Kindes möglichst ähnlich ist. Untermauert wird diese bedeutende Rolle der Umwelt ferner durch eine Studie von Bronfenbrenner (1975), die zeigen konnte, dass die Übereinstimmungsrate (zu verstehen wie eine Korrelation) zwischen den IQ-Werten eineiiger Zwillinge stolze 0,80 betrug, wenn die Umwelten der getrennt aufgewachsenen Zwillinge sich stark ähnelten. War diese Ähnlichkeit jedoch nicht gegeben, lag die Übereinstimmung bei dem sehr viel niedrigeren Wert von 0,28. Insgesamt lässt sich hiermit also festhalten, dass durch die in der klassischen Verhaltensgenetik etablierten Methoden die Unterschiedlichkeit der Umwelt (also die Umweltvarianz) systematisch und erheblich unterschätzt wurde. So liegen z.B. sehr robuste Befunde dafür vor, dass gute Ernährung und insbesondere das Stillen sich positiv auf die spätere Intelligenz auswirken (die Unterschiede liegen im Bereich von 2 – 4 IQ-Punkten), während der mütterliche Alkohol- und Tabakkonsum sich negativ auswirken und im Falle von Alkoholkonsum (bei dem die Menge übrigens keine Rolle spielt!) sogar ein fetales Alkoholsyndrom (FAS) resultieren kann.

Gen-Umwelt-Interaktion

Das stärkste Argument gegen die klassischen Verhaltensgenetik kommt zum Schluss. Nämlich die Tatsache, dass es unangemessen ist, von einem additiven Verhältnis von Genetik und Umwelt auszugehen – was die klassischen Verhaltensgenetik jedoch tut und was sich auch in Maßen wie der Heritabilität wiederspiegelt. Denn nur wenn man davon ausgeht, dass Umwelt und Genetik eine Summe bilden, macht es Sinn, ein Verhältnis zu bilden, das eine Aussage darüber trifft, wie viel Prozent eines Merkmals auf Gene und wie viel auf Umwelt zurückzuführen sind. Inzwischen weiß man allerdings, dass diese Ansicht grundlegend falsch ist, sodass die additive Sicht inzwischen durch das Konzept der Gen-Umwelt-Interaktion ersetzt wurde. Gemeint ist hiermit, dass Gen- und Umweltfaktoren nicht einfach immer mit dem gleichen Gewicht aufeinander treffen, sondern dass bestimmte Umweltfaktoren je nach genetischer Ausstattung unterschiedlich wirksam sein können – ebenso wie dass bestimmte genetische Anlagen einer „Aktivierung“ aus der Umwelt bedürfen, ohne die sie nicht wirksam werden können. Mit anderen Worten: Umwelt und Genetik sind voneinander abhängig und greifen wie Zahnräder ineinander. So gibt es z.B. aus dem Bereich der Intelligenzforschung sehr überzeugende Befunde, dass gute genetische Anlagen nur dann zu einer hohen Intelligenz in einem späteren Alter führen, wenn das Kind in einer Umwelt aufwächst, in der seine Fähigkeiten gefördert werden. Ebenso für die Bedeutung der Umwelt spricht, dass sich die Befunde mehren, dass vernünftig konzipierte Intelligenztrainings eine nachweisbare (wenn auch nicht exorbitant große) Wirkung zeigen. Was genau man sich unter einer Gen-Umwelt-Interaktion vorstellen kann, habe ich übrigens auch in einer meiner hochgeladenen Präsentationen erklärt – am Beispiel von Depressionen. Die Präsentation finden Sie hier.

Insgesamt legt all dies das Fazit nahe, dass durch unsere genetische Ausstattung offenbar zwar ein gewisser Rahmen abgesteckt wird, innerhalb dessen sich unsere letztliche Intelligenz später einmal bewegt – aber dass die Umwelt auf das endgültige „Ergebnis“ einen sehr viel größeren Einfluss hat als lange angenommen. Dass jedoch die Bedeutung der Umwelt lange unterschätzt, ignoriert und als unwissenschaftlich abgewertet wurde, hatte erhebliche soziale und politische Konsequenzen, was uns zu einem sehr dunklen Kapitel der klassischen Verhaltensgenetik – und somit der Psychologie – bringt. Dieses wird Teil des nächsten und letzten Artikels der Intelligenz-Reihe sein, der mir aufgrund seiner gesellschaftlichen Bedeutung so sehr am Herzen liegt wie nur wenige andere.

 © Christian Rupp 2014

Intelligenz – Teil 4: Was messen IQ-Tests und worin besteht ihre Berechtigung?

Nachdem es in Teil 3 darum ging, wie sich der so genannte „IQ“ berechnet und wie er zu interpretieren ist, widmet dieser Artikel sich der Frage: Wie lässt sich Intelligenz messen? Und messen Intelligenztests tatsächlich Intelligenz?

Die verschiedenen Arten von Intelligenztests lassen sich ganz grob in zwei Gruppen einteilen. Anhand ihrer Verbreitung und Etabliertheit habe ich diese zwei Kategorien einmal „untypisch“ und „typisch“ getauft.

„Untypische“ Vertreter

In diese Kategorie fallen zu allererst einmal die so genannten elementaren kognitiven Aufgaben (kurz EKAs). Hierbei handelt es sich um eine Reihe relativ einfacher Aufgaben, z.B. die Identifikation von präsentierten Reizen (Kreis oder Quadrat?), die Unterscheidung von Reizen (Welcher der zwei Töne ist höher?) oder die Erinnerungsleistung in Kurzzeitgedächtnisaufgaben (z.B. maximale Zahl von Zahlen, die jemand, unmittelbar nachdem er sie gehört hat, in derselben Reihenfolge wiedergeben kann). Die Variablen, die hier als Maß für Intelligenz herangezogen werden, sind unter anderem die Reaktionszeit, die so genannte inspection time (Zeit, die jemand benötigt, um z.B. zu sagen, welche von zwei Linien länger ist) oder aber auch mit dem EEG gemessene ereigniskorrelierte Potenziale, wobei die Dauer bis zum Auftreten des Pozentials im EEG (die so genannte Latenz) als Maß für die Verarbeitungsgeschwindigkeit herangezogen wird, die wiederum Intelligenz widerspiegeln soll. Zur Validität der EKAs (also der Frage, in wiefern diese tatsächlich Intelligenz messen), liegen divergierende Befunde vor. Untersucht wurde diese Fragestellung, indem der lineare Zusammenhang (die Korrelation) zwischen der Leistung in EKAs und der Leistung in „typischen“ Intelligenztests berechnet wurde. Diese Korrelation allerdings schwankt in den verschiedenen Studien zwischen 0,35 und 0,70 – mit anderen Worten: Der Zusammenhang ist nicht bombig, und es ist wenig naheliegend, die Leistung in EKAs als alleinigen Indikator für Intelligenz zu betrachten. Ähnliches gilt für die Gehirngröße (gemessen z.B. per MRT bei lebenden oder aber direkt am Objekt  bei toten Menschen), die laut einer Metaanalyse von McDaniel (2005) eine Korrelation von 0,33 mit der Leistung in typischen Intelligenztests aufweist. Dass hier kein so besonders großer Zusammenhang besteht, ist wenig verwunderlich, wenn man bedenkt, dass die Art der synaptischen Vernetzung in unserem Gehirn sehr viel wichtiger für die reibungslose Verarbeitung von Informationen ist als dessen einfaches Volumen.

Zweitens wären da eine Reihe von Tests, die offenkundig „typischen“ Vertretern ähneln, sich aber dadurch von diesen unterscheiden, dass sie den Generalfaktor g ablehnen, d.h. nicht von einem, allen Facetten übergeordneten allgemeinen Intelligenzfaktor ausgehen, sondern von mehreren voneinander unabhängigen Faktoren. In der Tat stellen die von diesen Tests postulierten Faktoren meist elementare kognitive Funktionen (ähnlich den EKAs) dar – und keine Intelligenzkomponenten, wie in den in Teil 2 beschriebenen Modellen aufgeführt. In diese Kategorie fallen z.B. das Cognitive Assessment System (CAS) und die Kaufman-Tests (z.B. das „K-ABC“). Während das CAS u.a. die Faktoren Planung (Strategien zur Problemlösung entwickeln) und Simultanität (getrennte Objekte zu etwas Ganzem integrieren) erfasst, unterscheidet das K-ABC zwischen erworbenen Fertigkeiten (Rechnen und Schreiben), simultaner Verarbeitung (Matrizen-Aufgaben der Sorte „Welches Bild ergänzt das Muster?“) und sequenzieller Verarbeitung (z.B. Zahlen nachsprechen). Wichtig beim K-ABC: Nur diese letzten zwei Faktoren sollen die kognitive Leistungsfähigkeit widerspiegeln; erworbene Fähigkeiten werden isoliert hiervon betrachtet.

„Typische“ Vertreter

Zu den typischen Vertretern gehören alle psychometrischen Tests, d.h. solche, die in der Regel auf einem bestimmten Intelligenzmodell (siehe Teil 2) basieren, eine Reihe verschiedener Aufgabentypen beinhalten, die normiert sind (damit die Leistung der getesten Person mit der von hinsichtlich Alter und Geschlecht ähnlichen Personen verglichen werden kann) und (das ist zentral) deren Gütekriterien (Objektivität, Reliabilität, Validität) überprüft wurden und als gesichert gelten.

Die meisten dieser Tests basieren auf Modellen, die einen g-Faktor annehmen, und ermöglichen daher auch die Berechnung eines allgemeinen Intelligenzquotienten. Ein Beispiel hierfür sind die Wechsler-Intelligenztests, z.B. der WIE (Wechsler-Intelligenztest für Erwachsene) oder der HAWIK-IV (Hamburg-Wechsler-Intelligenztest für Kinder, 4. Auflage). In den Wechsler-Tests gibt es u.a. die typischen Aufgabenbereiche Allgemeines Wissen, Finden von Gemeinsamkeiten, Matrizen ergänzen, Mosaike legen, Zahlen nachsprechen (vorwärts und rückwärts) und Kopfrechnen. Während die Wechsler-Tests sowohl die Berechnung der allgemeinen Intelligenz als auch verschiedener Unterfacetten ermöglichen, erlauben die so genannten Raven-Tests, die ausschließlich aus Matrizenaufgaben bestehen, nur die Berechnung eines allgemeinen IQs. Der Intelligenzstruktur-Tests (IST-2000-R), der auf dem Modell von Thurstone basiert, ermöglicht hingegen nur die Berechnung von IQ-Werten für die Bereiche schlussfolgerndes Denken (verbal, figural und numerisch) und Merkfähigkeit (verbal und figural). Zusätzlich gibt es einen Wissenstest, der aber nicht obligatorisch ist und am ehesten kristalline Intelligenz widerspiegelt.

Wozu das ganze? Der Sinn der Intelligenzmessung.

Nun kann man sich fragen, was es einem bringt, die Intelligenz einen Menschen (bzw. das, was diese ganzen Tests vorgeben, zu messen) zu erfassen. Die selbstwertregulierende Funktion liegt auf der Hand (es ist natürlich schön, von sich sagen zu können, dass man intelligenter als 99% der restlichen Menschheit ist), aber das ist zum Glück nicht alles.

Diagnostik von Intelligenzminderung & Hochbegabung

In der Tat sind Intelligenztests ein extrem wichtiges diagnostisches Instrument, das in vielen Bereichen zum Einsatz kommt. Im Bereich der pädagogischen Psychologie sind da z.B. die Diagnostik von Teilleistungsstörungen wie Lesestörungen, Rechtschreibstörungen und Dyskalkulie (Rechenstörung) zu nennen, zu deren Diagnose nämlich die Leistung im jeweils beeinträchtigten Bereich mindestens zwei Standardabweichungen (also deutlich) unterhalb der allgemeinen Intelligenz liegen müssen (um auszuschließen, dass es sich um eine generelle Intelligenzminderung oder gar eine geistige Behinderung handelt). Aber auch am anderen Ende der Skala ergibt sich ein wichtiges Anwendungsfeld: die Hochbegabtendiagnostik. Die ist deshalb so wichtig, weil es bei solchen Kindern von großer Bedeutung ist, diese hohe Intelligenz zu fördern, um Unterforderungserleben zu verhindern, das sonst leicht zu Problemen führen kann (z.B. weil das Kind den Unterricht stört oder sich zurückzieht). Vielleicht denken Sie hierbei auch gleichzeitig an die Diagnose einer ADHS. Das ist völlig richtig, denn auch zu dieser Diagnose muss eine Hochbegabung (genauso wie eine geistige Behinderung) als Ursache des unangepassten Verhaltens des Kindes ausgeschlossen werden.

Bewerberauswahl und Vorhersage des Schulerfolgs

Die weiteren Anwendungsgebiete von Intelligenztests ergeben sich aus der breitgefächerten prädiktiven Validität von Intelligenztests, d.h. aus der Tatsache, dass sich durch die Intelligenzleistung zu einem bestimmten Zeitpunkt bestimmte andere Variablen ziemlich gut vorhersagen lassen. So zeigte z.B. eine Metaanalyse von Schmidt und Hunter aus dem Jahr 1998, dass die allgemeine Intelligenz zu 0,54 mit dem späteren Arbeitserfolg bzw. der beruflichen Leistung korrelierte – damit sind Intelligenztests diejenige Methode mit der besten Vorhersagekraft für Berufserfolg. Trotz dieser Erkenntnis bevorzugen die meisten Unternehmen bei der Bewerberauswahl jedoch die sehr viel teureren Assessment-Center, wobei die Argumente hierfür denkbar schwach sind: Die Leistung in diesen korreliert nämlich im Mittel nur zu 0,37 mit späterem Berufserfolg. Ähnliche Korrelationen ergeben sich für die Beziehung von Intelligenz und Schulerfolg, gemessen z.B. durch die Schulnote. Diese schwanken nach Deary und Kollegen (2007) zwischen 0,43 im Fach Kunst und 0,77 im Fach Mathematik (und das ist in der Psychologie eine wirklich verdammt hohe Korrelation). Als Anwendungsfeld ergibt sich hierbei z.B. die Verteilung von Kindern auf verschiedene Schulformen, um eine jeweils optimale Förderung zu ermöglichen.

Von Haftstrafen bis Krebs

Die Vorhersagekraft der allgemeinen Intelligenz ist jedoch noch sehr viel größer. Eine große Zahl von Längsschnittstudien (d.h. solchen, die z.B. in der Kindheit den IQ messen und dann über die folgenden 20 Jahre weitere Variablen erfassen) wurde zu diesem Thema durchgeführt und führte zu verblüffenden Ergebnissen. So zeigte sich, dass mit steigendem IQ das Risiko für Arbeitslosigkeit und Armut abnimmt, ebenso wie für Scheidungen und Haftstrafen. Zudem ergab sich, dass sogar Krebsdiagnosen umso unwahrscheinlicher sind, je intelligenter der Mensch ist. Bei vielen dieser Zusammenhänge gibt es sehr wahrscheinlich so genannte vermittelnde Variablen, d.h. solche, die den Zusammenhang zwischen IQ und der jeweils anderen Variable erklären. So ist der Zusammenhang mit Arbeitslosigkeit und Armut sicherlich darauf zurückzuführen, dass ein höherer IQ höhere Bildungsabschlüsse ermöglicht, die dann wiederum das Risiko für Arbeitslosigkeit und Verarmung reduzieren. Ähnliches gilt für den Fall der Krebsdiagnosen: Menschen mit höherem IQ haben in der Regel einen gesünderen Lebensstil (trinken z.B. weniger Alkohol und rauchen nicht), was dann wiederum das Krebsrisiko niedrig hält.

Messen Intelligenztests wirklich Intelligenz?

Hier bewegen wir uns auf die Frage nach der Validität dieser Tests zu. Um die Frage aus der Überschrift zu beantworten, müssen wir jedoch verschiedene Aspekte des Konstrukts „Validität“ auseinander halten. Zunächst kann man davon ausgehen, dass bei Intelligenztests im Allgemeinen die Augenscheinvalidität (auch Inhaltsvalidität genannt) gegeben ist. Diese bezieht sich allerdings nur auf die einzelnen Untertests und meint nicht mehr, als dass die Aufgaben offenbar das erfassen, was sie vorgeben zu erfassen – z.B. dass man bei Rechenaufgaben rechnen muss, dass Wortschatzaufgaben die Größe des Wortschatzes erfassen, etc. Allerdings muss man zugeben, dass diese Inhaltsvalidität bei komplexeren Aufgaben wie Matrizenergänzungen durchaus nicht so einfach zu beurteilen ist, weil die Frage nach den Prozessen, die zur Lösung der Aufgaben bewältigt werden müssen, so groß ist, dass sie ein eigenes Forschungsfeld darstellt.

Wenn man jedoch den gesamten Test heranzieht und sich fragt, ob dieser das Konstrukt „Intelligenz“ misst, ist die Antwort schon weniger eindeutig. Dafür, dass zumindest die meisten Intelligenztests annähernd dasselbe messen, sprechen die ziemlich hohen Korrelationen zwischen den Ergebnissen derselben Person in verschiedenen Intelligenztests. Dies bezeichnet man auch als diagnostische Validität. Und dafür, dass mit diesen Tests offenbar etwas gemessen wird, das Auswirkungen auf extrem viele andere Lebensbereiche (Berufserfolg, Gesundheit, etc.) hat, liegen ebenfalls zahlreiche Belege vor (prädiktive Validität). Mit anderen Worten: Irgendetwas muss ganz offensichtlich dran sein an diesem Konstrukt.

Es gibt aber natürlich auch jede Menge Kritik an der gesamten Intelligenzmessung. An dieser Stelle sei noch einmal deutlich betont, dass es sich, wie in Teil 1 beschrieben, bei Intelligenz lediglich um ein Konstrukt handelt – und nicht um eine vom Himmel gefallene und unumstößlich definierte Begebenheit. So wird von Kritikern z.B. eingeworfen, dass klassische Intelligenztests viele Aspekte gar nicht berücksichtigen, z.B. sozio-emotionale Kompetenzen. Zudem wird häufig angemerkt, dass Intelligenz auch die Aneignung von Fertigkeiten und Wissen im kulturellen Kontext bedeutet – was die Tests allesamt nicht erfassen.

Letztendlich handelt es sich bei der Frage, was Intelligenztests messen, also um eine, die die Wissenschaft nie endgültig wird beantworten können, weil dies unmöglich ist. Man kann als Fazit allerdings zweierlei festhalten: Dass Intelligenztests das messen, was sie vorgeben zu messen, scheint auf Basis der Befunde zur Inhalts-, diagnostischen und prädiktiven Validität sehr wahrscheinlich – ebenso wie dass dieses Konstrukt, wie auch immer man es nennen mag, offenbar große Auswirkungen auf unser Leben hat. Ob diese Tests aber tatsächlich Intelligenz messen, lässt sich nicht beantworten, da es sich hierbei um ein höchst unterschiedlich definiertes Konstrukt handelt.

Bleibt der IQ immer gleich? Die Frage nach der Stabilität.

Auch diese Frage hat wiederum zwei Facetten. Die erste ist die Frage, ob Intelligenztests zuverlässig messen, d.h. reliabel sind. Im Wesentlichen ist hiermit die Frage verknüpft, wie genau Intelligenztests messen. Nun, ein psychometrischer Test misst nicht so genau wie eine Waage, das ist klar. Aber die meisten Intelligenztests haben Reliabilitäten von über 0,90, was ziemlich gut ist. Am geläufigsten ist hierbei die so genannte Retest-Reliabilität, d.h. die Frage nach der Übereinstimmung der Testergebnisse, wenn Personen denselben Test zweimal hintereinander bearbeiten. Hierbei muss das Zeitintervall natürlich groß genug sein, um auszuschließen, dass die Person die richtigen Lösungen bei der Bearbeitung lediglich erinnert. Der zeitliche Abstand darf aber auch nicht zu lang sein, da es sonst möglich ist, dass eine große Abweichung der Testwerte darauf zurückgeht, dass die tatsächliche Intelligenzleistung der Person sich verändert hat (was besonders bei Kindern der Fall ist, die einen schnellen Zuwachs verzeichnen).

Die zweite Frage ist die, ob die Intelligenzleistung selbst stabil ist. Hier bietet die Forschungslage erfreulicherweise einen relativ eindeutigen Befund: Obwohl IQ-Werte auch tagesformabhängig sind (logisch, da man sich nicht immer gleich gut konzentrieren kann), sind die Fluktuationen ziemlich gering, und Intelligenz erweist sich insgesamt als ziemlich stabile Eigenschaft. Stabil meint hierbei allerdings nicht, dass immer gleich viele Punkte im selben Test erreicht werden, sondern dass eine Person im Vergleich zur alters- und geschlechtsspezifischen Normstichprobe gleich gut bleibt. Als Beispiel: Natürlich wird ein zehnjähriges Kind im HAWIK mehr Punkte erzielen als mit sechs Jahren, aber es behält trotzdem denselben IQ, weil es bei den beiden Messungen mit unterschiedlichen Normstichproben verglichen wird. Verschiedene Untersuchungen zeigen sogar eine erstaunliche Stabilität des IQ über sehr lange Zeitspannen: So ergab sich in einer Studie von Deary und Kollegen (2000) eine beachtliche Korrelation von 0,77 zwischen den IQ-Werten einer Stichprobe, die zum ersten Mal 1932 und zum zweiten Mal 1995 an demselben Test teilgenommen hatte.

Interessant ist diesbezüglich übrigens der sehr unterschiedliche Verlauf von fluider und kristalliner Intelligenz über die Lebensspanne. Studien aus diesem Bereich zeigen, dass, während die kristalline Intelligenz (im Wesentliches also erworbenes Wissen) im Laufe des Lebens zunimmt bzw. stagniert, die fluide Intelligenz (logisches Denken etc.) abnimmt. Neuere Untersuchungen zeigen jedoch, dass der Rückgang der fluiden Intelligenz auf etwas anderes zurückzuführen ist – nämlich auf die mit dem Alter geringer werdende Erfahrung mit den Aufgabenformaten typischer Intelligenztests, die stark an die von Schulaufgaben angelehnt sind. Insgesamt kann man also sagen: Intelligenz ist ziemlich stabil, aber eben nicht perfekt stabil. Und das liegt maßgeblich daran, dass wir entgegen der weitläufigen Meinung nicht mit einem festgelegten IQ geboren werden – was Thema des fünften Teils der Intelligenz-Reihe sein wird.

 © Christian Rupp 2014

Intelligenz – Teil 3: Warum man nicht nur einen IQ hat und wir lange Zeit immer schlauer wurden

Vorab: Was ist eigentlich „der IQ“?

Der so genannte Intelligenzquotient, kurz IQ, ist im Grunde schon der Schlüssel zu der Art und Weise, wie er berechnet wird – und doch wird diese Tatsache im alltäglichen Sprachgebrauch viel zu selten berücksichtigt. Ursprünglich erfolgte die Berechnung dieses Maßes für menschliche Intelligenz allerdings auf etwas andere Weise als heute. Geprägt wurde der Begriff des Intelligenzquotienten nämlich durch den Psychologen William Stern, der den von Alfred Binet geprägten Begriff des Intelligenzalters aufgriff und weiterentwickelte. Das Intelligenzalter ergibt sich nach Binet, grob gesagt, durch die Summe der gelösten Aufgaben in einem Intelligenztest. Aufschluss über die kognitive Leistungsfähigkeit gibt dann der Vergleich von Intelligenzalter und tatsächlichem Lebensalter: Wenn ein 8-jähriges Kind z.B. deutlich mehr (d.h. schwierigere) Aufgaben löst, als andere 8-jährige Kinder es im Durchschnitt tun, dann könnte sein Intelligenzalter z.B. 9,5 Jahre betragen – mit anderen Worten: Dieses Kind wäre in seiner kognitiven Entwicklung schon überdurchschnittlich weit fortgeschritten. William Stern setzte schließlich diese beiden Größen (also das Lebensalter und das Intelligenzalter nach Binet) einfach ins Verhältnis (bildete also einen Quotienten), multiplizierte sie mit dem Faktor 100 – und schon war der IQ geboren. Für unser Beispiel-Kind ergäbe sich somit ein IQ von (9,5/8)*100 = 118,75 (bzw. 119, da es aufgrund der nicht perfekten Reliabilität von Intelligenztests unüblich ist, IQ-Werte mit Nachkommastellen anzugeben).

Heutzutage berechnet man den IQ nicht mehr auf diese Weise, wenngleich das Grundprinzip der Berechnung erhalten geblieben ist: Weiterhin werden zwei verschiedene Werte miteinander ins Verhältnis gesetzt, weshalb der Begriff „Quotient“ auch heute noch gerechtfertigt ist. Dies ist mit einer ganz wichtigen Tatsache verbunden, die in der Öffentlichkeit und in den Medien leider so oft untergeht: Es gibt nicht den IQ, und es ist keineswegs so, dass ein Mensch genau einen IQ hat. Derartige Aussagen kann man guten Gewissens als Unsinn bezeichnen. In der Tat kann man einer jeden Person unzählige IQ-Werte zuweisen; aber um zu verstehen, warum das so ist, muss man sich vor Augen führen, wie der IQ berechnet wird.

Wie schon gesagt, basiert die IQ-Berechnung auf dem Bilden von Verhältnissen. Was wird nun ins Verhältnis gesetzt? Grob gesagt wird (egal mit welchem Intelligenztest) immer ein Rohwert zu einem bestimmten Mittelwert und einer Standardabweichung gesetzt. Der Rohwert meint meist die Anzahl der in einem Intelligenztest gelösten Aufgaben (was deshalb Sinn macht, weil fast alle diese Tests so aufgebaut sind, dass die Aufgaben im Verlauf immer schwieriger werden). Bei unserem Beispiel-Kind von oben könnten das z.B. 21 von 30 Aufgaben sein. So, dieser Rohwert sagt einem zunächst einmal gar nichts. Um an einen IQ-Wert zu gelangen, braucht man zusätzlich eine Normstichprobe, d.h. eine repräsentative Stichprobe anderer Menschen, mit der man das Kind nun vergleichen kann. Von dieser Normstichprobe braucht man zwei Informationen: den Mittelwert (d.h. die durchschnittliche Zahl der gelösten Aufgaben in dieser Gruppe von Menschen, hier z.B. 18,1) und die Standardabweichung (d.h. die „durchschnittliche“ Abweichung von diesem Mittelwert, z.B. 2,7). Nun muss die Zahl der von unserem Beispiel-Kind gelösten Aufgaben ins Verhältnis zu dieser Normstichprobe gesetzt werden . Hierzu berechnet man zunächst die Differenz zwischen dem Rohwert des Kindes und dem Mittelwert der Normstichprobe: 21-18,1 = 2,9. Dies ist die also die „Abweichung“ unseres Kindes vom Mittelwert der Normstichprobe – und diese muss man nun ins Verhältnis setzen zur „durchschnittlichen Abweichung“ vom Mittelwert der Normstichprobe (also deren Standardabweichung); d.h. man rechnet: 2,9/2,6 = 1,12. Man sagt: Das Kind liegt etwas mehr als eine Standardabweichung über dem Mittelwert der Normstichprobe. Nun fehlt nur noch die Umrechung in IQ-Werte. Hierzu nutzt man die Tatsache, dass IQ-Werte eine Art Maßzahl sind – deren Mittelwert und deren Standardabweichung festgelegt sind. D.h., man kann sie nutzen, um die Ergebnisse unterschiedlichster Tests (die alle andere Skalierungen verwenden), in ein und derselben Metrik anzugeben. Der Mittelwert des IQ ist auf 100 festgelegt, und die Standardabweichung auf einen Wert von 15. Um unserem Kind nun einen IQ-Wert zuweisen zu können, muss man nur noch den Wert 1,12 mit 15 multiplizieren und 100 addieren – und es ergibt sich ein IQ von 116,8 (bzw. 117).

Und schon hat man das, was in der Praxis meist noch in viel gravierender Form auftritt: Die beiden IQ-Werte (119 und 117) sind nicht gleich. Während es in unserem konstruierten Fall natürlich daran liegt, dass ich bei der obigen Berechnung die Werte ins Blaue hinein erfunden habe, liegt es in der Realität an einem anderen Faktor – nämlich an der Frage, welche Normstichprobe ich heranziehe, um die Person, deren IQ ich messen will, mit ihr zu vergleichen. Im Allgemeinen sollte man hierzu immer diejenige Normstichprobe wählen, die der Person bezüglich Alter und Geschlecht am ähnlichsten und zudem möglichst aktuell ist. Es finden sich aber auch noch feiner aufgegliederte Normen, z.B. auch bezüglich des Bildungsstands oder der besuchten Schulform. Ein IQ-Wert bedeutet immer nur, wie gut oder schlecht die Leistungen einer Person im Vergleich mit einer ihr möglichst ähnlichen Gruppe von Menschen sind. Und das ist genau der Grund, aus dem man für ein und denselben Menschen unzählige IQ-Werte berechnen kann – und ein IQ-Wert völlig ohne Aussage ist, solange man nicht mit angibt, zu welcher Normstichprobe man die Person ins Verhältnis gesetzt hat: Wenn der IQ unseres Kindes aus dem Vergleich mit einer Stichprobe Fünfjähriger resultiert, würde man den IQ von 118 nicht als besonders hoch einstufen; stammt er jedoch aus einem Vergleich mit einer Gruppe 16-Jähriger, kann man sich ziemlich sicher sein, dass das Kind wohl hochbegabt ist. Das ganze noch einmal in Kürze: Wenn jemand Ihnen das nächste Mal erzählt, er habe einen IQ von 150 – dann fragen Sie ihn doch bitte, aus dem Vergleich mit welcher Normstichprobe dieses Ergebnis resultiert.

Wie ist Intelligenz in der Menschheit verbreitet?

Wie oben bereits erwähnt, handelt es sich bei IQ-Werten um eine standardisierte Skala, auf der sich durch einfache Umrechnung alle möglichen Werte abbilden lassen, solange man die zwei wichtigen Angaben vorliegen hat: den Mittelwert und die Standardabweichung der betreffenden Stichprobe. Wann immer ich im Rest dieses Artikels von IQ-Werten spreche, bitte ich, dieses zu berücksichtigen.

Wie man aus zahlreichen Untersuchungen an großen repräsentativen Stichproben weiß, folgen IQ-Werte in der menschlichen Bevölkerung ziemlich genau einer so genannten Gauss’schen Normalverteilung (auch Gauss’sche Glockenkurve oder einfach kurz Normalverteilung genannt). Bei diesem Begriff handelt es sich im Grunde um eine Art „Etikett“, da es eine besondere Form von Verteilung bezeichnet, der (statistische) Werte (wie eben IQ-Werte) folgen können. Eine Normalverteilung lässt sich anhand zweiter Werte genau beschreiben, und zwar wiederum anhand des Mittelwertes und der Standardabweichung, die maßgeblich die Form der Kurve beeinflussen. Was ich im vergangenen Abschnitt noch verschwiegen habe, ist der sehr wichtige Umstand, dass die Tatsache, dass IQ-Werte einer solchen Normalverteilung folgen, einen ganz entscheidenden Vorteil mit sich bringt: nämlich den, dass die Berechnungen und Umrechnungen, die ich oben dargestellt habe, dadurch überhaupt erst mathematisch zulässig sind. Würden IQ-Werte keiner Normalverteilung folgen, hätten wir es um einiges schwieriger. So jedoch lässt sich (wie oben schon erwähnt) guten Gewissens sagen: IQ-Werte haben in der menschlichen Bevölkerung einen Mittelwert von 100 und eine Standardabweichung von 15. Um das ganze einmal ein bisschen plakativer zu machen, habe ich einmal eine entsprechende Abbildung gebastelt.

Verteilung des IQ in der Bevölkerung
Verteilung des IQ in der Bevölkerung

Um diese Glockenkurve nun zu verstehen, ist es wichtig, dass man nicht versucht, die y-Achse zu interpretieren (weshalb ich sie auch weggelassen habe). Mathematisch betrachtet handelt es sich bei dieser Kurve um eine Dichte-Funktion, d.h. auf der y-Achse ist die schwer interpretierbare Dichte abgetragen. Man darf und kann diese Kurve daher nicht direkt so lesen, dass sie einem Aufschluss darüber gibt, wie vielen Prozent der Menschen welcher IQ-Wert zugordnet ist (das geht daher nicht, weil die Intelligenz hier mathematisch als stetiges Merkmal konzipiert ist – aber nun genug mit dem statistischen Wirrwarr).

Sinnvoll interpretierbar ist hingegen das Integral, also die Fläche unter der Glockenkurve. Mit deren Hilfe kann man zumindest Aussagen darüber treffen, wie viele IQ-Werte sich in einem bestimmten Bereich bewegen. So liegen z.B. im Bereich einer Standardabweichung unter- und überhalb vom Mittelwert von 100 (also zwischen den IQ-Werten von 85 und 115) rund 68% aller IQ-Werte, und somit auch aller Menschen. Zwischen 70 und 130 liegen derweil z.B. rund 95% aller Werte, d.h. es liegen nur 2,5% unter 70 und 2,5% über 130. Als Konvention hat sich daher eingebürgert, alle IQ-Werte zwischen 85 und 115 als „durchschnittlich“ zu bezeichnen, Werte zwischen 70 und 85 als „niedrig“ und Werte zwischen 115 und 130 als „hoch“. „Hochintelligent“ ist daher streng genommen etwas anderes als „hochbegabt“, was sich als Begriff für IQ-Werte über 130 etabliert hat. Zur Erinnerung: Diese Menschen liegen bzgl. ihrer kognitiven Leistungen mehr als zwei Standardabweichungen über dem Mittelwert ihrer (hoffentlich) alters- und geschlechtsspezifischen Normstichprobe. Ähnliches gilt in umgekehrter Richtung für IQ-Werte unter 70. Hier bewegen wir uns (allerdings noch mit bedeutenden Abstufungen!) im Bereich der geistigen Behinderung (für deren Definition vorrangig der IQ herangezogen wird). Diese praktischen Prozentangaben haben einen weiteren Vorteil: Man kann jedem IQ-Wert einen Prozentrang zuweisen und somit z.B. Aussagen der Sorte „besser als 84% aller Mitglieder der Normstichprobe“ (bei einem IQ von 115) treffen. Um zu der Anmerkung von vorhin zurückzukommen: Ein IQ von 150 würde bedeuten, dass 99,96% der Menschen in der Normstrichprobe (und somit gewissermaßen auch in der Bevölkerung, für die die Normstichprobe ja repräsentativ sein soll) einen niedrigeren Wert aufweisen: Und das ist, wie sie auch an der Abbildung sehen können, hochgradig unwahrscheinlich – mal davon abgesehen, dass kein Intelligenztest einen so hohen Wert vernünftig messen kann (Thema des nächsten Artikels).

Exkurs: Männer & Frauen

Ein ganz heikles Thema ist es natürlich, ob nun Männer oder Frauen im Durchschnitt intelligenter sind. Der mir bekannte aktuelle Forschungsstand hierzu ist der, dass es – bezüglich der allgemeinen Intelligenz – einen marginalen Unterschied dahingehend gibt, dass Männer ein paar wenige IQ-Punkte vorne liegen, gleichzeitig aber die Varianz bei Männern höher ist: Sowohl in den sehr hohen als auch in den sehr niedrigen IQ-Bereichen überwiegen Männer. Dazu sei noch gesagt, dass dieser Unterschied durch zwei Aspekte an Bedeutung verliert: Zum einen ist die Varianz innerhalb jeder der beiden Gruppen um ein Vielfaches größer als der Unterschied zwischen den Gruppen, und zum anderen ist es gut möglich, dass jener Unterschied dadurch zustande gekommen ist, dass viele Intelligenztests bestimmte Aufgaben in den Vordergrund stellen, die Männer bevorteilen. Denn was als gut gesichert gilt, ist, dass Männer und Frauen sich deutlich hinsichtlich ihrer kognitiven Stärken und Schwächen unterscheiden: Es gilt als sehr robuster Befund, dass Männer z.B. im Mittel besser im visuell-räumlichen Denken abschneiden als Frauen, die wiederum im Durchschnitt die Nase vorn haben, was die verbale Intelligenz betrifft.

Der Flynn-Effekt: Wird die Menschheit wirklich immer intelligenter?

Eine andere Fragestellung ist die, ob der durchschnittliche IQ der Menschheit tatsächlich zunimmt – ein Phänomen, das in Anlehnung an den neuseeländischen Politologen James R. Flynn als Flynn-Effekt bezeichnet wird. Dieser Fragestellung auf den Grund zu gehen, ist aufgrund der beschriebenen Berechnungsweise des IQ gar nicht so einfach – denn um herauszufinden, ob der IQ im Mittel steigt, darf man Menschen eben nicht mit aktuellen Normstichproben vergleichen, sondern muss ältere heranziehen: Nur so kommt man dem Flynn-Effekt auf die Schliche.

In der Tat haben groß angelegte Studien ergeben, dass der mittlere IQ in der westlichen Bevölkerung zwischen den 1930er und den 1990er Jahren um 0,2 – 0,5 Punkte pro Jahr gestiegen ist. Dieser Anstieg ergibt sich natürlich aus dem Vergleich mit den immer gleichen Normen aus den 1930er Jahren – anders wäre ein Anstieg ja gar nicht messbar. Dabei nahmen die Leistungen in nicht-sprachlichen Tests (die vor allem fluide Intelligenz messen) deutlich stärker zu als die in sprachlich basierten Tests (die vor allem kristalline Intelligenz messen). Für diesen Befund wurden diverse Erklärungshypothesen diskutiert, die im Folgenden kurz angeschnitten werden sollen.

Dauer des Schulbesuchs und Erfahrung mit typischen Intelligenztestaufgaben

In der Tat nahm die durchschnittliche Dauer des Schulbesuchs in dieser Zeit deutlich zu – was deshalb wichtig ist, weil somit auch die Erfahrung und die Geübtheit im systematischen Lösen von schulischen Aufgaben zunahm, die typischen Intelligenztests sehr ähnlich sind. Der Anteil dieser Faktoren am Flynn-Effekt ist jedoch eher als gering zu einzustufen.

Erziehungsstil

Weiterhin wurde in den Raum geworfen, dass der typische elterliche Erziehungsstil in dieser Zeitspanne natürlich auch einem erheblichen Wandel unterlegen war. Konkret wird von den Vetretern dieser Hypothese angeführt, dass von Eltern zunehmend Wert darauf gelegt wurde, ihre Kinder schon früh in ihrer kognitiven Entwicklung zu fördern. Dieser Trend fand aber nicht nur im familiären Rahmen, sondern auch in viel größerem Maße in den Medien (Beispiel „Sesamstraße“) und in der Politik statt. Die Befunde hierzu sind widersprüchlich. Während man weiß, dass große, national initiierte Bildungsprogramme eher keine Wirksamkeit bezüglich der Erhöhung des durchschnittlichen IQs vorweisen können, wirkt sich frühe Förderung auf der individuellen Ebene durchaus positiv auf die kognitive Entwicklung aus.

Weniger Fälle geistiger Behinderung

Zu bedenken ist sicherlich auch, dass aufgrund besserer medizinischer Versorgung die Zahl der mit geistigen Behinderungen geborenen Kinder in der beschriebenen Zeitspanne zurückgegangen ist. Einige Studien hierzu messen diesem Aspekt im Hinblick auf den Flynn-Effekt eine zentrale Bedeutung bei: Durch den überproportionalen Wegfall sehr niedriger IQ-Werte (<70) in der Bevölkerung stieg der durchschnittliche IQ im Mittel an.

Ernährung

Es ist gut belegt, dass bessere Ernährung (z.B. vitaminreiche Kost, weniger Schadstoffe, etc.) die geistige Entwicklung von Kindern positiv beeinflusst. Durch ungesunde Ernährung kann es z.B. zu Schilddrüsenunterfunktionen kommen (gekennzeichnet durch einen Mangel an Triiodthyroxin und Triiodthyronin), die dann wiederum eine Verzögerung der geistigen Entwicklung bedingen können, sodass der mittlere IQ infolgedessen gestiegen sein könnte.

Vermutlich ist es tatsächlich nicht einer dieser Faktoren, die den Flynn-Effekt erklären, sondern ihr Zusammenspiel. Interessanterweise ist es derweil übrigens so, dass der Anstieg des mittleren IQ seit Anfang der 1990er Jahre als „gestoppt“ gilt, sodass man zumindest momentan sagen kann, dass der Flynn-Effekt der Vergangenheit angehört. Manche deuten dies als Beleg für die Richtigkeit der Ernährungshypothese (da die Nahrungsversorgung in der westlichen Gesellschaft gewissermaßen nicht noch viel besser werden kann), ich jedoch würde eher sagen, dass diese Tatsache der „Sättigung“ in entsprechender Weise auf alle Erklärungsansätze zutrifft.

In diesem Artikel habe ich mehrfach schon das Thema der Intelligenzmessung gestreift. Ob, wie – und vor allem – wie genau man die Intelligenz eines Menschen tatsächlich messen kann, wird daher der Inhalt des nächsten Artikels sein.

© Christian Rupp 2014

Intelligenz – Teil 2: Die Sicht der wissenschaftlichen Psychologie

Nachdem ich im ersten Artikel zum Thema „Intelligenz“ versucht habe, zu beschreiben, wie die Definition des Konstrukts „Intelligenz“ von Kultur zu Kultur schwankt, soll es in diesem Beitrag nun darum gehen, wie die wissenschaftliche Psychologie die Intelligenz betrachtet und wie sehr auch unter den Experten auf diesem Gebiet die Meinungen hierüber auseinander gehen.

Die Intelligenzforschung nahm ihren Anfang in den ersten Jahrzehnten des 20. Jahrhunderts, initiiert durch Charles Spearman, den ersten Psychologen, der sich der Erforschung dieses Kontrukts widmete. Er war es auch, der das erste Intelligenzmodell formulierte, welches heutzutage unter dem Begriff der „Zweifaktorentheorie der Intelligenz“ bekannt ist. Dieses Modell basiert, wie fast alle anderen Modelle, die im Übrigen grundsätzlich auf Spearmans Modell aufbauen, auf dem Prinzip der Faktorenanalyse, d.h. auf einem statistischen Verfahren, mit dessen Hilfe man anhand typischer Muster von häufig gemeinsam gelösten und gemeinsam nicht gelösten Aufgaben Rückschlüsse über die Formen von Intelligenz ziehen kann, die von einer Gruppe ähnlicher Aufgaben erfordert werden und somit unterschiedliche Subtypen von Intelligenz darstellen.

Nun hat die Faktorenanalyse aber den Nachteil, dass die Ergebnisse, die sie liefert (die so genannte Faktorstruktur) dem Wissenschaftler enorm viel Interpretationsspielraum lassen und man aus dem gleichen statistischen Ergebnis unterschiedliche Modelle über die Struktur der Intelligenz, d.h. ihre verschiedenen Unterformen, ableiten kann. Das Ergebnis sind unterschiedliche hierarchische Modelle, die die sich allem voran in einem ganz wesentlichen Punkt unterscheiden, und zwar der Frage, ob es einen allgemeinen, allen anderen intellektuellen Fähigkeiten übergeordneten, Generalfaktor der Intelligenz (auch g-Faktor oder einfach nur g genannt) gibt – oder ob die verschiedenen Formen der Intelligenz doch voneinander unabhängig sind. Dies hat für die Praxis sehr weitreichende Folgen, hängt es doch genau von dieser Frage ab, ob wir uns bei der Messung der Intelligenz auf einen einzelnen Wert beschränken können oder ob wir differenzierter vorgehen müssen. Auf der zweiten Ebene spaltet die allgemeine Intelligenz sich in einige wenige Unterfaktoren auf, die zumindest teilweise voneinander unabhängig sind, aber dennoch beide auch mit g zusammenhängen. Auf der dritten Ebene gliedern sich diese Unterfaktoren dann wiederum in spezifische intellektuelle Fähigkeiten wie z.B. Wortgewandtheit und logisches Schlussfolgern auf. Damit Ihnen die Vorstellung dieser (immer sehr ähnlich aufgebauten) hierarchischen Modelle etwas leichter fällt, habe ich in der unten stehenden Abbildung einmal selbst ein beispielhaftes Modell erstellt, von dem ich behaupten würde, dass es zwar vereinfacht ist, aber in vielerlei Hinsicht einen derzeit weit verbreiteten Konsens darstellt, nämlich die Annahme eines gewissen g-Faktors, eine Unterscheidung zwischen fluider und kristalliner Intelligenz auf der zweiten Ebene sowie einige typische, diesen beiden Faktoren wiederum unterordnete Subformen intellektueller/kognitiver Fähigkeiten. Worauf die einzelnen Komponenten dieses beispielhaften Modells jeweils zurückgehen, erfahren Sie in den nächsten Abschnitten.

Beispiel für ein hierarchisches Modell
Beispiel für ein hierarchisches Modell

 

Spearman: G thront über allem

Das von Spearman entwickelte Modell ist sowohl das allerälteste als auch dasjenige, das den Begriff des g-Faktors bzw. der „Allgemeinen Intelligenz“ geprägt hat. Spearman interpretierte die aus der Faktorenanalyse resultierenden hohen Korrelationen (= statistische Zusammenhänge) zwischen den Lösungsmustern unterschiedlichster Aufgaben derart, dass es einen solchen Generalfaktor der Intelligenz geben müsse, da, grob gesagt, Personen, die in einem Aufgabenbereich (z.B. räumliches Denken) gut abschnitten, tendenziell auch in anderen Bereichen (z.B. Wortschatz und logisches Schlussfolgern) gute Ergebnisse erzielten. Dieser Generalfaktor, so Spearman, sei die Grundlage aller Leistungen in Intelligenztests, und er beschreibt ihn als die „Fähigkeit, Zusammenhänge wahrzunehmen und daraus Schlüsse zu ziehen“ – kurz: als „mentale Energie“. G untergeordnet sind im Spearman-Modell nur die „spezifischen Fähigkeiten“, die mit s bezeichnet werden und sprachliche, mathematische und räumliche Intelligenz umfassen. D.h. es gibt im Gegensatz zum oben skizzierten Beispielmodell keinerlei mittlere Ebene.

Auf Spearmans Modell basieren mehrere Intelligenztests, die auch heute noch weit verbreitet sind. Man erkennt diese Tests daran, dass sie am Ende die Berechnung eines Intelligenzquotienten ermöglichen, der als Index für das Niveau der Allgemeinen Intelligenz herangezogen wird. Hierzu gehören z.B. alle Tests aus der Wechsler-Reihe (die aktuellsten sind der Wechsler Intelligenztest für Erwachsene, kurz WIE, und der Hamburg Wechsler Intelligenztest für Kinder in seiner 4. Ausgabe, kurz HAWIK-IV) sowie die Raven-Tests, die nur aus Matrizen-Aufgaben („Welches Bild gehört in das leere Kästchen?“) bestehen und zum Ziel haben, unabhängig von Sprache und Kultur abstraktes, nicht angewandtes Denken zu erfassen.

Abgrenzung von Spearman: Thurstone & Cattell

Im Verlauf des 20. Jahrhunderts wurde dann von anderen Psychologen eine Fülle weiterer, meist auf Faktorenanalysen und ihrer Interpretation basierender Intelligenzmodelle entwickelt, die sich, wenn man einmal ehrlich ist, nicht wirklich exorbitant voneinander unterscheiden. Dies hat sicherlich auch damit zu tun, dass sie fast ausnahmslos in Abgrenzung vom Spearman-Modell enstanden sind und sich somit alle in irgendeiner Form hierauf beziehen. Der zweite Grund ist der, dass man in der Wissenschaft leider auch nicht ständig das Rad neu erfinden kann.

Das Primärfaktorenmodell nach Thurstone: Ebenbürtiges Nebeneinander?

Anders als Spearman betrachtete Louis Leon Thurstone die Intelligenz als eine Sammlung von sieben klar voneinander angrenzbaren, also unabhängigen Intelligenzarten. Diese sieben Primärfaktoren sind: Rechenfähigkeit, Auffassungsgeschwindigkeit, schlussfolgerndes Denken, räumliches Vorstellungsvermögen, assoziatives Gedächtnis, Sprachbeherrschung und Wortflüssigkeit. Widergespiegelt wird dies durch den bekannten Intelligenz-Struktur-Test, kurz IST-2000-R, in dem eben nicht ein IQ-Wert am Ende berechnet wird, sondern mehrere. Kritisch an diesem Modell ist anzumerken, dass Thurstone bei seinen Faktorenanalysen in den Augen einiger Wissenschaftler etwas „gepfuscht“ hat, da er anstatt einer orthogonalen eine oblique Faktorenrotation verwendete – mit dem Ergebnis, dass seine sieben Primärfaktoren leider doch nicht völlig unabhängig voneinander sind. Thurstone räumte tatsächlich später ein, dass diese Kritik berechtigt sei, und erkannte einen gewissen g-Faktor als mögliche Ursache dieser Zusammenhänge an.

Die Zweikomponententheorie nach Cattell: Einführung einer mittleren Ebene

Raymond Bernard Cattell hingegen nahm von vornherein einen g-Faktor als oberste Instanz in seinem Intelligenzmodell an, war zugleich aber der erste, der eine mittlere Ebene (wie im obigen Beispielmodell gezeigt) einführte. Auf ihn geht die bis heute weit etablierte und bewährte Unterscheidung zwischen kristalliner (meist abgekürzt c) und fluider Intelligenz (meist abgekürzt f) zurück, in die sich im zufolge die Allgemeine Intelligenz aufspaltet. Unter der fluiden Intelligenz versteht Cattell eine generelle Denk- und Problemlösefähigkeit, die er als weitgehend unabhängig von kulturellen Einflüssen versteht und die eine wichtige Voraussetzung für den Erwerb neuer Informationen darstellt. Nach Cattell ist die fluide Intelligenz ein angeborenes Merkmal, die sich im Laufe des Lebens stabilisiert oder sogar gegen Ende stagniert. Gegenteilig hierzu verhält sich die bis zum Lebensende stetig anwachsende kristalline Intelligenz, die als kumulative Lebenserfahrung zu sehen ist. Dies deutet bereits darauf hin, dass diese sämtliches im Laufe des Lebens erworbenes Wissen, erworbene Fertigkeiten und Kompetenzen umfasst. Diese erachtet Cattell als stark von kulturellen Einflüssen geprägtes und maßgeblich von sprachlichen Fähigkeiten bestimmtes Konstrukt. Fluide und kristalline Intelligenz sind somit, wie es typisch für Elemente der mittleren Ebene ist, insofern nicht gänzlich unabhängig voneinander, als sie durch die „gemeinsame Mutter“ g verbunden sind, und gleichzeitig ist ihr Zusammenhang hinreichend gering, um sie als zwei separate Unterfaktoren zu betrachten. Dabei wird übrigens durchaus angenommen, dass c und f auf vielfältige Weise interagieren: Zum Beispiel wird davon ausgegangen, dass eine gut ausgeprägte fluide Intelligenz den Erwerb von kritalliner Intelligenz in Form von Wissen und Fertigkeiten erleichtert. Cattells Modell ähnelt sehr stark dem von John B. Carroll. Da letzteres keinen meiner Meinung nach wesentlichen Unterschied aufweist, werde ich es an dieser Stelle nicht gesondert beschreiben.

Auch Cattells Theorie ist in die Entwicklung von Intelligenztests eingeflossen. So findet sich (wenn auch nicht explizit so bezeichnet) die Unterteilung in f und c auch im IST-2000-R wieder. Die Tests aus der Wechsler-Serie erfassen typischerweise leicht überwiegend kristalline Intelligenz, während die ebenfalls bereits erwähnten Raven-Tests, ebenso wie die so genannten Culture Fair Tests (kurz CFTs), hauptsächlich fluide Intelligenz messen, um ausdrücklich kulturelle Unterschiede außen vor zu lassen und diesem Sinne „fair“ zu sein.

Nicht-hierarchische Modelle

Neben den hierarchischen Modellen gibt es auch noch ein paar Vertreter, die von verschiedenen Intelligenzformen ausgehen, die unabhängig und sozusagen „gleichberechtigt“ nebeneinander stehen, ohne dass es einen übergeordneten g-Faktor oder untergeordnete Fähigkeiten gäbe. Im Grunde hätte ich an dieser Stelle auch das Primärfaktorenmodell von Thurstone anführen können; da Thurstone aber im Nachhinein einen g-Faktor doch mehr oder weniger eingeräumt hat, findet es sich bei den hierarchischen Modellen.

Mehrdimensionale Modelle: Inhalt, Prozess & Co.

Zu den im Vergleich zu den hierarchischen Modellen fast schon exotisch anmutenden mehrdimensionalen Modellen gehören das Würfelmodell nach Guilford und das Berliner Intelligenzstrukturmodell nach Jäger. Beiden Modellen gemeinsam ist, dass sich eine sehr große Menge unterschiedlicher „Intelligenzen“ ergeben, und zwar als Produkt einiger weniger Faktoren, die unterschiedliche Ausprägungen aufweisen können. Dabei beruhen auch diese Modelle auf Faktorenanalysen und sind somit ein anschaulicher Beleg dafür, auf welch unterschiedliche Weise man die im Prinzip gleiche Datenlage interpretieren kann.

Im Würfelmodell ist es so, dass sich 150 verschiedene Intelligenzarten als Produkt drei verschiedener Faktoren mit wiederum verschiedenen Ausprägungen ergeben. Unter diesen drei Faktoren versteht Guilford den zu verarbeitenden Inhalt (z.B. akustische Reize), den nötigen Vorgang (z.B. Auswertung der akustischen Reize) und das Produkt (z.B. Herausstellung der Implikationen). Das klingt sehr abtrakt, komplex und schwer überprüfbar, was es auch tatsächlich ist. Ähnliches gilt für das Berliner Intelligenzstrukturmodell, bei dem es im Gegensatz zum Würfelmodell nur zwei Faktoren gibt. Zum einen führt Jäger den Faktor „Operationen“ an, als dessen mögliche Ausprägungen er Merkfähigkeit, Bearbeitungsgeschwindigkeit, Einfallsreichtum und Verarbeitungskapazität anführt. Zum anderen gibt es den Faktor „Inhalte“ mit drei Varianten, und zwar bildhaftem, verbalem und numerischem Material. Insgesamt ergeben sich hieraus also 3×4=12 verschiedene Intelligenzformen, abhängig von der Art des zu bearbeitenden Materials und der Art der geforderten mentalen Operation. Jägers Modell enthält daneben übrigens auch noch einen g-Faktor, der in gewisser Weise allen Faktoren und ihren Ausprägungen gleichsam zugrunde liegt.

Die praktische Anwendung dieser Form von Modellen ist schwieriger als bei den oben beschriebenen Modellen, da, wenn man die Modelle ernst nimmt, für alle möglichen Kombinationen von Faktorausprägungen eine geeignete Aufgabe finden muss. Zwar hat Guilford für den Großteil der in seinem Modell postulierten Intelligenzfacetten inzwischen Aufgabentypen vorgeschlagen, dass diese jedoch in einen standardisierten Intelligenztest übertragen wurden, ist mir nicht bekannt. Anders sieht es mit dem (ja doch deutlich sparsameren) Jäger-Modell aus, welches in Form des Berliner Intelligenzstruktur-Tests (kurz BIS) Anwendung findet.

Gardners Theorie der Multiplen Intelligenzen: Ein Plädoyer gegen G

In den 1980er Jahren veröffentlichte Howard Gardner seine Theorie der Multiplen Intelligenzen und wetterte gewaltig gegen das Konzept der Allgemeinen Intelligenz bzw. den g-Faktor. Er argumentierte, dass klassische Intelligenztests nicht imstande wären, die Fülle an kognitiven Fähigkeiten, über die ein Mensch verfügen kann, zu erfassen, und schlug ein Modell mit sieben voneinander unabhängigen und nicht durch einen übergeordneten g-Faktor bestimmten Intelligenzfacetten vor. An diesem, ebenfalls auf Faktorenanalysen basierenden Modell ist, neben der Tatsache, dass die Unabhängigkeit der Intelligenzfacetten nicht belegt ist, zu kritisieren, dass es eine große Überlappung mit dem (lange vorher veröffentlichten) Thurstone-Modell aufweist (allein schon, was die Zahl der Faktoren angeht). So finden sich bei Gardner u.a. auch die logisch-mathematische, die sprachliche und die bildlich-räumliche Intelligenz. Neu sind allerdings vier Faktoren, die eher den Fokus auf künstlerische und sozio-emotionale Fähigkeiten legen, nämlich die musikalisch-rhythmische, die körperlich-kinästhetische (Einsatz des eigenen Körpers), die interpersonale (Verstehen von und Umgang mit anderen Menschen) und die intrapersonale Intelligenz (Verständnis seinerselbst). Insbesondere die letzten beiden Intelligenzarten sind in der Psychologie inzwischen anerkannte Konstrukte, werden jedoch eher nicht direkt als Form von Intelligenz betrachtet, sondern unter dem Begriff „sozio-emotionale Kompetenz“ zusammengefasst (im Volksmund und in Klatschzeitschriften erfreuen sich allerdings die Begriffe „emotionale Intelligenz“ und „soziale Intelligenz“ allerdings weiter Verbreitung) und als etwas erachtet, das in der Regel in der Kindheit und in der Interaktion mit anderen Menschen erworben wird und eher nicht angeboren ist. Zu diesem Konstrukt gehören z.B. u.a. die Fähigkeit, die Perspektive anderer einzunehmen (Theory of Mind), die Fähigkeit, die emotionale Lage anderer nachzuempfinden (Empathie), das Bewusstsein über eigene emotionale Vorgänge, Wege der Emotionsäußerung und das Bewusstsein über die Wirkung der eigenen Emotionen auf andere sowie die Fähigkeit zur Regulation der eigenen Emotionen.

Sternbergs Triarchisches Modell: Radikale Abkehr vom Hierarchie-Gedanken?

Das von Robert Sternberg postulierte Triarchische Modell, auch bekannt unter dem Namen Komponentenmodell, basiert auf der Informationsverarbeitungstheorie, die, grob gesagt, die menschliche Kognition als Informationsverarbeitungsprozess betrachtet, und gibt vor, eine radikale Abkehr von hierarchischen Strukturen und der Annahme voneinander abgrenzbarer Faktoren darzustellen. Es ist daher auch das einzige bekannte Intelligenzmodell, das nicht auf Faktorenanalysen beruht. Sternberg prägte hiermit auch eine neuartige Definition von Intelligenz und nannte als Teile der Definition die Elemente „Lernen aus Erfahrung“, „abstraktes Schlussfolgern“, „die Fähigkeit, sich einer sich ständig weiterentwickelnden und verändernden Umwelt anzupassen“ und „die Motivation, überhaupt neues Wissen bzw. Fertigkeiten zu erlangen“. Die ersten beiden Aspekte überlappen stark mit der kristallinen und der fluiden Intelligenz, die beiden letzten hingegen sind in der Tat relativ neu und haben bisher kaum Eingang in die Messung von Intelligenz gefunden.

Die eigentliche Intelligenztheorie von Sternberg ist hingegen sehr komplex und meiner Ansicht alles andere als leicht verständlich. Ich wage auch, die kühne Behauptung aufzustellen, dass sich diese Theorie kaum prägnant zusammenfassen lässt, weil sie sich teilweise in Einzelheiten verliert. Daher möchte ich mich darauf beschränken, einige meiner Meinung nach wichtige Teilaspekte der Theorie herauszustellen. Zunächst wird, abgeleitet von der Informationsverarbeitungstheorie, die wichtige Unterscheidung getroffen zwischen der Art des ablaufenden kognitiven Prozesses, der Genauigkeit, mit dem dieser abläuft, und der Art der mentalen Repräsentation, die diesem Prozess zugrunde liegt (z.B. bildliches oder sprachliches Material). Insofern erinnert es es schon an dieser Stelle stark an die oben beschriebenen mehrdimensionalen Modelle. Dann verliert sich die Theorie (meiner Auffassung nach) in mehr und mehr Unter-Theorien, die einen eher geringen Erklärungswert haben und darüber hinaus mehr Ähnlichkeit mit den bereits beschriebenen Modellen haben, als man eigentlich aufgrund der revolutionären Aura der Theorie erwarten würde. Wirklich eingängig ist mir lediglich die „Komponenten-Subtheorie“, die drei Intelligenzkomponenten beschreibt und im Gegensatz zum Rest relativ anschaulich ist. Und zwar stellt Sternberg hier die analytische Intelligenz (abstrakte Denkprozesse, die einer Problemlösung vorausgehen), die praktische Intelligenz (Lösung von Problemen durch Anpassung an die Umwelt, Formung einer Umwelt oder Auswahl einer passenden Umwelt) und die kreative Intelligenz (Nutzen von Erfahrungen zur Lösung von Problemen) dar. Diese, so Sternberg, seien aber nicht in ein hierarchisches System eingebunden und stellten auch keinerlei Intelligenzfaktoren im klassischen Sinne dar – vielmehr seien sie eine Beschreibung dessen, was die Intelligenz leisten muss. Was genau er damit meint, und in wiefern dieser Gedanke sich wirklich von den beschriebenen hierarchischen oder mehrdimensionalen Modellen unterscheidet, bleibt zumindest mir unklar. Fest steht, dass Sternberg keinen g-Faktor anerkennt – doch dies allein ist, wie ich ausführlich dargestellt habe, nichts Revolutionäres.

Fazit

Was ich hoffe, vermittelt zu haben, ist, dass es derzeit kein allgemeingültiges und eindeutiges Verständnis dessen gibt, was „Intelligenz“ ist, in wie vielen verschiedenen Formen sie vorliegt und ob es einen allem übergeordneten g-Faktor gibt. Wenn man sich die empirische Evidenz anschaut, muss man allerdings zugeben, dass die Existenz einer Allgemeinen Intelligenz bzw. eines solchen g-Faktors sehr wahrscheinlich ist, da sich die starken Zusammenhänge zwischen unterschiedlichsten Intelligenztestaufgaben nicht einfach so wegdiskutieren lassen. Weitere Evidenz für dieses Konstrukt der Allgemeinen Intelligenz findet sich übrigens auch aus der Anwendungsforschung, z.B. aus der Arbeits- und Organisationspsychologie, die ergeben hat, dass die Allgemeine Intelligenz mit Abstand der bester Prädiktor von Berufserfolg ist (Näheres dazu hier). Andererseits gibt es auch Belege, die deutlich zeigen, dass sich mit g auch nicht alles erklären lässt und eine Unterteilung auf unterer Ebene durchaus Sinn macht – so gilt die Unterscheidung zwischen kristalliner und fluider Intelligenz z.B. als gut belegt.

Für mich persönlich bedeutet dies, dass die „Wahrheit“ (sollte es diese denn geben) am ehesten durch ein Modell abgebildet wird, das dem von Cattell bzw. Carroll ähnelt – vom Konzept also einem solchen, wie Sie es in der obigen Abbildung finden. Bedenken Sie aber, dass all diese Modelle im Wesentlichen unterschiedliche Interpretationen der weitgehend gleichen Sachlage sind und somit automatisch auch von der jeweiligen Ideologie geprägt sind, die ein Forscher vertritt (z.B. bzgl. der Frage, ob es einen g-Faktor geben darf). Und nicht zu vergessen ist auch, dass die Modelle sich, wenngleich sie sich alle natürlich als neuartig und daher wichtig darstellen, im Grunde nicht besonders stark unterscheiden – wenn man einmal genau nachdenkt.

Im nächsten Teil wird es um die Fragen gehen, was es mit dem Intelligenzquotienten auf sich hat, wie Intelligenz in der Bevölkerung verteilt ist und ob es stimmt, dass wir immer intelligenter werden.

© Christian Rupp 2014

Jenseits psychischer Störungen: Wo Psychologen sich sonst noch überall auskennen

Im vorherigen Artikel habe ich dargestellt, warum Psychologen ebenso wie Physiker, Chemiker, Biologen oder Soziologen Ahnung davon haben, wie man (Natur-)Wissenschaft betreibt und daraus abgeleitetes Wissen dahingehend beurteilen kann, ob es vertrauenswürdig ist oder nicht. In diesem Artikel soll es nun darum gehen, wovon Psychologen neben ihrer wissenschaftlichen Kompetenz sonst noch so Ahnung haben und in welche beruflichen Bereiche verschiedene Schwerpunktsetzungen und Spezialisierungen führen können. Dabei nutze ich diesen Artikel ganz bewusst, um all die Bereiche vorzustellen, die nichts direkt mit psychischen Störungen zu tun haben (was ja leider die verbreitete Auffassung über den Inhalt des Psychologiestudiums ist). Die Klinische Psychologie werde ich daher gesondert im nächsten Artikel vorstellen und diese Gelegenheit nutzen, um endlich das größte Irrtum überhaupt aufzuklären. Aber nun zurück zu den vielen anderen Unterbereichen der Psychologie, bei deren Darstellung ich mich in etwa an die Reihenfolge im Studium halten und mich von den Grundlagen- zu den Anwendungsfächern bewegen werde.

Allgemeine Psychologie & Kognitive Neurowissenschaft

Dieses Grundlagenfach mit dem Doppelnamen, unter das ich die Fächer „Biologische Psychologie“ und „Physiologie“ einmal subsumieren möchte, betrachtet den Menschen als Wesen, das Informationen aus seiner Umwelt verarbeitet und interessiert sich im Groben für die Art und Weise, wie diese Informationsverarbeitungsprozesse im Gehirn ablaufen. Daher gehört hierzu als Thema zu allererst die Wahrnehmung – von unseren Sinnesorganen bis zu den höchsten Verarbeitungsstufen im Gehirn. Dabei stößt man dann z.B. auf Gehirnareale, die auf die Verarbeitung von Gesichtern oder Schachmustern spezialisiert sind oder erfährt etwas über spezielle, auf Hirnschäden zurückgehende Störungen der Wahrnehmung, wie z.B. die Prosopagnosie – die Unfähigkeit, Gesichter wahrzunehmen und zu unterscheiden (wobei die visuelle Verarbeitung ansonsten völlig intakt ist). Eine weitere wichtige Sparte in diesem Fach ist das Gedächtnis. So lernt man im Studium beispielsweise Modelle über den Aufbau und die Funktionsweisen der verschiedenen Teile unseres Gedächtnisses (u.a. Arbeitsgedächtnis & Langzeitgedächtnis) kennen, ebenso wie natürlich die dazu gehörigen Forschungsmethoden und Störungen des Gedächtnisses (Amnesien und Demenzen). Eine Studie, die sich mit den dem Gedächtnis zugrunde liegenden Prozessen im Gehirn beschäftigt, habe ich im vorletzten Artikel beschrieben. Des Weiteren gehören zu diesem Fach die Themen Aufmerksamkeit, Denken & Problemlösen, Emotion & Motivation und Sprache. Ja, Psychologen beschäftigen sich auch intensiv mit der menschlichen Sprache, was kaum jemand weiß. Dabei sind die Fragen danach, wie wir im Gehirn Sprache verarbeiten (sowohl verstehen als auch selbst produzieren) ein ziemlich altes und sehr etabliertes Forschungsgebiet der Psychologie. Und auch hierzu gehört natürlich die Kenntnis über Störungen der Sprache (genannt Aphasien), die z.B. nach Schlaganfällen auftreten können.

Insgesamt erklärt sich aus der Existenz dieses Faches, warum alle Psychologen in ihrem Studium eine Menge von Dingen lernen müssen, die z.B. Medizinstudierenden auch begegnen. So kommt keiner durchs Psychologiestudium, ohne ziemlich genau den Aufbau des Gehirns und die Funktion verschiedener Gehirnareale, den Aufbau des gesamten Nervensystems, die Funktionsweise seiner Nervenzellen, die Eigenschaften von Hormonen und Neurotransmittern und die Funktionsweise von Untersuchungsverfahren für das Gehirn (EEG, MEG, PET, fMRT, etc.) zu kennen. Da man die Wege der Wahrnehmung kennen muss, gehört auch die Kenntnis des Aufbaus unserer Sinnesorgane (Augen, Ohren inkl. Gleichgewichtsorgan, Nase, Zunge, Berührungs- und Schmerzwahrnehmung) dazu. Wenn man sich auf diesem Gebiet spezialisiert, landet man als Psychologe entweder in der Wissenschaft und forscht zu einem der beschriebenen Themen, oder aber man ergreift das praktische Berufsfeld des Neuropsychologen, dessen Tätigkeit die präzise Diagnostik und darauf folgende Therapie von neurologisch bedingten Störungen in den oben beschriebenen Bereichen ist, wie sie z.B. nach einem Schlaganfall auftreten.

Entwicklungspsychologie

In diesem Fach lernt man im Wesentlichen, wie die normale psychische Entwicklung bei Kindern ablaufen sollte und ab wann etwas als nicht mehr normal anzusehen ist. Hierzu gehören z.B. die sprachliche Entwicklung, die kognitive und Intelligenzentwicklung, die emotionale Entwicklung und auch die Entwicklung motorischer Fähigkeiten. Ein zentraler, für die Praxis relevanter Punkt ist hierbei das Erkennen von Entwicklungsverzögerungen, die beispielsweise auf eine geistige Behinderung oder eine tiefgreifende Entwicklungsstörung hinweisen können. Die Entwicklungspsychologie hat aber auch sehr interessante Experimente zu bieten, die uns eine Einsicht darin gewähren, wie kleine Menschen die Welt um sich herum so wahrnehmen. Bekannt geworden ist vor allem der „Spiegeltest“, bei dem man schaut, wie ein Kind auf sein Spiegelbild reagiert, d.h. ob es erkennt, dass es sich selbst betrachtet. Dieses Erkennen setzt das Vorhandenensein eines Selbstkonzeptes voraus, d.h. eines „Ich-Bewusstseins“. Dieses weisen Kinder in der Regel im Verlauf des zweiten Lebensjahres auf, was man im Spiegeltest z.B. damit nachweisen kann, dass das Kind sich einen roten Punkt, den man ihm auf die Stirn geklebt hat, selbst wieder abnimmt. Das Fehlen dieses Selbstkonzeptes wird übrigens auch als eine Ursache für das Phänomen diskutiert, dass wir uns an unsere ersten 2 Lebensjahre in der Regel nicht erinnern können – weil vorher Erinnerungen nicht in Bezug auf das Selbst abgespeichert werden können (was wiederum nötig ist, um sie später im Leben noch abrufen zu können).

Zeitlich nach dem Selbstkonzept entwickelt sich derweil erst die Theory of Mind, die, kurz gesagt, die Fähigkeit beschreibt, anderen Menschen Gedanken, Absichten, etc. zuzuschreiben und hierauf zu reagieren (eine Fähigkeit, die bei z.B. bei Autismus eingeschränkt ist). Der bekannteste wissenschaftliche Vertreter der Entwicklungspsychologie ist sicherlich bis heute Jean Piaget, dessen Befunde zur kognitiven Entwicklung von Kindern großen Einfluss auf die Pädagogik genommen haben. Allerdings deutet inzwischen eine Vielzahl von neueren Forschungsergebnissen darauf hin, dass Piaget, ganz grob gesagt, die kognitiven Fähigkeiten von Kleinkindern stark unterschätzt hat. Psychologen, die sich heutzutage in der Entwicklungspsychologie spezialisieren, sind entweder auch in der Forschung tätig oder üben ähnliche diagnostische Tätigkeiten wie Neuropsychologen aus, nur eben mit Kindern. Das Fach ist zudem mit der Pädagogischen Psychologie verwandt (siehe weiter unten).

Sozialpsychologie

Wie schon im vorletzten Artikel vorgestellt, beschäftigt sich die Sozialpsychologie damit, wie das menschliche Verhalten und Erleben durch das Verhalten anderer Menschen, oder, allgemeiner gesagt, durch soziale Situationen beeinflusst wird. Aus der Sozialpsychologie stammt z.B. viel Forschung dazu, wie sich Menschen in Gruppen verhalten und wie insbesondere immenser sozialer Druck (z.B. durch Befehle in einem autoritären System) das Verhalten von Menschen auch gegen deren eigene Überzeugungen oder Persönlichkeitseigenschaften steuern können. So waren nach dem zweiten Weltkrieg viele Studien davon geprägt, dass man verstehen wollte, wie es in Deutschland zu einer so verheerenden Kastastrophe wie dem Emporkommen der Nazis und der Shoa kommen konnte. Viele dieser Experimente haben auch in der Laiengesellschaft große Berühmtheit erlangt, darunter z.B. das Stanford-Gefängnisexperiment von Zimbardo aus dem Jahr 1971.

Zimbardo untersuchte unter realistischen Bedingungen, wie Probanden, denen zufällig entweder die Rolle eines Insassen oder eines Gefängniswärters zugewiesen wurde, sich über die Zeit hinweg verhielten, wenn sie selbst während des gesamten Experiments anonym handelten. Das Experiment lieferte jedoch so massive Einblicke in die Grausamkeiten menschlichen Verhaltens (Gewaltexzesse, Folter…), dass es vorzeitig abgebrochen wurde. Es hat jedoch gezeigt, wie groß der Einfluss von Regeln und Vorschriften sowie von Anonymität (bzw. Deindividuierung) und der Übernahme einer Rolle (Insasse vs. Gefängniswärter) auf zwischenmenschliches Verhalten ist. Die gewaltsamen Exkalation des Experiments hat nicht zuletzt auch dazu beigetragen, dass die Ethikrichtlinien für psychologische Forschung sehr viel strenger geworden sind. Heutzutage ist es selbstverständlich, dass die Teilnehmer an einem psychologischen Experiment vor ihrer Zustimmung zur Teilnahme über das informiert werden, was passieren wird (informed consent), dass ihnen kein Schaden zukommt und dass sie jederzeit aus dem Experiment aussteigen können. Sozialpsychologen sind typischerweise Wissenschaftler, eine praktische Berufsrichtung gibt es nicht direkt. Allerdings werden sehr viele sozialpsychologische Ergebnisse in der Organisationspsychologie, einem primär anwendungsorienerten Fach, das ich gleich noch vorstellen werde, verwendet.

Differentielle Psychologie bzw. Persönlichkeitspsychologie

Im Gegensatz zur Sozialpsychologie versucht dieses Fach, das Verhalten von Personen nicht durch die soziale Situation zu erklären, sondern durch relativ stabile, der Person innewohnende Persönlichkeits- oder Charaktereigenschaften (auf Englisch traits). Sie untersucht daher zum einen, in welchen Eigenschaften sich Personen unterscheiden (das meint differentielle Psychologie), und zum anderen, welcher Art der Zusammenhang zwischen Persönlichkeitseigenschaften und tatsächlichem Verhalten ist. Zum ersten Thema ist der wohl bekannteste, auf Faktorenanalysen beruhende Befund der „Big 5“ zu nennen  –  fünf globaler Eigenschaften, unter denen sich sämtliche Charaktereigenschaften, die wir im Alltag zur Beschreibung einer Person verwenden, zusammenfassen lassen. Eine Beschreibung der Big 5 finden Sie hier. Zum zweiten Thema lässt sich sagen, dass Persönlichkeitseigenschaften zwar nicht irrelevant in der Vorhersage von Verhalten sind (dass ein introvertierter Mensch freitags abends eher nicht in die Disco gehen wird, leuchtet ein), jedoch keine so guten Vorhersagen liefern wie persönliche Motive, die manche ebenfalls zur Persönlichkeitspsychologie rechnen und andere eher zur Allgemeinen Psychologie. Eine weitere ganz zentrale Domäne der Differentiellen Psychologie (und wahrscheinlich die am besten erforschte) ist außerdem die Intelligenz, inklusive ihrer Unterformen und Facetten. Die Erkenntnisse der Persönlichkeitspsychologie werden sowohl in der Arbeits- und Organisationspsychologie (z.B. als Variablen zur Beurteilung der Passung zwischen Bewerber und Arbeitsplatz) als auch in der klinischen Psychologie und Psychotherapie (z.B. als relevanter Faktor in Bezug auf die Entstehung einer psychischen Störung) sowie in der forensischen Psychologie (Warum werden Menschen kriminell?) genutzt.

Psychologische Diagnostik

In diesem Fach lernt man nicht primär, psychische Störungen zu diagnostizieren, sondern es geht darum, wie sich verschiedene Merkmale einer Person durch Tests, Fragebögen, Verhaltensbeobachtung, zielorientierte Gesprächsführung etc. erfassen bzw. möglichst verlässlich und präzise messen lassen. Die wichtigsten Mermale hierbei sind die allgemeine Intelligenz (auch bezeichnet als kognitive Leistungsfähigkeit) sowie ihre verschiedenenen Unterfacetten und die Persönlichkeitsstruktur einer Person (Charaktereigenschaften, Einstellungen, Motive, etc.). Darüber hinaus gibt es natürlich Tests, die weitere kognitive Leistungen wie Aufmerksamkeit und Konzentration messen, und klinische Fragebögen, die Symptome verschiedener psychischer Störungen erfassen. Zum Fach „Psychologische Diagnostik“ gehört auch die Testtheorie, die sich damit beschäftigt, wie man solche psychologische Tests konstruiert, die gültige Aussagen über eine Person liefern. Was man unter psychometrischen Gütekriterien versteht, die solche Tests erfüllen müssen, können sie hier nachlesen; was Beispiele für gute und schlechte Tests sind, finden Sie zudem hier bzw. hier erklärt. Die Kenntnis darüber, wie man solche Tests und Fragebögen konstruiert (was alles andere als trivial ist), erachte ich neben den grundlegenden wissenschaftlichen und statistischen Kenntnissen als eine der wertvollsten, die man sich im Psychologiestudium aneignet.

Im Rahmen der psychologischen Diagnostik gibt es eine Menge von beruflichen Anwendungsfeldern. So kommen diagnostische Verfahren z.B. in der Auswahl von Bewerbern zum Einsatz, oft im Rahmen von Assessment Centern. Ebenso ist psychologische Diagnostik z.B. bei der Agentur für Arbeit oder bei Berufsförderungswerken gefragt, um zu entscheiden, ob z.B. jemand für eine bestimmte Umschulung geeignet ist. Ebenso ergänzen standardisierte klinisch-diagnostische Verfahren die Diagnostik in der Psychotherapie. Ein wichtiges Anwendungsfeld der psychologischen Diagnostik ist zudem die Verkehrspsychologie: Im Rahmen der medizinisch-psychologischen Untersuchung (kurz MPU, auch bekannt als „Idiotentest“) spielen die diagnostischen Kompetenzen von Psychologen eine entscheidende Rolle dabei, z.B. zu beurteilen, ob auffällig gewordenen Verkehrsteilnehmern die Fahrerlaubnis wieder erteilt werden sollte oder nicht. Viele Psychologen sind zudem auch als Gutachter vor Gericht tätig, wobei die Themen sehr verschieden sein und von Sorgerechtsentscheidungen („Was entspricht dem Wohl des Kindes?“) über verkehrspsychologische Fragestellungen bis hin zur Glaubhaftigkeitseinschätzung von Zeugenaussagen reichen können. Bei solchen Fragenstellungen werden, um die diagnostischen Fragen zu beantworten, dann eher bestimmte diagnostische Gesprächsführungstechniken als Tests und Fragebögen zum Einsatz kommen, die ebenfalls Teil der Ausbildung in psychologischer Diagnostik sind und welche daher auch zum absoluten Standardrepertoire eines jeden Psychologen gehören.

Arbeits- & Organisationspsychologie

Dieses, neben der Klinischen Psychologie zweite große Anwendungsfach der Psychologie wendet psychologische Erkenntnisse in der Arbeitswelt an. Die Arbeitspsychologie fußt dabei eher auf der Allgemeinen Psychologie und ist konzeptuell mit den Ingenieurwissenschaften verwandt. So kümmern sich Arbeitspsychologen z.B. darum, Arbeitsabläufe in einer Fertigungshalle zu optimieren, Maschinen ergonomisch zu gestalten (also so, dass die Bedienbarkeit möglichst an den Menschen angepasst wird) oder Arbeitsabläufe durch Veränderungen an Menschen und Maschinen sicherer zu machen. Die Organisationspsychologie beschäftigt sich derweil hauptsächlich mit dem Personal (genannt human resources) in einer Organisation (meist einem Unternehmen) und basiert stark auf der Sozialpsychologie. Wichtige Felder innerhalb der Organisationspsychologie sind die Personalauswahl (wofür diagnostisch-psychologische Kenntnisse besonders wichtig sind, siehe oben) und die Personalentwicklung, die darauf abzielt, die Kompetenzen vorhandener Mitarbeiter durch Trainings- und Coachingmaßnahmen auszubauen, damit diese z.B. überzeugender auftreten oder besser mit Kunden interagieren können – ergo, um dem Unternehmen mehr Profit zu bringen. Zentral ist auch die Anwendung der sozialpsychologischen Befunde zur Gruppeninteraktion, da Teamarbeit in der freien Wirtschaft gerade absolut en vogue ist. Angegliedert an dieses Fach ist auch die Wirtschaftspsychologie, die sich z.B. mit Werbetechniken und den psychologischen Prozessen beschäftigt, die Phänome wie der Finanzkrise erklären können.

Pädagogische Psychologie

Auch wenn ich (Achtung Sarkasmus) im Studium nicht so richtig die Daseinsberechtigung dieses weiteren Anwendungsfaches verstanden habe, was ich größtenteils auf seine allumfassende Schwammigkeit zurückführe, möchte ich hier kurz beschreiben, worum es so in etwa geht. Die Pädagogische Psychologie (kurz PP) könnte man am ehesten als die empirische Mutter der Pädagogik bezeichnen – d.h., das, was angehende Lehrer in ihrem Studium lernen, basiert zu einem Großteil auf Befunden der PP. So werden z.B. die optimale Interaktion zwischen Lehrern und Lernenden oder die effektivste Art der Wissensvermittlung untersucht (ironischerweise genau das, was ich hier gerade tue). Daraus abgeleitet ist auch die Forschung zu den Merkmalen, die eine effektive Beratung kennzeichnen. Zudem ist ein weiterer Zweig der PP die Hochbegabungsforschung, die sich vor allem mit der Vorhersage und der Förderung von Hochbegabung beschäftigt. Die Anwendungsbereiche der PP sind vielfältig. Psychologen mit dieser Orientierung arbeiten z.B. in Erziehungs- oder Paarberatungsstellen, in der Hochbegabtenförderung oder in Schulen als Schulpsychologen, die meistens aber eine hoch undankbare Stellung zwischen Lehrern und Schülern einnehmen.

Soft-Skills: Gesprächsführung, soziale Kompetenzen & Co.

Wie in fast jedem Studium auch nimmt man aus dem Psychologiestudium eine Menge so genannter soft skills mit, also Fertigkeiten und Kompetenzen, die man mehr oder weniger automatisch mit auf den Weg bekommt. Dazu gehören bei Psychologen vor allem soziale Kompetenzen, sowohl eine effektive Teamarbeit betreffend als auch z.B. das selbstsichere Auftreten und Sprechen beim Halten einer Referatspräsentation vor anderen. Gesprächsführung ist, wie oben ja schon mehrfach angeklungen ist, wohl im Psychologiestudium die kennzeichnendste dieser Fertigkeiten, die je nach Uni unterschiedlich ausführlich vermittelt wird. Gemeint ist damit zum einen die diagnostische Gesprächsführung, mit der man möglichst viel über einen Menschen erfahren will, und zum anderen die therapeutische Gesprächsführung, die darauf abzielt, Veränderungsmotivation aufzubauen („Motivational Interviewing“), Dinge zu hinterfragen und Veränderungen einzuleiten. Diese Grundlagen schon im Studium zu erlernen, ist sinnvoll, da man, wenn man z.B. anschließend noch die Ausbildung zum Psychologischen Psychotherapeuten machen will, auch schon zu Beginn der Ausbildung relativ selbstständig Therapien durchführen muss. Und auch in anderen Bereichen wie der Beratung oder der Personalentwicklung ist Gesprächsführung das Werkzeug Nr 1. Letztlich ist diese, neben der wissenschaftlichen Kompetenz und dem breiten Fachwissen, diejenige Kompetenz, für an Psychologen in der Arbeitswelt am meisten geschätzt wird. Und auch wenn es sich trivial anhört („Gespräche führen kann doch jeder“), so ist es alles andere als das – was jeder schnell merkt, der es sich zu einfach vorstellt und dann vollends gegen die Wand fährt.

Und um zum Cliché des Analysierens zurückzukehren, ist zumindest mein Eindruck, dass man nach dem Studium einen anderen Blick auf Menschen hat. Man hinterfragt viel mehr, warum Menschen sich so verhalten, wie sie es tun, macht sich Gedanken über die bewussten oder unbewussten Ziele, die jene damit verfolgen, und fragt sich vielleicht auch, welche Erfahrungen in der Vergangenheit die Person zu dem gemacht haben, was sie heute ist. So kommt man z.B. eher als andere Menschen auf die Idee, dass ein angeberisches, egoistisches A*schloch vielleicht über eine narzisstische Persönlichkeitsstörung verfügt, die eigentlich auf einem furchtbar niedrigen Selbstwert fußt. Ob man denjenigen danach weniger hasst, ist die andere Frage. Als Psychologe muss man dann meiner Erfahrung nach in zweierlei Hinsicht aufpassen. Erstens muss man in der Lage sein, den „analytischen Blick“ ausschalten zu können, weil sich Freunde oder Familie sonst zurecht in die Ecke gedrängt fühlen werden. Zweitens muss man aufpassen, sich selbst nicht zu stark zu „analysieren“, da man unglaublich schnell auf Dinge stößt, die man vielleicht aufgrund seines Fachwissens als gefährlich einstuft. Meine Erfahrung ist, dass man darüber sehr schnell ins Grübeln kommt und man sich in der Folge schlecht fühlt, weshalb es wichtig ist, sich von solchen Gedanken auch wieder distanzieren zu können. Was ich hier mit „analysieren“ meine, ist übrigens nicht dasselbe, was Sigmund Freud hierunter verstanden hat. Darüber erfahren Sie mehr im nächsten Artikel.

Eine weitere wichtige Sache, die man im Psychologiestudium lernt, ist, mit der Situation umzugehen, dass man permanentem Leistungsdruck ausgesetzt ist, der einerseits aufgrund der extrem hohen Anforderungen und des massiven Lernaufwands (der meistens leider ein Auswendiglern-Aufwand ist) objektiv besteht, aber andererseits durch die Charakteristika der Menschen, die Psychologie studieren, noch verschlimmert wird. Stellen Sie sich vor, Sie sind in der Mehrzahl von Leuten umgeben, die ihr Abitur mit ca. 1,3 oder besser gemacht haben (oder im Masterstudium ihren Bachelor, was nochmal eine ganz andere Hausnummer ist). Im Normalfall sind das nicht die sympathischsten Menschen: Viele sind von ihrem Ehrgeiz leider so besessen, dass das inhaltliche Interesse am Fach in den Hintergrund rückt. Hauptsache top-Noten und Hauptsache besser als die anderen. Sie können sich vorstellen, was für Themen Sie in der Cafeteria erwarten, wenn man es nicht schafft, sich ein paar normale Freunde zu suchen. In der Folge und zum Abschluss ein kleiner typischer, von mir mit Sarkasmus und Zynismus gespickter Dialog, der einem dort begegnen könnte:

„Und, was hattest du für eine Note in Physiologie? Ich hatte ja eine 1,3.“ (Gedanklich: „Wehe, die blöde Kuh hat was Besseres!“)

„Ich hatte eine 1,0, dabei war ich mir totaaal sicher, dass ich durchgefallen bin, hihi!“ (Gedanklich: „Chakka!“)

„Hey cool, herzlichen Glückwunsch! Vielleicht sollte ich mal zur Klausureinsicht gehen, um zu gucken, ob die vielleicht was übersehen haben“ (Gedanklich: „Dass diese dumme Pute besser ist als ich, geht einfach mal GAR nicht. Ich hasse sie!“)

„Ja, mach das doch. Hast du denn eigentlich schon angefangen, für Entwicklungspsychologie zu lernen?“ (Gedanklich: „Hoffentlich bin ich ihr schon um Meilen voraus!“)

„Ja klar, bin schon längst fertig und muss nur nochmal wiederholen; jetzt erst anzufangen mit dem Auswendiglernen, wäre ja wohl von vornherein zum Scheitern verurteilt“ (Gedanklich: „Als ob ich der jetzt auch noch den Trumpf erlauben würde! Warum sollte ich ihr sagen, dass ich erst vorgestern angefangen habe?“)

„Achso, ja cool. Ich komme auch super voran“ (Gedanklich: „Mist, ich muss mich echt beeilen – Wie soll ich das bloß schaffen? Ich verkacke bestimmt und schreibe eine 2,0 oder so. Ich bin einfach zu dumm!“)

Ergebnis: Beide fühlen sich beschissen.

Wie Sie sehen: In dieser widrigen Umwelt muss man sich erst einmal zurechtfinden. Daher ist vielleicht das Wichtigste, das man im Psychologiestudium lernt, an sich selbst zu glauben. Aber der Fairness halber muss ich doch sagen, dass zum Glück nicht alle so drauf sind und ich in meinem Studium bisher auf viele sehr nette Leute gestoßen bin:-).

© Christian Rupp 2013

Autismus & das Asperger-Syndrom – Teil 1: Was verbirgt sich hinter den Begriffen?

Über Autismus und das Asperger-Syndrom kursiert, wie bei den meisten psychischen Störungen, eine große Menge an Gerüchten und falschen Annahmen, die die gesamte Bandbreite von „Autisten sind geistig behindert“ bis hin zu „Autisten sind hochbegabt“ abdecken. Insbesondere letztere Aussage wird immer wieder von Hollywood-Filmen aufgegriffen und blumig ausgeschmückt, z.B. indem Autisten übernatürliche Fähigkeiten wie diejenige zur Kontaktaufnahme mit dem Jenseits zugeschrieben werden. An dieser Stelle soll es nun also darum gehen, was sich hinter diesen Begriffen wirklich verbirgt. Was unterscheidet den Autismus vom Asperger-Syndrom? Was sind die kennzeichnenden Symptome? Sind wirklich nur Kinder betroffen? Und welche Therapiemöglichkeiten gibt es?

Oberbegriff: Tiefgreifende Entwicklungsstörungen

Wenn wir uns mit Autismus beschäftigen, bewegen wir uns innerhalb der diagnostischen Gruppe der „Tiefgreifenden Entwicklungsstörungen“ (ICD-10-Kodierung: F84), die vor allem von den „umschriebenen Entwicklungsstörungen“ durch ihre Schwere und die damit einhergehenden Einschränkungen im Leben der Betroffenen (womit hierbei meist Kinder gemeint sind) abzugrenzen sind. Die umschriebenen Entwicklungsstörungen sind hingegen dadurch gekennzeichnet, dass nur in einem bestimmten Bereich eine Störung bzw. ein Defizit besteht, z.B. bezüglich der sprachlichen Entwicklung, der Motorik oder hinsichtlich schulischer Funktionen, wobei vorrangig die Legasthenie (Lese-/Rechtschreibstörung), die Dyslexie (Lesestörung) und die Dyskalkulie (Rechenstörung) zu nennen sind. Die tiefgreifenden Entwicklungsstörungen hingegen betreffen keine isolierten Bereiche, sondern ihre Symptomatik ist allgegenwärtig und betrifft das gesamte Verhalten des betroffenen Kindes bzw. des Menschen.

Innerhalb der tiefgreifenden Entwicklungsstörungen sind die beiden mit Abstand häufigsten und wichtigsten Diagnosen einerseits der Autismus, der korrekterweise „frühkindlicher Autismus“ heißt, und andererseits das Asperger-Syndrom. Ich werde zunächst den frühkindlichen Autismus beschreiben und dann im Anschluss darauf eingehen, in wieweit sich das Asperger-Syndrom davon unterscheidet.

Frühkindlicher Autismus

Die Bezeichnung „frühkindlich“ deutet bereits auf das erste Diagnosekriterium hin: Um Autismus bei einem Kind zu diagnostizieren, muss die Störung bis spätestens zum dritten Lebensjahr aufgetreten sein. Tatsächlich ist das Verhalten der betroffenen Kinder meist bereits im Säuglingsalter auffällig (im Sinne von abweichend von der üblichen frühkindlichen Entwicklung), sodass diese Diagnose oft sehr früh gestellt wird. Dies ist in gewisser Weise auch von Vorteil für die betroffenen Kinder, da so auch früh mit Fördermaßnahmen begonnen werden und die größten Verbesserungen erzielt werden können (mehr zu Therapie im vierten Teil). Die Symptomatik des frühkindlichen Autismus lässt sich in drei Gruppen unterteilen:

  • soziale Interaktion
  • Kommunikation
  • stereotypes, repetitives Verhalten und eingeschränkte Interessen

 Soziale Interaktion

Autismus ist durch ein tiefgreifendes Muster von Defiziten im sozialen Verhalten und in der sozialen Wahrnehmung gekennzeichnet. In den ersten Lebensmonaten äußert sich dies dadurch, dass das Kind nicht versucht, Kontakt mit den wichtigsten Bezugspersonen (meist der Mutter) aufzunehmen. Das Kind schaut der Bezugsperson nicht in die Augen; stattdessen scheint es, als würde es durch einen hindurch schauen, und ein „soziales Lächeln“ (d.h. eines, welches durch die Interaktion mit anderen erzeugt wird, z.B. zwischen Mutter und Kind) ist bei diesen Kindern in der Regel nicht zu sehen. Allgemein ist bei autistischen Kindern zu beobachten, dass sie kaum nonverbale Verhaltensweisen in sozialen Situationen verwenden, d.h. selten Gesichtsausdruck, Körperhaltung und Gestik variieren. Ein autistisches Kind wird typischerweise auch nicht versuchen, die Aufmerksamkeit von Erwachsenen zu erwecken, indem es versucht, diese z.B. durch das Zeigen mit dem eigenen Finger auf etwas zu lenken („Guck mal da, Mama – das hab‘ ich gemacht“).

Das zentrale dahinter stehende Symptom des Autismus ist die Unfähigkeit der Betroffenen, bei anderen Menschen Emotionen zu deuten und somit soziale Situationen zu verstehen. Wie in wissenschaftlichen Studien gezeigt werden konnte, verfügen Autisten z.B. über eine stark reduzierte Fähigkeit, aus Gesichtern emotionale Zustände zu lesen, was u.a. mit dem so genannten „Reading the Mind In the Eyes – Test“ erfasst werden kann. Hieraus erklärt sich, dass Autisten auch nicht auf die Emotionsäußerungen (z.B. Weinen) anderer Menschen reagieren können und sich aus dem Blickwinkel nicht autistischer Menschen häufig sozial völlig unangemessen und oft aggressiv verhalten (z.B. laut rülpsen oder furzen, wenn alle anderen gerade in andächtiger Stille verharren). Daher gelten Autisten in Kindergarten und Grundschule leider oft als „Störenfried“ und werden von den anderen Kindern gemieden.

Autistische Kindern sind in der Regel nicht dazu in der Lage, Beziehungen zu gleichaltrigen Kindern aufzubauen – typischerweise verweigern sie die Kontaktaufnahme gänzlich oder beschränken soziale Interaktionen wie gemeinsames Spielen auf rein funktionale Aspekte, d.h. auf die Aspekte des Spiels selbst. Mit anderen Worten: Es steht nicht die Gesellschaft beim Spielen im Vordergrund, sondern meist lediglich die Tatsache, dass für ein bestimmtes Spiel (z.B. Baggern im Sandkasten) ein anderes Kind „hilfreich“ sein kann, um das Spiel interessanter zu gestalten. Neben der Tatsache, dass autistische Kinder selten interaktiv spielen, ist an ihrem Spielverhalten auffällig, dass das typisch-kindliche symbolische Spielen („So tun als ob“) fast völlig fehlt, dass autistische Kinder sich nicht auf Rollenspiele („Vater, Mutter, Kind“) einlassen, weil sie diese nicht verstehen, und dass sie Spielzeuge oft zweckentfremdet verwenden und sich vornehmlich für Einzelteile der Spielzeuge interessieren. So kann es z.B. vorkommen, dass ein Kind sich ausschließlich für die Räder eines Spielzeugbaggers interessiert, diesen in Folge dessen auseinander nimmt und beginnt, die Räder als Schaufeln zum Graben eines Lochs zu verwenden.

Kommunikation

Als erste Auffälligkeit ist zu nennen, dass das in der regulären kindlichen Entwicklung auftretende Brabbeln bzw. Lallen, welches die Melodie der Umgebungssprache imitiert, bei autistischen Kindern meistens nicht zu beobachten ist. Entscheidend für die Abgrenzung vom Asperger-Syndrom ist, dass sich bei Autisten die Sprache entweder stark verzögert oder überhaupt nicht entwickelt. Entwickelt das Kind sprachliche Fähigkeiten, haben diese oft keinen kommunikativen Charakter, d.h. die Sprache wird nicht dazu genutzt, mit anderen Menschen Kontakt aufzunehmen, wobei dieser Mangel an Kommunikation aber eben nicht durch Gestik und Mimik ausgeglichen wird.

Ferner verstehen autistische Kinder oft selbst einfache Anweisungen oder Fragen – und typischerweise auch Witze – nicht. Wenn Autisten sprechen, weist ihre Sprache außerdem gewisse Besonderheiten auf. Zum einen fällt darunter die Echolalie, d.h. das zwanghafte Wiederholen von Wörtern oder Satzteilen des Gegenübers, zum anderen die „pronominale Umkehr“, was bedeutet, dass die Personalpronomen beim Sprechen vertauscht werden („Du essen“ anstelle von „Ich essen“). Auch die Melodie der Sprache ist eine andere: Hört man einen Autisten sprechen, fällt auf, dass die Betonung oft unangemessen erfolgt, der Sprechrhythmus generell „abgehackt“ klingt und die Sprachmelodie insgesamt sehr gleichbleibend ist und nicht genutzt wird, um bestimmte Teile des Gesagten hervorzuheben. Auch kommt es häufig zu Wortneuschöpfungen (Neologismen), d.h. Autisten neigen dazu, sich ihren eigenen Wortschatz zuzulegen, der von der Umgebung selten verstanden wird.

Stereotypes, repetitives Verhalten und eingeschränkte Interessen

Die dritte Gruppe von Symptomen lässt sich grob unter dem Label „Mangel an Flexibilität im Verhalten“ zusammenfassen. Für Autisten ist es essenziell wichtig, dass sämtliche alltäglichen Handlungen und Abläufe stets in exakt derselben Weise ablaufen, sodass sie starr und beharrlich auf der Einhaltung bestimmter Rituale bestehen (z.B. jeden Tag exakt denselben Schulweg gehen, jeden Abend genau zur gleichen Zeit zu Abend essen). Ebenso besteht ein ängstlich-zwanghaftes Bedürfnis danach, dass sich an der Umwelt nichts verändert: Renovierungen in der Wohnung oder schon ein anderer Platz am Esstisch können bei autistischen Kindern zu Wutausbrüchen oder extremer Verzweiflung führen. Gleiches gilt z.B. für Werbepausen, die die Lieblingssendung des Kindes im Fernsehen unterbrechen, worauf das Kind gegebenenfalls nicht vorbereitet ist und was unter Umständen einen emotionalen Zusammenbruch bewirken kann.

Die Motorik von autistischen Kindern kann häufig als stereotyp und repetitiv beobachtet werden, was bedeutet, dass diese Kinder bestimmte Handlungen immer wieder und in identischer Weise wiederholen. Hierzu gehören Tic-artige Handlungen wie das Schlagen auf die eigenen Ohren, das Hin- und Herschaukeln des ganzen Körpers, aber auch das ausgedehnte Befühlen von oder Riechen an den Oberflächen von Objekten. Ebenso gehört zu diesen repetitiven Verhaltensweisen leider, dass die betroffenen Kinder sich selbst häufig beißen oder kratzen, weshalb Selbstverletzungen bei Autisten nicht selten sind – aber eben aufgrund anderer Ursachen als bei anderen psychischen Störungen (z.B. der Borderline-Persönlichkeitsstörung). Problematisch ist dies auch deshalb, weil Autisten diese Verletzungen oft nicht selbst bemerken und auch wenig Schmerz dabei empfinden, sodass sie nicht automatisch damit aufhören.

Zu diesen auffälligen Verhaltensweisen gesellt als weiterer Symptombereich noch die exzessive Beschäftigung mit und das sehr spezifische Interesse an bestimmten (meist technisch-naturwissenschaftlichen, d.h. gefühlsneutralen) Themen, sodass sich ein Kind z.B. über Stunden mit Fahrplänen oder den verschiedenen Spalten der Bundesliga-Tabelle beschäftigt und gedanklich völlig dort hinein versinkt. Wie bereits oben anhand des Spielverhaltens erwähnt, ist das Verhalten von autistischen Kindern zudem dadurch gekennzeichnet, dass sie sich vornehmlich für Einzelteile eines Objekts anstatt für das Objekt als Ganzes interessieren, z.B. für die Schrauben eines Schranks oder den Dichtungsring eines Wasserhahns.

Weitere Symptome

Autistische Kinder leiden häufig an weiteren psychischen Störungen oder Auffälligkeiten, wobei besonders Angstzustände, zwanghafte Symptome, depressive Verstimmung, Schlaf- und Essstörungen, Tic-Störungen und Hyperaktivität häufig auftreten. In vielerlei Hinsicht ist davon auszugehen, dass diese Auffälligkeiten daraus erwachsen, dass das autistische Kind nicht effektiv mit seiner Umwelt umgehen kann – was z.B. für depressive und Angstzustände sowie für Schlaf- und Essstörungen zutreffend ist. Anderseits werden Tic-Störungen, Hyperaktivität – und vor allem die Tatsache, dass ca. 20% der autistischen Kinder auch an Epilepsie leiden – als Hinweis auf eine gemeinsame biologische oder genetische Ursache gewertet (mehr dazu siehe Teil 3).

Interessanterweise ist es auch so, dass Autisten meist grundsätzlich nicht davon berichten, geträumt zu haben – ob sie tatsächlich nicht träumen oder dies nur nicht erinnern bzw. wiedergeben können, ist derweil weitgehend ungeklärt. Auch ist es so, dass Autisten oft sehr viel empfindlicher für sensorische Reize sind, d.h. z.B. sehr leise Töne hören, die andere Menschen nicht oder nur unter großer Anstrengung wahrnehmen können. Dies wird dadurch erklärt, dass die Wahrnehmung bzw. die Informationsverarbeitung bei Autisten gegenüber nicht autistischen Menschen maßgeblich verändert ist, worauf ich in Teil 3 noch weiter eingehen werde.

Ein letzter Punkt, der sehr viele autistische Kinder betrifft, ist die Intelligenzminderung (früher auch „mentale Retardierung“ genannt), von der man ab einem Intelligenzquotienten unter 70 spricht, was einem Abstand von mehr als zwei Standardabweichungen vom Mittelwert entspricht (der 100 beträgt). Kinder mit frühkindlichem Autismus verfügen also eher über eine eingeschränkte geistige Leistungsfähigkeit und sind in aller Regel nicht hochbegabt (definiert als IQ>130), was einen der wesentliche Unterschiede zum Asperger-Syndrom darstellt. Allerdings muss hierbei betont werden, dass insbesondere bei Kindern, die keine Sprache entwickeln, die Messung der Intelligenz größter Vorsicht bedarf und nur mittels spezialisierter Tests durch erfahrene Psychologen_Innen geschehen sollte.

Liegt eine sehr niedrige Intelligenz, d.h. eine mittelgradige (IQ<50) oder sogar schwere (IQ<20) Intelligenzminderung vor, ist es diagnostisch zudem sehr schwierig, den frühkindlichen Autismus noch von einer geistigen Behinderung zu unterscheiden – was jedoch dann im Hinblick auf das Wohl des Kindes auch nur noch eine akademische Diskussion wert ist, da sich hieraus kaum Unterschiede hinsichtlich möglicher Therapieoptionen ergeben werden.

Während man noch vor ca. 20 Jahren davon ausging, dass bei den meisten autistischen Kindern eine Intelligenzminderung besteht, zeigen neuere Untersuchungen jedoch den erfreulichen Befund, dass 30-60% der betroffenen Kinder tatsächlich über eine durchschnittliche (IQ zwischen 85 und 115) oder sogar überdurchschnittliche Intelligenz (IQ>115) verfügen, aber grundsätzlich nicht über eine generelle Hochbegabung (IQ>130).

Low-Functioning und High-Functioning

Beim frühkindlichen Autismus unterscheidet man auf Basis der sprachlichen Entwicklung und der kognitiven Leistungsfähigkeit (Intelligenz) grob zwischen zwei Formen, dem „Low-Functioning-Autismus“, der mit einer verringerten Intelligenz und nur sehr eingeschränkten sprachlichen Fähigkeiten einhergeht, und dem „High-Functioning-Autismus“, bei dem die betroffenen Kinder aufgrund einer durchschnittlichen Intelligenz und einer gut entwickelten Sprache ein höheres so genanntes „Funktionsniveau“ erreichen und somit weniger Probleme in der Interaktion mit ihrer Umwelt haben. Die High-Functioning-Form des frühkindlichen Autismus hat viele Gemeinsamkeiten mit dem als nächstes beschriebenen Asperger-Syndrom, welches allgemein als mildere Form des Autismus bezeichnet werden kann. Tatsächlich kann diese Unterscheidung oft nicht sicher getroffen werden, und einige Experten lehnen sie auch gänzlich ab. Als Ansatzpunkt für eine Unterscheidung kann aber gelten, dass die Symptomatik beim High-Functioning-Autismus früher beginnt als beim Asperger-Syndrom, welches manchmal erst in der Jugend diagnostiziert wird, und dass der High-Functioning-Autismus meist auf eine effektive und intensive Frühförderung von Kindern mit frühkindlichem Autismus zurückzuführen ist, ohne die ein so hohes Funktionsniveau wahrscheinlich nicht erreicht worden wäre.

Asperger-Syndrom

Diese eng mit dem Autismus verwandte Störung wurde nach ihrem Entdecker Hans Asperger, einem österreichischen Kinderarzt, benannt und steht, wie bereits angedeutet, für eine weniger tiefgreifende und daher weniger stark einschränkende Form des Autismus. Es ist durch dieselben Symptome definiert wie der frühkindliche Autismus, mit einigen wichtigen Unterschieden. Die Symptome der Kategorien „soziale Interaktion“ und „stereotypes, repetitives Verhalten“ treten in gleicher, wenn auch oft weniger gravierender Form auch beim Asperger-Syndrom auf. Bezüglich der sehr spezifischen Interessensgebiete finden sich beim Asperger-Syndrom allerdings vorwiegend Sonderinteressen auf sehr hohem, oft naturwissenschaftlichem Niveau (z.B. Astrophysik, Zellbiologie, Chemie…), denen die Betroffenen, wie beim frühkindlichen Autismus, oft in zwanghaft-pedantischer Weise nachgehen. Auffällig ist zudem auch die Motorik von Kindern und Jugendlichen mit Asperger-Syndrom: Insbesondere die feinmotorischen Fähigkeiten sind oftmals nicht gut entwickelt, was sich typischerweise in einer generellen Ungeschicklichkeit oder „Tollpatschigkeit“ niederschlägt, oder aber im Sportunterricht bei Sportarten, die eine gute Koordination erfordern.

Ein weiteres wichtiges Merkmal ist das Alter bei Beginn der Störung: Während der frühkindliche Autismus (wie der Name bereits verrät) sich schon vor dem dritten Lebensjahr äußert, werden Kinder mit dem Asperger-Syndrom erst später, mitunter erst in der Pubertät, auffällig.

Im Gegensatz zum frühkindlichen Autismus treten unter dem Asperger-Syndrom außerdem häufiger so genannte „Inselbegabungen“ auf , d.h. spezifische besondere Fähigkeiten wie beispielsweise ein fotografisches Gedächtnis (bekannt wurde z.B. ein Mann, der nach nur einem Flug über Manhattan eine nahezu 100% detailgetreue Zeichnung aller Gebäude anfertigte) oder die Fähigkeit, zu einem gehörten Musikstück sofort die entsprechenden Noten aufzuschreiben. Im Zusammenhang mit solchen Inselbegabungen spricht man auch häufig vom „Savant-Autismus“ („savant“ bedeutet auf französisch so viel wie „wissend“). Auf eine mögliche Erklärung für diese Inselbegabungen, die mit einer veränderten Art der Wahrnehmung zu tun hat, werde ich im drittenTeil eingehen.

Der wichtigste Unterscheidungspunkt zwischen frühkindlichem Autismus und dem Asperger-Syndrom ist jedoch die Kommunikation: Dieser Symptombereich fällt nämlich beim Asperger-Syndrom weg. Die betroffenen Kinder weisen gut bis sogar sehr gut entwickelte sprachliche Fähigkeiten auf, und auch die kognitive Leistungsfähigkeit ist gut, d.h. durchschnittlich bis überdurchschnittlich ausgeprägt, mit einer sehr guten Abstraktionsfähigkeit. Eine generelle Hochbegabung liegt derweil meistens nicht vor, allerdings ergeben Intelligenztests bei Menschen mit dem Asperger-Syndrom typischerweise eine sehr viel höhere verbale („kristalline“) als nicht-verbale („fluide“) Intelligenz. In der Tat heben sich Kinder mit dem Asperger-Syndrom von nicht betroffenen Kindern durch eine sehr frühe Sprachentwicklung ab, die schnell ein für das jeweilige Alter ungewöhnlich hohes Niveau erreicht. Wenn Kinder oder Jugendliche mit dem Asperger-Syndrom sprechen, verwenden sie oft eine sehr hochgestochene Sprache und drücken sich sehr eloquent aus, weshalb insbesondere Kinder oft von Erwachsenen als „altklug“ belächelt werden. Es sei aber davor gewarnt, nur aufgrund einer überdurchschnittlichen Sprachentwicklung von einem Asperger-Syndrom auszugehen – es handelt sich nur um eins von verschiedenen Symptomen, die alle für die Stellung dieser Diagnose erfüllt sein müssen (siehe oben).

Auffällig an der Sprache von Kindern und Jugendlichen mit dem Asperger-Syndrom ist zudem, dass sie wenige Bezüge zum Gesprächspartner enthält und kaum von non-verbalen Elementen (Gestik, Mimik) begleitet wird. Denn wie beim frühkindlichen Autismus auch, bestehen hier starke Beeinträchtigungen in der sozialen Interaktion, die es den Betroffenen ebenso schwer machen, soziale Situationen und die Emotionen ihrer Mitmenschen zu verstehen, zu deuten und auf sie adäquat zu reagieren, was genau wie beim frühkindlichen Autismus zu massiven Problemen im Umgang mit anderen Menschen und somit zu einer mangelhaften Integration in die eigene Umwelt führen kann.

An diesen Beeinträchtigungen setzen verschiedene Therapiemöglichkeiten an, die ich im vierten Teil darstellen werde. Zudem wird es im dritten Teil um den aktuellen Wissensstand bezüglich der Ursachen von Autismus und Asperger-Syndrom gehen, und im zweiten Teil werde ich auf die Frage eingehen, warum die Zahl der Autismus- Diagnosen in den vergangenen 35 Jahren nahezu exponentiell gestiegen ist.

© Christian Rupp 2013