Das Bewerbungsgespräch als Hochglanzprospekt – warum Interviews oft Spitzenleistung messen, aber Alltag brauchen

Marcus Fischer
3. Juni
6 Min. Lesezeit

Bewerbungsgespräche gehören zu den grossen Klassikern der Personalauswahl. Fast jedes Unternehmen nutzt sie. Viele Führungskräfte vertrauen ihnen. Und kaum ein Auswahlprozess kommt ohne sie aus. Das ist nachvollziehbar, denn Interviews fühlen sich unmittelbar, persönlich und kontrollierbar an. Man sitzt sich gegenüber, stellt Fragen, hört Antworten, beobachtet das Verhalten und glaubt danach, ein recht gutes Bild zu haben.

Das Problem ist nur: Dieses Bild zeigt oft nicht den Arbeitsalltag. Es zeigt einen Ausnahmezustand.

Ein aktueller Artikel im Journal of Business and Psychology bringt genau diesen Punkt auf den Tisch. Die Studie von Johanna S. Bayón, Martin Kleinmann, Ann Marie Ryan und Anna Luca Heimann untersucht, ob es einen Unterschied macht, ob Interviewfragen explizit nach maximaler oder nach typischer Leistung fragen. Der Artikel beschäftigt sich mit einer Frage, die für Recruiting deutlich praktischer ist, als sie auf den ersten Blick klingt: Messen Interviews, wie gut jemand im besten Moment performt – oder wie jemand später im Job tatsächlich arbeitet?

Das ist keine akademische Haarspalterei. Es ist ein zentraler Punkt für Talent Acquisition. Denn im Interview sehen wir Kandidatinnen und Kandidaten selten im Normalbetrieb. Wir sehen sie vorbereitet, fokussiert, motiviert und oft auch taktisch. Sie wissen, dass es um etwas geht. Sie erzählen ihre besten Beispiele. Sie wählen ihre Worte sorgfältig. Sie zeigen ihr professionelles Sonntagsgesicht. Und ja, manchmal ist dieses Sonntagsgesicht beeindruckend.

Nur im Unternehmen arbeitet später selten jemand dauerhaft im Sonntagsgesicht-Modus. Zum Glück. Sonst wären die meisten Teams nach drei Wochen kollektiv erschöpft.

Peak Performance vs. Daily Business

Die Forschung unterscheidet deshalb zwischen maximaler und typischer Leistung. Maximale Leistung beschreibt, was jemand unter optimalen Bedingungen, hoher Motivation und klarer Beobachtung leisten kann. Typische Leistung beschreibt, wie jemand im Alltag handelt, wenn nicht jedes Verhalten bewertet wird, der Kalender voll ist, Prioritäten konkurrieren und niemand gerade mit einem Bewertungsbogen daneben sitzt.

Genau hier wird es für Interviews spannend. Die Studie zeigt laut Abstract, dass Interviewratings bei Fragen mit Maximum-Performance-Framing positiv mit der Beurteilung der Job Performance korrelierten. Bei Fragen mit Typical-Performance-Framing ergab sich hingegen eine negative Korrelation mit der Beurteilung der Job Performance.

Zusätzlich spielte Impression Management eine Rolle – also die Art, wie Bewerbende versuchen, im Interview einen bestimmten Eindruck zu erzeugen. Ehrliches Impression Management konnte den negativen Zusammenhang bei typischen Leistungsfragen abschwächen.

Das Ergebnis ist auf den ersten Blick irritierend. Sollte eine Frage nach typischem Verhalten nicht gerade besonders gut vorhersagen, wie jemand später arbeiten wird? Eigentlich ja. Praktisch zeigt sich aber: So einfach ist es nicht.

"Wie verhalten Sie sich normalerweise?"

Ein Grund könnte sein, dass Fragen nach typischem Verhalten kognitiv wie sozial schwieriger sind. Wer gefragt wird: „Wie verhalten Sie sich normalerweise, wenn…?“, muss nicht nur an eine, sondern gleich an mehrere Situationen denken, sondern auch eine realistische Selbstbeschreibung liefern. Das ist weniger glamourös als die klassische Heldengeschichte aus dem Projekt, in dem man unter Zeitdruck, Budgetkollaps und leichter Apokalypse trotzdem alles gerettet hat.

Für das Recruiting heisst das: Nicht jede strukturierte Frage ist automatisch eine gute Frage. Struktur hilft, ersetzt aber kein klares Messziel.

Viele Interviews sind formal strukturiert, inhaltlich jedoch unscharf. Es gibt Fragen, Bewertungsdimensionen und vielleicht sogar Skalen. Doch oft bleibt unklar, welche Art von Leistung eigentlich erfasst werden soll.

Typische Interviewfragen vermischen mehrere Dinge:

Können: Was kann jemand grundsätzlich leisten?
Wollen: Wie stark ist jemand motiviert?
Verhalten: Was tut jemand tatsächlich im Alltag?
Selbstdarstellung: Wie überzeugend kann jemand die eigene Leistung darstellen?
Kontextverständnis: Erkennt jemand, was die Organisation hören möchte?

Das ist bei Auswahlentscheidungen heikel. Denn am Ende erhält jemand eine gute Bewertung, obwohl nicht klar ist, ob sie auf Kompetenz, Kommunikationsstärke oder geschickter Selbstinszenierung beruht. Und genau an dieser Stelle wird das Interview zur Bühne. Nicht immer zur schlechten Bühne, aber eben zur Bühne.

Die Universität Zürich beschreibt in ihrem Forschungsprojekt zu Jobinterviews genau dieses Spannungsfeld: Interviews sind die populärste Methode der Personalauswahl, gleichzeitig besteht die Sorge, ob Interviewratings das alltägliche Jobverhalten valide vorhersagen. Der High-Stakes-Charakter des Interviews motiviert Bewerbende dazu, ihr bestes Selbst zu präsentieren – also eher eine maximale als eine typische Leistung zu beschreiben.

Das muss man nicht moralisch bewerten. Bewerbende tun im Interview, was das System von ihnen verlangt. Wer sich bewirbt, soll überzeugen. Niemand wird auf die Frage nach Konflikten antworten: „Ich bin normalerweise passiv-aggressiv, aber nur montags bis donnerstags.“ Das wäre zwar originell, aber vermutlich kein Shortlist-Booster.

Die wichtigere Frage lautet deshalb:

Wie müssen Interviews gestaltet werden, damit sie weniger Inszenierung und mehr arbeitsrelevante Evidenz liefern?

Ein erster Schritt ist die bewusste Trennung zwischen maximaler und typischer Leistung. Beide Perspektiven sind relevant, aber sie beantworten unterschiedliche Fragen.

Sprint vs. Marathon: Wann ist welche Leistung gefragt?

Maximale Leistung ist wichtig, wenn Rollen besondere Belastungsspitzen aufweisen. Dazu gehören beispielsweise Krisensituationen, Eskalationen, Pitches, Verhandlungen sowie komplexe Projektphasen. In solchen Fällen ist es sinnvoll zu wissen, wozu jemand in der Lage ist, wenn es darauf ankommt.

Typische Leistung ist wichtiger, wenn Rollen stark von Konsistenz, Zusammenarbeit, Selbstorganisation und Verlässlichkeit geprägt sind. Also praktisch in fast allen Rollen, in denen Menschen nicht nur einmal glänzen, sondern dauerhaft Wert schaffen sollen.

Für Recruiting ergeben sich daraus einige praktische Konsequenzen:

Jede Interviewfrage sollte ein klares Ziel haben: maximale Leistung, typische Leistung oder Kontextverständnis.
Fragen nach Bestleistungen sollten nicht automatisch als Beleg für Alltagstauglichkeit gelten.
Fragen nach typischem Verhalten erfordern konkrete Situationen, Zeiträume und Nachfragen.
Bewertungen sollten nicht nur die Antwortqualität erfassen, sondern auch die Relevanz des Beispiels.
Interviewende müssen geschult werden, zwischen Substanz und Präsentation zu unterscheiden.

Das klingt banal, ist es aber nicht. Viele Unternehmen trainieren Interviewende vor allem darin, welche Fragen erlaubt sind, wie Bewertungsbögen verwendet werden und wie man ein Gespräch professionell führt. Das ist wichtig, reicht aber nicht aus.

Wer bessere Auswahlentscheidungen treffen will, muss das Interviewdesign als diagnostisches System verstehen. Nicht als freundliches Gespräch mit Notizen.

Ein gutes Interview beginnt deshalb nicht mit der Frage: „Was wollen wir fragen?“ Sondern mit: „Welche Form der Leistung wollen wir vorhersagen?“

Nehmen wir eine Führungsrolle. Eine klassische Frage könnte lauten: „Erzählen Sie von einer Situation, in der Sie ein schwieriges Team erfolgreich durch eine Veränderung geführt haben.“ Diese Frage zielt stark auf maximale Leistung ab. Sie lädt zur Erfolgsgeschichte ein. Das kann wertvoll sein, aber es zeigt vor allem einen markanten Höhepunkt.

Eine typische Leistungsfrage müsste anders formuliert sein: „Wie stellen Sie in normalen Arbeitswochen sicher, dass ein heterogenes Team trotz unterschiedlicher Prioritäten handlungsfähig bleibt?“ Danach wären Nachfragen entscheidend: „Was tun Sie regelmässig? Was lassen Sie bewusst weg? Wie erkennen Sie, dass es nicht funktioniert? Wann greifen Sie ein?“

Der Unterschied ist deutlich. Die erste Frage sucht den Filmtrailer. Die zweite fragt nach der Serie. Und im Job lebt man meistens in der Serie.

Was bedeutet das für das KI-gestützte Auswahlverfahren?

Besonders relevant wird das im Kontext von künstlicher Intelligenz und zunehmend optimierten Bewerbungsprozessen. Wenn Lebensläufe, Anschreiben und die Interviewvorbereitung mithilfe von KI professioneller werden, steigt die Qualität der Oberfläche. Das ist nicht automatisch Betrug. Aber es macht es schwieriger, echte Verhaltensmuster von gut vorbereiteten Antwortmustern zu unterscheiden.

Gerade deshalb werden Interviews nicht unwichtiger. Sie müssen besser werden.

Dabei helfen vier Prinzipien:

Erstens: Interviewfragen sollten stärker am Arbeitsalltag ausgerichtet sein.

Nicht an abstrakten Kompetenzen, sondern an realen Situationen der Rolle. Wer „Stakeholder Management“ messen will, sollte nicht nach Stakeholder Management fragen. Das produziert PowerPoint-Sprache. Besser ist eine konkrete Situation: „Ein Fachbereich will schnell einstellen, die Anforderungen ändern sich wöchentlich, und HR-IT blockiert eine wichtige Anpassung.“ Wie würden Sie in den nächsten zehn Arbeitstagen vorgehen?“

Zweitens: Interviewende sollten Antworten konsequent vertiefen.

Gute Kandidatinnen und Kandidaten können überzeugende Überschriften liefern. Entscheidend sind jedoch die zugrunde liegenden Mechanismen. Was genau wurde getan? Wer war beteiligt? Welche Alternative wurde verworfen? Welche Konsequenz hatte die Entscheidung? Was würde die Person heute anders machen?

Drittens: Bewertungsskalen müssen Verhalten abbilden.

Eine Skala von „1 = schwach“ bis „5 = sehr stark“ klingt zwar objektiv, ist aber oft nur eine Einladung zur gefühlten Präzision. Besser sind verhaltensverankerte Skalen. Also konkrete Beschreibungen, woran sich eine starke, mittlere oder schwache Antwort erkennen lässt.

Viertens: Interviews sollten nicht allein entscheiden.

Das Interview ist ein wichtiger Datenpunkt, aber kein Orakel. Arbeitsproben, Fallstudien, strukturierte Referenzen, realistische Job-Previews oder simulationsnahe Übungen können helfen, maximale und typische Leistung besser einzuordnen.

Das Ziel ist nicht, Bewerbende zu enttarnen. Das Ziel ist, bessere Evidenz zu gewinnen. Recruiting ist keine Kriminaltechnik mit Kalenderinvite. Es geht darum, Entscheidungen fairer, valider und nachvollziehbarer zu machen.

Für Talent-Acquisition-Teams ergibt sich daraus eine klare Aufgabe: Interviewdesign muss aus der Komfortzone raus. Weniger „Welche Fragen mögen Hiring Manager?“ und mehr „Welche Fragen liefern belastbare Entscheidungssignale?“

Eine einfache Checkliste für das nächste Interview-Audit könnte so aussehen:

Welche Kompetenzen wollen wir wirklich messen?
Welche davon zeigen sich eher bei maximaler Leistung?
Welche zeigen sich eher im typischen Alltagsverhalten?
Welche Fragen führen vor allem zu Erfolgsgeschichten?
Wo fehlen Nachfragen zur tatsächlichen Verhaltensroutine?
Welche Bewertungskriterien sind konkret beobachtbar?
Wo verwechseln wir Eloquenz mit Eignung?
Welche zusätzlichen Verfahren können Interviewratings ergänzen?

Interviews werden nicht dadurch besser, dass sie länger dauern. Sie werden besser, wenn sie präziser messen.

Das strukturierte Interview bleibt wertvoll. Aber es ist kein Selbstläufer. Es kann valide sein, muss aber sauber konstruiert werden. Sonst messen Unternehmen am Ende vor allem, wer im Bewerbungsgespräch gut Bewerbungsgespräch kann. Und das ist eine Kompetenz. Nur eben nicht immer die, die später im Job gebraucht wird.

Die unbequeme Erkenntnis: Das Interview erzählt nicht die ganze Geschichte.

Es zeigt eine Verhaltensprobe unter sehr speziellen Bedingungen. Wer daraus Alltag ableiten will, muss sehr bewusst fragen, bewerten und kombinieren.

Oder etwas zugespitzt:

Wenn wir wissen wollen, wie jemand jeden Tag arbeitet, sollten wir nicht nur fragen, wie diese Person einmal den Drachen besiegt hat.

Wir sollten auch wissen wollen, wie sie montags ihren Kalender sortiert, dienstags mit Reibung umgeht und freitags noch professionell bleibt, wenn alle anderen gedanklich schon im Wochenende parken.

Genau dort entsteht Job Performance. Nicht nur im Glanzmoment. Sondern im Muster.

Marcus Fischer

Leading Talent Acquisition.

EN / DE