Methodologie

Wie Klyptra Medien-Bias misst.

Diese Seite legt jede methodische Entscheidung offen. Jede Schicht ist wissenschaftlich verankert, jeder Befund mit Verbatim-Beleg nachvollziehbar — auch und gerade für Leser, die unseren Ergebnissen zunächst misstrauen.

Was misst Klyptra?

Sprache und Framing in Nachrichten — auf 6 Dimensionen mit 27 Sub-Mustern.

↓ Sektion lesen

Wer entscheidet die Werte?

Drei Sprachmodelle parallel, mit Verbatim-Belegen für jeden Befund.

↓ Sektion lesen

Wie sicher sind die Werte?

Drei Modelle urteilen unabhängig; Streuung und Konfidenz werden je Analyse offen ausgewiesen.

↓ Sektion lesen

Die Skala

0 ist nicht null. 10 ist nicht perfekt.

Die sechs Dimensionen und die 0–10-Skala sind Klyptras Operationalisierung der Media Bias Taxonomy (Spinde et al. 2023) — kein direkter Bestandteil von BABE, das binär (biased/neutral) annotiert. Die Skala wird gegen BABE-artige Experten-Benchmarks kalibriert. Die fünf Bänder sind nicht gleich breit: Nachrichtenagentur-Berichterstattung (dpa, AFP, Reuters) trifft typischerweise 8–9 — ein Wert von 10 wäre nur noch reine Faktenlistung ohne jede narrative Auswahl, praktisch unerreichbar. Nach unten existiert dagegen weiter Raum: das Propaganda-Band (0–2.9) ist mit drei Punkten Breite das größte.

9 – 10

1 Punkt

sehr_objektiv

Quasi-neutrale Berichterstattung. Keine wertenden Adjektive, balancierte Quellen, Spekulation klar als solche markiert. Nachrichtenagentur-Niveau (dpa, AFP, Reuters).

7 – 8.9

2 Punkte

objektiv

Solide journalistische Standards. Vereinzelte Wertungen erkennbar, aber transparent als Meinung gekennzeichnet. Mehrere Perspektiven vertreten.

5 – 6.9

2 Punkte

moderat_biased

Klar erkennbare redaktionelle Linie. Wortwahl mit Tendenz, einseitige Quellenwahl, aber keine systematische Verzerrung.

3 – 4.9

2 Punkte

stark_biased

Konsistente einseitige Darstellung. Loaded Words ohne Kennzeichnung, Auslassen entlastender Fakten, emotionale Aufladung.

0 – 2.9

3 Punkte

propaganda

Tatsachen werden verzerrt, Gegenseite nicht oder nur als Strohmann zitiert, Sensations-Framing dominiert. Breitestes Band — nach unten existiert mehr Raum als nach oben.

Die Labels in dieser Tabelle sind exakt die Strings, die der Analyzer im JSON-Output und im Permalink-UI ausgibt — kein UI-Mapping dazwischen.

Die sechs Dimensionen — vertieft

Was jede Dimension misst und woher sie kommt.

Framing

Media Bias Taxonomy (Spinde et al. 2023) · Framing-Bias

Welche Perspektive wird zur narrativen Norm erklärt? Wer ist Subjekt, wer Objekt?

Operationalisierung

Aktiv-/Passiv-Konstruktionen mit politischer Asymmetrie
Reihenfolge der genannten Akteure
Implizite Schuldzuweisung durch Verb-Wahl

Wortwahl

Media Bias Taxonomy (Spinde et al. 2023) · Lexical Bias

Welche Wörter tragen Wertungen ohne sie zu markieren? Loaded Language im engeren Sinn.

Operationalisierung

Verbatim-Identifikation wertender Begriffe
Vergleich mit neutralen Synonymen
Dichte pro 1000 Wörter

Quellenvielfalt

Media Bias Taxonomy (Spinde et al. 2023) · Selection/Coverage

Wie viele Stimmen kommen direkt zu Wort, wie politisch breit ist das Spektrum?

Operationalisierung

Anzahl direkt zitierter Personen / Institutionen
Politische Verortung der Zitierten
Verhältnis Original- zu Sekundärquellen

Im Buch (Spinde 2025, Kap. 2) ist Quellen-/Selection-Bias ein reporting-level-Konstrukt, das streng artikelübergreifend misst. Klyptra approximiert es am Einzeltext — die vollständige Cross-Outlet-Analyse liegt auf Tier-2 (nicht im Score).

Fakt / Meinung

Media Bias Taxonomy (Spinde et al. 2023) · Epistemological Bias

Wird Bewertung sprachlich von Beobachtung getrennt — oder als Faktum verkauft?

Operationalisierung

Markierung von Kommentaren („meint“, „so X“)
Prognosen vs. Tatsachen
Konjunktiv-Disziplin

Eigene Dimension, weil die deutsche Nachrichten-Sprache Bewertung und Beobachtung syntaktisch besonders eng verschränkt (Substantivierung, Modalverben, Konjunktiv I/II) — die englische BABE-Annotation deckt das nur indirekt ab.

Vollständigkeit

Media Bias Taxonomy (Spinde et al. 2023) · Spin/Omission

Was wird ausgelassen? Welche relevanten Hintergründe oder Gegenpositionen fehlen?

Operationalisierung

Erkennbar fehlende Gegenpositionen zu zentralen Behauptungen
Einseitige Faktenauswahl (Cherry-Picking)
Kontextlücken, die die Einordnung verzerren

Auslassungs-/Spin-Bias ist im Buch teils reporting-level (was über mehrere Artikel hinweg fehlt). Klyptra bewertet die im Einzeltext erkennbaren Lücken; die artikelübergreifende Ebene ist Tier-2.

Emotionale Balance

Media Bias Taxonomy (Spinde et al. 2023) · Phrasing/Sentiment

Wie stark wird emotional aufgeladen? Sensations- oder Empörungs-Sprache?

Operationalisierung

Ausrufezeichen-Dichte in Headline und Lead
Eskalations-Vokabular („Skandal“, „Beben“, „Wahnsinn“)
Adjektiv-Intensität

27 Sub-Kategorien

Unter jeder Dimension liegt ein konkretes Muster.

Die sechs Dimensionen sind die Top-Level-Achsen. Darunter führt Klyptra 27 spezifische Bias-Muster nach der BiasScanner-Taxonomie (Menzner & Leidner 2024). Pro Artikel werden 0–N Muster identifiziert — jedes mit Verbatim-Beleg, Position im Text und Stärke-Einschätzung.

Sub-Kategorien sind qualitative Marker, keine numerischen Sub-Scores. Wenn die Top-Dimension etwa „Vollständigkeit“ niedrig bewertet ist, zeigt der Sub-Layer welches konkrete Muster den Befund trägt — z.B. Cherry-Picking oder Whataboutism.

Wortwahl

word_choice

4 Muster

Lexikalische Ebene — Wörter, die werten, ohne die Wertung als solche zu markieren.

Wortwahl-Bias
Word Choice Bias
Beispiel„Migrant“ wird durchgängig als „Eindringling“ bezeichnet.
Emotionaler Sensationalismus
Emotional Sensationalism
Beispiel„Albtraum-Szenario“, „Schock-Diagnose“, „Untergangs-Stimmung“ als Routine-Vokabel.
Diskriminierungs-Bias
Discrimination Bias
BeispielGeneralisierung über Gruppen („typisch für …-Migranten“), Herkunfts-Erwähnung ohne Relevanz.
Schmutzkampagne / Lobeshymne
Smear / Praise Bias
Beispiel„skandalöser Versuch“ für die eine Partei vs. „mutige Initiative“ für die andere — bei gleichartiger Handlung.

Framing

framing

6 Muster

Narrative Konstrukte — wie ein Sachverhalt erzählerisch gerahmt wird, unabhängig von einzelnen Wörtern.

Strohmann
Straw Man
Beispiel„Die Linke will, dass alle Migranten sofort ein Haus bekommen.“ Eine Karikatur der Gegenposition wird angegriffen.
Falsche Dichotomie
False Dichotomy
Beispiel„Entweder wir senken Steuern — oder das Land geht unter.“ Zwei Optionen suggeriert, wo viele existieren.
Falsche Analogie
False Analogy
Beispiel„Wie damals 1933 …“ für eine aktuelle politische Debatte mit losem Bezug.
Suggestivfragen
Insinuative Questioning
Beispiel„Warum schweigt der Kanzler zu den Vorwürfen?“ — ohne dass die Vorwürfe selbst belegt sind.
Verschobener Maßstab
Moving Goalposts
Beispiel„Erwartet waren 5 % Wachstum, jetzt sind es 8 % — also Misserfolg.“ Maßstab nach Resultat angepasst.
Intergruppen-Bias
In-Group / Out-Group Bias
BeispielKonsequente „wir Deutschen“ vs. „die“ — kollektive Schuld- oder Tugend-Zuweisung.

Quellenvielfalt

source_diversity

3 Muster

Quellen-Qualität — wer kommt zu Wort, wie wird zitiert, sind die Stimmen einordbar.

Quellen-Auswahl-Bias
Source Selection Bias
BeispielNur die Pressestelle einer Partei wird zitiert, die Gegenseite gar nicht oder nur paraphrasiert.
Externe Validierung
External Validation Bias
BeispielEin Lobby-Vertreter wird als „unabhängiger Experte“ eingeführt, ohne Interessenslage zu nennen.
Unklare Zuschreibung
Vague Attribution
Beispiel„Kreise berichten …“, „Insider zufolge …“ tragen das zentrale Argument des Stücks.

Fakt-Meinung-Trennung

fact_opinion_separation

5 Muster

Sprachliche Disziplin — wird Bewertung als Bewertung markiert oder als Faktum verkauft.

Meinungsstark
Opinionated Bias
Beispiel„Die katastrophale Politik der Regierung …“ — wertendes Adjektiv im Nachrichten-Modus.
Spekulation
Speculation Bias
Beispiel„Das wird zweifellos in einem Desaster enden.“ Prognose ohne Konjunktiv, ohne Quelle.
Unbewiesene Behauptung
Unsubstantiated Claims
Beispiel„Millionen sind betroffen“ — Zahl ohne Beleg, ohne Quelle, ohne Methode.
Projektion
Projection Bias
Beispiel„Es geht ihnen nur um Macht.“ Motiv-Zuschreibung als Tatsachenbehauptung.
Zirkelschluss
Circular Reasoning
Beispiel„Es ist illegal, weil es gegen das Gesetz verstößt.“ Begründung wiederholt die Behauptung.

Vollständigkeit

completeness

4 Muster

Was fehlt — relevante Kontexte, Gegenargumente, Belege, die nicht erwähnt werden.

Rosinenpickerei
Cherry-Picking
BeispielEine Studie wird zitiert, drei methodisch vergleichbare Studien mit gegenteiligem Ergebnis nicht.
Anekdotische Evidenz
Anecdotal Evidence
Beispiel„Frau M. aus Hamburg sagt …“ trägt einen Trend-Befund, statistische Daten fehlen.
Whataboutism
Whataboutism
BeispielKonsequente Ablenkung vom Hauptvorwurf auf das Verhalten anderer Akteure.
Falsche Ausgewogenheit
False Balance
BeispielKlimaforscher und Klimaleugner werden als gleichwertige Stimmen präsentiert — obwohl die Evidenzbasis asymmetrisch ist.

Emotionale Balance

emotional_balance

5 Muster

Affektive Aufladung — wie stark und in welche Richtung der Text emotional färbt.

Ad Hominem
Ad Hominem
Beispiel„Der inkompetente Minister …“ — Person attackiert statt Argument widerlegt.
Kausales Missverständnis
Causal Misunderstanding
Beispiel„Seit X regiert, sinkt Y — also schuld X.“ Korrelation als Kausalität, ohne Mechanismus.
Verallgemeinerung
Generalization
Beispiel„Alle Politiker lügen“, „die Medien“ als monolithischer Akteur.
Kommerzieller Bias
Commercial Bias
BeispielProduktbericht ohne Distanz, redaktioneller Inhalt nicht von Werbung getrennt.
Politischer Bias
Political Bias
BeispielKonsistente Lager-Tendenz über Faktenauswahl, Wortwahl und Quellen hinweg.

Jeder Sub-Befund durchläuft dasselbe Verbatim-Gate wie die Top-Level-Analyse: Befunde ohne im Originaltext belegbares Zitat werden verworfen. Im JSON-Export einer Analyse findet sich der Layer als sub_categories[] mit parent_dimension, verbatim_quote, char_offset und bias_strength.

Akteurs-Analyse — PFA-light

Wer wird wie ins Licht gerückt?

Person-Oriented Framing Analysis (Felix Hamborg 2023) extrahiert pro Artikel die benannten Akteure und beschreibt, wie über sie geredet wird. Das ist konkreter als jeder holistische Score — und macht systematische Asymmetrien zwischen Akteuren sichtbar.

Pro Akteur

Jede identifizierte Person (Politiker, Wissenschaftler, Bürger, …) bekommt vier Felder:

mentions_count
Wie oft tritt der Akteur auf — über alle Bezeichnungen hinweg (siehe Coreference).
sentiment_score
Aggregierte Tonalität gegenüber dem Akteur auf der Skala −1 (negativ) bis +1 (positiv).
framing_devices
Bis zu fünf wiederkehrende Stilmittel pro Akteur — z.B. „Schuld-Zuschreibung“, „Held-Narrativ“, „Opfer-Inszenierung“.
representative_quotes
Drei bis fünf Verbatim-Zitate, die das Framing tragen — Verbatim-Gate stellt sicher, dass jedes Zitat 1:1 im Text steht.

Cross-Person-Analyse

Aus den Einzel-Akteuren wird eine Verteilungs-Beobachtung errechnet — ob der Artikel die Personen sprachlich vergleichbar behandelt oder nicht.

sentiment_disparity

Differenz zwischen dem positivsten und negativsten Akteur-Sentiment im Artikel — berechnet über alle Akteure mit mentions_count ≥ 2.

disparity = max(sentiments) − min(sentiments)

balance_assessment

Qualitative Einordnung der Disparität: ausgewogen / leicht_asymmetrisch / stark_asymmetrisch. Bei < 2 Akteuren mit hinreichend Mentions liefert das Feld nicht_anwendbar — statt einen Wert zu erfinden.

Aggregation aus Modellen

cross_person_analysis wird nicht vom Sprachmodell übernommen, sondern deterministisch neu berechnet aus den gefilterten Akteur-Daten. Damit ist die Disparitäts-Kennzahl immer konsistent mit den ausgewiesenen Sentiment-Werten — auch wenn das Modell intern abweichend zusammenfassen würde.

Coreference-Dokumentation

Dieselbe Person, drei Namen.

Politische Texte referenzieren dieselbe Entität auf mehreren Wegen — mit Namen, mit Rolle, mit Pronomen. Klyptra dokumentiert diese Querverweise explizit, damit Mention-Counts und Akteurs-Sentiment nicht durch reine Synonymie verzerrt werden.

Was passiert

Pro Artikel wird eine Liste coreference_documentation.entities[] ausgewiesen. Jede Entity hat einen canonical_name und eine Liste aller im Text gefundenen all_mentions[].

mention_count wird anschließend deterministisch als Summe nicht-überlappender Substring-Treffer aller Mentions im Text neu berechnet — nicht vom Sprachmodell übernommen.

Beispiel

In einem Bericht zur Ukraine-Politik:

canonical_name

Wolodymyr Selenskyj

all_mentions

„Selenskyj“
„der ukrainische Präsident“
„der Staatschef in Kiew“

mention_count

Ohne diese Auflösung würde der Akteur in drei verschiedenen Buckets landen — und die Sentiment-Aggregation in der PFA-Schicht würde verzerrt.

Pipeline

Vom eingereichten Text zum belegten Ergebnis.

Jeder Schritt ist isoliert testbar und protokolliert. Wer ein Ergebnis hinterfragt, kann die Kette bis zur einzelnen Belegstelle im Text zurückverfolgen.

Eingabe

Eingereichter Text

Der zu prüfende Artikel-Text wird direkt eingereicht (Einfügen oder Datei) — optional mit Titel und Quellen-Label. Klyptra analysiert genau diesen Text, nicht das Medium dahinter.

200–50 000 ZeichenTitel optionalQuelle optional

Ensemble-Analyse

3 Modelle parallel

Drei Sprachmodelle bewerten denselben Text unabhängig auf alle sechs Dimensionen und extrahieren parallel die Detail-Schichten: Sub-Kategorien-Befunde, Akteurs-Mentions mit Sentiment und Coreference-Cluster. Eine Chain-of-Verification (5 Kontroll-Fragen) reduziert Halluzinationen.

gpt-5.4-minimistral-large-2512deepseek-v4-flash

Aggregation

Median + Übereinstimmung

Numerische Scores: Median über die drei Modelle. Labels: Mehrheitsentscheid. Die Spannweite der Einzelurteile wird je Dimension als Modell-Übereinstimmung ausgewiesen — sie bleibt sichtbar, statt im Mittelwert zu verschwinden.

MedianMajority VoteÜbereinstimmungs-Ausweis

Verbatim-Gate & Markup

Belege wörtlich geprüft

Jeder Befund muss ein Zitat tragen, das exakt im Originaltext steht — sonst wird der Beleg verworfen (die Einschätzung bleibt als modellbasiert markiert). Verifizierte Belege werden mit Zeichen-Offset im Text hervorgehoben. Ergebnis ist ein Permalink mit 30 Tagen TTL.

exakter String-Matchchar_offset-MarkupPermalink 30 Tage

Ein Analyzer, zwei Verwendungen

Derselbe Analyzer-Code läuft in zwei Kontexten:

On-Demand (über /analyse): die eigentliche Analyse eines eingereichten Textes — mit Permalink, 30 Tage TTL.
Referenz-Korpus (intern): ein laufend mitanalysierter Korpus dient ausschließlich der Kalibrierung der Skala. Er erzeugt keine öffentlichen Outlet-Profile und fließt nicht in einzelne Nutzer-Analysen ein.

Ensemble

Drei Modelle, weil keines allein vertrauenswürdig ist.

Sprachmodelle haben eigene, modell-spezifische Verzerrungen. Klyptra wählt drei Modelle aus drei verschiedenen Pre-Training-Pipelines, damit blinde Flecken eines einzelnen Modells durch die anderen sichtbar werden. Aggregiert wird per Median (numerisch) und Majority Vote (Labels) — alle Modelle haben gleiches Gewicht, keines wird bevorzugt.

GPT-5.4 mini

OpenAI (USA)

Schlanke, latenzarme Variante der GPT-5.4-Reihe — trägt die On-Demand-Analyse, ohne die Score-Konsistenz der großen Modelle aufzugeben.

Mistral Large 2512

Mistral AI (Frankreich / EU)

Europäische Pre-Training-Pipeline eines unabhängigen Anbieters — bringt eine andere Trainingsgrundlage als die US-Modelle ein.

DeepSeek V4 Flash

DeepSeek (China)

Drittes, davon unabhängiges Pre-Training-Korpus — weicht dieses Modell vom Konsens ab, wird die Streuung als Modell-Übereinstimmung sichtbar.

Aggregation

Numerische Scores

Median über alle 3 Modelle. Robust gegen Ausreißer eines einzelnen Modells.

Kategorische Labels

Majority Vote. Bei 1:1:1-Split fällt das Label zurück auf den median-nahen Score.

Modell-Übereinstimmung

Die Spannweite der drei Urteile wird je Dimension als hohe, mittlere oder geringe Übereinstimmung ausgewiesen — getrennt von der Konfidenz des Modells.

Wissenschaftliche Grundlagen

Peer-reviewed Fundament, eine Methodik.

Klyptra ist keine Eigenkonstruktion. Jede methodische Schicht referenziert eine peer-reviewed Quelle mit DOI. Die Differenzierung gegenüber BiasScanner (unserem direkten Vorgänger) liegt im Drei-Modell-Ensemble, der deutschen Sprach-Spezialisierung, dem Verbatim-Gate und dem PFA-Layer.

Konzept & 6 Dimensionen

Spinde et al. (2023) — Media Bias Taxonomy

Die sechs Dimensionen operationalisieren die Bias-Typen der Media Bias Taxonomy. BABE (Spinde et al. 2021, EMNLP-Findings) dient als experten-annotierter Validierungs-Benchmark (binär biased/neutral) und IRR-Maßstab — die 0–10-Skala selbst ist Klyptras Operationalisierung, nicht Teil von BABE.

Spinde et al. (2023) Media Bias Taxonomy, ACM Comput. Surv., arXiv:2312.16148 · BABE: EMNLP-Findings 2021, DOI: 10.18653/v1/2021.findings-emnlp.101 · konsolidiert in Spinde (2025), Springer, Open Access, DOI: 10.1007/978-3-658-47798-1

→ 6 Dimensionen

27 Sub-Muster

Menzner & Leidner (2024) — BiasScanner-Taxonomie

Die 27 spezifischen Bias-Kategorien werden als Sub-Layer unter die sechs Klyptra-Dimensionen eingeordnet. BiasScanner ist Klyptras direkter wissenschaftlicher Vorgänger. Nicht Teil von Spindes Arbeiten — eigenständige Grundlage.

Menzner & Leidner (2024) „Improved Models for Media Bias Detection and Subcategorization“, NLDB 2024, S. 181–196. DOI: 10.1007/978-3-031-70239-6_13

→ 27 Sub-Muster

Akteurs-Layer

Felix Hamborg (2023) — Person-Oriented Framing Analysis

PFA-light extrahiert benannte Akteure mit Mention-Counts, Sentiment und Framing-Devices. Die Cross-Person-Disparity macht systematische Asymmetrien sichtbar.

Hamborg (2023) „Revealing Media Bias in News Articles“, Springer. DOI: 10.1007/978-3-031-17693-7

→ PFA-Sektion

Grenzen

Was Klyptra nicht leistet.

Methodische Ehrlichkeit verlangt, die Schwachstellen zu benennen. Diese Liste ist nicht abschließend — Beiträge sind willkommen.

LLMs als Annotatoren

Sprachmodelle haben dokumentierte Verzerrungen (Horych et al. 2025). Ensemble + Verbatim-Pflicht reduzieren das, beseitigen es aber nicht. Klyptra ist kein Schiedsrichter — sondern ein systematischer, überprüfbarer Indikator.

Momentaufnahme eines Textes

Klyptra bewertet genau den eingereichten Text — nicht das Medium, die Redaktion oder den Autor dahinter. Ein einzelnes Ergebnis ist kein Urteil über ein Outlet; aus einer Analyse lässt sich keine generelle „Tendenz“ einer Quelle ableiten.

Sprachebene, nicht Faktentreue

Klyptra misst Sprache und Framing — nicht ob behauptete Fakten stimmen. Faktencheck ist eine separate Aufgabe (siehe Correctiv, dpa-Faktencheck).

Belege ohne wörtliche Deckung werden verworfen

Das Verbatim-Gate hält nur Zitate, die exakt im Text stehen. Paraphrasen werden nicht als Beleg ausgegeben — manche Dimensionen erscheinen daher bewusst ohne Beleg-Zitat und sind als modellbasierte Einschätzung markiert. Ehrlichkeit vor erzwungenem Beleg.

Detail-Schichten noch nicht ensemble-aggregiert

Die sechs Top-Level-Scores werden über alle drei Modelle aggregiert (Median) und mit ihrer Streuung ausgewiesen. Die Detail-Schichten (Sub-Kategorien, Akteurs-Analyse, Coreference) stammen derzeit aus einem der drei Modelle — eine echte Union/Dedupe-Aggregation über alle Modelle ist als nächste Ausbaustufe geplant. Bewusste MVP-Entscheidung, kein Bug.

Deutsche Sprach-Spezialisierung

Die drei Modelle sind primär englischsprachig vortrainiert. Idiomatik, Konjunktiv-Disziplin und Ironie-Erkennung können im Deutschen dünner ausfallen als im Englischen. Few-Shot-Beispiele kompensieren teilweise; eine systematische deutsche Ground-Truth-Evaluation ist Forschungs-Roadmap.

Genre-Bias: Kommentare als Nachrichten

Die sechs Dimensionen sind auf nachrichtliche Berichterstattung kalibriert. Kommt ein Kommentar als Eingabe, schlagen Wortwahl und Emotionale Balance erwartungsgemäß stark aus — Klyptra erkennt heute noch nicht zuverlässig, ob ein Text als Bericht oder Kommentar einzuordnen ist. Eine Genre-Erkennung als Pre-Stage ist in der Methodik-Roadmap dokumentiert.

Bias-Annotation ist konstitutiv subjektiv

Selbst trainierte Experten erreichen bei Bias-Labels nur eine Übereinstimmung von Krippendorff α ≈ 0,40 (Spinde 2025, Kap. 4) — das ist das dokumentierte Maximum der Domäne, kein Schwäche-Signal. Einen starken „Ground Truth“ gibt es nicht; Klyptras Konsistenz-Anspruch zielt auf dieses Experten-Niveau, nicht auf objektive Wahrheit.

Technisch messbar ist nicht gesellschaftlich relevant

Automatisierte Verfahren können Muster ausweisen, die statistisch greifbar, aber inhaltlich belanglos sind (Spinde 2025, Kap. 8). Ein Score ist ein systematischer Indikator, kein abschließendes Urteil über die Bedeutung eines Textes.

Der eigene Standpunkt färbt die Wahrnehmung

Leser empfinden Texte, die ihrer Position widersprechen, als verzerrter als vergleichbare Texte der eigenen Seite (Hostile-Media-Effekt). Studien zeigen, dass selbst Bias-Visualisierungen diesen Effekt nicht auflösen (Spinde 2025, Kap. 7) — ein Ergebnis wird durch die eigene Haltung gefiltert gelesen.

Politische Einordnung ist keine Bias-Aussage

Spinde (2025, Kap. 7) zeigt, dass eine politische Klassifikation die Bias-Wahrnehmung nicht erhöht — sie kommuniziert Haltung, nicht Verzerrung. Klyptras politische, wirtschaftliche und soziale Deskriptoren sind Tendenz-Indikation und fließen nicht in den Objektivitäts-Score ein.

Versions-Historie

Wann sich was geändert hat.

Jede einzelne Analyse trägt einen methodology_version-Tag. Bestehende Analysen behalten ihre Version — Methodik-Updates erzeugen keinen Score-Drift in historischen Daten.

v1.0

April 2026

6 Top-Level-Dimensionen + Verbatim-Quote-Gate + Multi-Modell-Ensemble. Wissenschaftliche Basis: Media Bias Taxonomy (Spinde et al. 2023), validiert gegen BABE (2021).

v1.1

Mai 2026

Zusätzlich: 27 Bias-Sub-Kategorien (BiasScanner), Person-Oriented Framing Analysis (PFA-light nach Felix Hamborg), Coreference-Dokumentation. Bestehende v1.0-Analysen bleiben gültig — neue Layer sind additiv.

Reproduzierbarkeit

Methodik, Daten, Prompts.

Klyptra legt seine Methodik offen: Modellversionen, Bias-Dimensionen und die zugrunde liegende Forschung sind auf dieser Seite dokumentiert. Jede Analyse trägt zudem eine Signatur (System-Prompt-Hash), die ihren exakten Methodik-Stand nachvollziehbar festhält.

Methodik

Bias-Dimensionen, Skala und Aggregationslogik sind auf dieser Seite vollständig beschrieben.

Daten

Jede Analyse ist als JSON und PDF für die Erstellerin oder den Ersteller exportierbar.

Prompts

Versionierte Prompt-Templates inkl. Few-Shot-Beispielen. Diff-Log für jede Änderung.

Wie Klyptra Medien-Bias misst.

0 ist nicht null. 10 ist nicht perfekt.

Was jede Dimension misst und woher sie kommt.

Framing

Wortwahl

Quellenvielfalt

Fakt / Meinung

Vollständigkeit

Emotionale Balance

Unter jeder Dimension liegt ein konkretes Muster.

Wortwahl

Wortwahl-Bias

Emotionaler Sensationalismus

Diskriminierungs-Bias

Schmutzkampagne / Lobeshymne

Framing

Strohmann

Falsche Dichotomie

Falsche Analogie

Suggestivfragen

Verschobener Maßstab

Intergruppen-Bias

Quellenvielfalt

Quellen-Auswahl-Bias

Externe Validierung

Unklare Zuschreibung

Fakt-Meinung-Trennung

Meinungsstark

Spekulation

Unbewiesene Behauptung

Projektion

Zirkelschluss

Vollständigkeit

Rosinenpickerei

Anekdotische Evidenz

Whataboutism

Falsche Ausgewogenheit

Emotionale Balance

Ad Hominem

Kausales Missverständnis

Verallgemeinerung

Kommerzieller Bias

Politischer Bias

Wer wird wie ins Licht gerückt?

Pro Akteur

Cross-Person-Analyse

Dieselbe Person, drei Namen.

Was passiert

Beispiel

Vom eingereichten Text zum belegten Ergebnis.

Eingabe

Ensemble-Analyse

Aggregation

Verbatim-Gate & Markup

Drei Modelle, weil keines allein vertrauenswürdig ist.

GPT-5.4 mini

Mistral Large 2512

DeepSeek V4 Flash

Aggregation

Peer-reviewed Fundament, eine Methodik.

Spinde et al. (2023) — Media Bias Taxonomy

Menzner & Leidner (2024) — BiasScanner-Taxonomie

Felix Hamborg (2023) — Person-Oriented Framing Analysis

Was Klyptra nicht leistet.

LLMs als Annotatoren

Momentaufnahme eines Textes

Sprachebene, nicht Faktentreue

Belege ohne wörtliche Deckung werden verworfen

Detail-Schichten noch nicht ensemble-aggregiert

Deutsche Sprach-Spezialisierung

Genre-Bias: Kommentare als Nachrichten

Bias-Annotation ist konstitutiv subjektiv

Technisch messbar ist nicht gesellschaftlich relevant

Der eigene Standpunkt färbt die Wahrnehmung

Politische Einordnung ist keine Bias-Aussage

Wann sich was geändert hat.

Methodik, Daten, Prompts.