In dieser Episode des Criminology Cast spricht David Studer mit Dr. Luca Ranzoni, Gerichtsschreiber am Bundesgericht, über dessen Dissertation «Gerechte Strafen ohne Gleichheit?» (PDF-Link). Ranzoni untersucht darin die Praxis der Strafzumessung in der Schweiz und stellt die Frage, ob gleiche Taten tatsächlich zu gleichen Strafen führen. Im Rahmen einer Umfrage legte er über 240 erstinstanzlichen Strafrichter:innen identische Fallvignetten vor. Die Ergebnisse zeigen deutliche Unterschiede: Rund 40 Prozent der Urteile lagen ausserhalb des von den Richter:innen selbst definierten „vertretbaren Bereichs“. Besonders überraschend war, dass Vermögensdelikte uneinheitlicher beurteilt wurden als Gewaltdelikte, obwohl eigentlich klare Anker wie die Schadenshöhe vorhanden wären. Das Gespräch beleuchtet die rechtlichen Grundlagen der Strafzumessung nach Art. 47 StGB und den grossen Ermessensspielraum der Gerichte, das Spannungsfeld zwischen individueller Einzelfallgerechtigkeit und übergeordneter Rechtsgleichheit, föderale Unterschiede und ihre Vereinbarkeit mit Art. 8 BV sowie die begrenzte Rolle von Vergleichsfällen, Bauchgefühl und Erfahrung in der Praxis. Abschliessend diskutieren wir mögliche Reformansätze – von der systematischen Veröffentlichung erstinstanzlicher Urteile bis hin zu Aggregationsregeln bei Kollegialgerichten. Das Interview zeigt eindrücklich, dass Strafzumessung kein mechanischer Vorgang ist, sondern ein komplexer Balanceakt. Ranzonis empirische Ergebnisse werfen die Frage auf, ob das heutige System genügend Transparenz, Einheitlichkeit und Nachvollziehbarkeit gewährleistet – oder ob Reformen nötig sind.
Intro
In der heutigen Folge geht es um das Thema Strafzumessung – also darum, wie Richter an den Schweizer Gerichten überhaupt festlegen, wie hoch eine Strafe für einen bestimmten Täter oder eine bestimmte Straftat ausfallen soll. Das ist ein Thema, das in der kriminologischen Forschung schon länger auf der Agenda steht und fast ein Klassiker ist. Entsprechend gibt es viele Untersuchungen dazu – etwa, welche Faktoren bei der Strafzumessung eine Rolle spielen, obwohl sie vom Gesetz her eigentlich keinen Einfluss haben dürften. Zum Beispiel: Hat die politische Ausrichtung eines Richters Einfluss? Werden Frauen, ältere Menschen oder Personen aus der Oberschicht tendenziell milder behandelt als Männer, Jüngere und Personen aus der unteren sozialen Schicht? Gerade in den USA gibt es viele Studien zu Unterschieden im Strafmass zwischen verschiedenen Ethnien – etwa, ob African Americans oder Hispanics systematisch benachteiligt werden.
Einleitung und Vorstellung des Gastes
Mein heutiger Gast ist Luca Ranzoni. Er hat sich ebenfalls mit dem Thema Strafzumessung auseinandergesetzt – im Rahmen seiner Doktorarbeit. Aber er ist einen anderen Weg gegangen: Für ihn war weniger interessant, welche Ursachen hinter Unterschieden stehen, sondern er wollte wissen: Wie funktioniert Strafzumessung überhaupt, und führt sie zu gleichen und fairen Ergebnissen? Oder anders gefragt: Wenn man verschiedenen Richtern den exakt gleichen Fall vorlegt – kommen sie zum gleichen Strafmass? Ich kann schon etwas spoilern: Das ist nicht so. Es gibt relativ grosse Unterschiede zwischen den Richtern. Das ist natürlich nicht unproblematisch, aber darauf kommen wir sicher noch zurück.
Luca, schön bist du da, und danke, dass du dich bereit erklärt hast, mit mir über deine spannende Untersuchung zu sprechen.
David, vielen Dank für die Einladung. Es ist immer schön, wenn sich jemand für die eigene Arbeit interessiert. Darum bin ich sehr gerne da.
Ich möchte dich noch kurz vorstellen, für alle, die dich nicht kennen. Du hast an der Uni Zürich Rechtswissenschaften studiert und nach deinem Studium Praktika bei Kanzleien und Gerichten absolviert. Danach bist du zurück an die Uni und hast dort deine Dissertation verfasst, über die wir heute sprechen. Du hast dein Werk bei einem Open-Access-Verlag veröffentlicht – es kann also jeder im Internet nachlesen. Den Link verlinke ich gerne in den Shownotes. Seit 2024 arbeitest du beim Bundesgericht in Lausanne, in der ersten strafrechtlichen Abteilung.
Beweggründe für die Untersuchung
Der Titel deiner Dissertation lautet «Gerechte Strafen ohne Gleichheit?» – es geht also um das Thema Gleichbehandlung in der Strafzumessung. Wie bist du überhaupt auf das Thema aufmerksam geworden? Böse Zungen sagen ja, es ist fast schwieriger, ein gutes Thema zu finden, als die Arbeit dann wirklich zu schreiben.
Das ist sicher oft so, bei mir war es aber nicht so. Das Thema hat sich mir aufgedrängt. Wie du gesagt hast, war ich als Teil meines Anwaltspraktikums und später kurz aols Gerichtsschreiber nach dem Patent am Gericht tätig. Dort hatte ich immer Mühe mit dem Teil des Urteils, bei dem es um die Strafzumessung geht. Die rechtliche Auseinandersetzung, ob etwas im Tatbestand erfüllt ist oder nicht, fiel mir leichter. Aber wenn es darum ging zu begründen, welche Strafe es geben soll, oder wenn man einen Vorschlag machen musste, fehlten Hilfsmittel. Es gibt keine Quelle, an der man lernen kann, wie man das macht. Etwa in dieser Zeit erschien das neue Buch von Kahnemann und Kollegen, das sich mit diesem Phänomen befasst – auch spezifisch mit der Strafzumessung: dass verschiedene Entscheidungsträger bei ähnlichen Entscheidungen zu ganz unterschiedlichen Ergebnissen kommen. Diese Kombination war der Hintergrund, weshalb ich am Lehrstuhl mit diesem Thema gestartet bin.
Also bist du über deine praktische Arbeit darauf aufmerksam geworden. Ich habe gesagt, du hast eine klassische juristische Ausbildung absolviert. Deine Arbeit ist aber inhaltlich eher kriminologisch, sozialwissenschaftlich geprägt. Das sind ja unterschiedliche Denkweisen: In der Rechtswissenschaft arbeitet man stark mit Einzelfällen, während in den Sozialwissenschaften Statistik und Methoden eine zentrale Rolle spielen. Was hast du erlebt, als du in diese neue Welt eintauchen musstest?
Es war spannend, etwas Neues zu lernen. Ein bisschen hatte ich das schon im Studium, da ich mich für Kriminologie interessierte und auch englische Literatur gelesen habe. Aber wenn es um Methodenfragen geht, gibt es auf dem internationalen Publikationsmarkt unglaublich viel Literatur – für jede kleinste Frage. Da kann man sich verlieren. Das war eine Herausforderung. Schön war aber auch: Wenn man beim juristischen Teil nicht weiterkam, konnte man sich mit etwas ganz anderem befassen. Diesen Vorteil haben rein juristische Dissertationen nicht.
Gesetzliche Vorgaben der Strafzumessung und die Rolle der Rechtsgleichheit
Das Hauptthema deiner Arbeit ist also „Strafzumessung und Gleichbehandlung“. Vielleicht kannst du juristisch einordnen: Welche Vorgaben gibt das Gesetz? Wie muss ein Richter vorgehen, wenn er eine Strafe festsetzen will?
Das steht in Artikel 47 StGB. Die Logik ist einfach: Es gibt viele Tatbestände mit einem Strafrahmen. Zum Beispiel Diebstahl: Verboten, mit Strafe bedroht, Strafrahmen Geldstrafe oder Freiheitsstrafe bis zu fünf Jahre. Ein Richter schaut also zuerst: Welcher Tatbestand liegt vor? Dann schaut er in den Strafrahmen – die Strafe muss darin liegen.
Das Gesetz sagt, man muss das Verschulden des Täters bewerten: Beweggründe, angerichteter Schaden usw. Die Idee des Gesetzgebers war, dass sich alle möglichen Diebstähle in diesem Rahmen abbilden lassen – schwere am oberen Ende, leichte am unteren Ende. Aber das Gesetz bleibt vage und überlässt den Gerichten viel Freiheit.
Aber was sind dann Faktoren, die Gerichte zusätzlich anwenden, ausser diesen allgemeinen Bestimmungen?
Die Realität ist komplex, und der Gesetzgeber kann nicht alles aufschreiben. Ein Beispiel: Beim Diebstahl schaut man, wie viel gestohlen wurde. Theoretisch könnte man sagen: Wer 500 Franken stiehlt, bekommt X, bei 1’000 Franken Y. Aber das würde endlos lange Listen ergeben. Deshalb überlässt man Details den Gerichten.
In anderen Ländern gibt es Systeme, in denen nicht nur abstrakte Strafrahmen bestehen, sondern fixere Vorgaben, von denen man nur abweichen kann. Gibt es das auch in der Schweiz?
Früher gab es das teilweise im germanischen Strafrecht: Wer jemanden tötete, erhielt zwingend eine bestimmte Strafe, oder bei Diebstahl wurden Körperstrafen verhängt. Solche fixen Strafen hat es also historisch schon gegeben. In modernen Demokratien gibt es so ein System nicht mehr.
Es gibt einzelne Straftaten, die zwingend eine bestimmte Höchststrafe zur Folge haben – in den USA zum Beispiel Straftaten, die automatisch lebenslänglich bedeuten. Da gibt es nicht mehr viel zu bemessen. Aber generell sind die Strafrahmen flexibler. In Grossbritannien und den USA gibt es Guidelines, die die grossen Strafräume unterteilen, damit Richter mehr Anleitung haben.
Wenn man die effektiv verhängten Strafen anschaut, hat man den Eindruck, dass sie eher im unteren Drittel des Strafrahmens liegen. Der obere Bereich wird selten ausgeschöpft.
Das ist tatsächlich ein relativ schlecht untersuchtes Phänomen. Auch unser Gesetzgeber hat sich nie systematisch damit befasst. Aber ich sehe darin kein Problem: Es ist plausibel, dass die meisten Straftaten nicht sehr schwer sind. Dann ist es logisch, dass die Strafen im unteren Drittel liegen. Die oberen Strafrahmen sind für schwere Straftaten reserviert – und die sind selten. Das spricht eher für ein humanes Strafrecht.
Aber gerade bei schweren Straftaten, zum Beispiel bei Vergewaltigung, hört man oft den Vorwurf, dass der obere Bereich kaum ausgeschöpft wird.
Das fällt mir schwer zu beurteilen. Ich habe zwar einige Dutzend Fälle bearbeitet, aber das ist keine solide Basis. Ich weiss aber, dass es auch sehr hohe Strafen gibt. Bei vorsätzlichen Tötungen oder schweren Gewaltdelikten gibt es Strafen, die sich im oberen Drittel bewegen – und das auch zu Recht. Darum würde ich nicht bestätigen, dass dort nie hohe Strafen verhängt werden.
Kommen wir zum Aspekt der Gleichbehandlung. Welche Rolle spielt Artikel 8 BV im Zusammenhang mit der Strafzumessung?
Das ist eine spannende und auch philosophische Frage. Man muss unterscheiden zwischen der Rolle, die Gleichbehandlung theoretisch spielen sollte, und der Rolle, die sie faktisch spielt.
Theoretisch müsste Rechtsgleichheit selbstverständlich gelten. Praktisch sieht es anders aus: Wenn jemand in Kanton A und jemand in Kanton B mit denselben Merkmalen und derselben Tat vor Gericht stehen, dann fällt die Strafe nicht zwingend gleich aus.
Die vorherrschende Lehre sagt: Das ist ein Preis, den wir für den Föderalismus zahlen. Wir überlassen die Justiz den Kantonen, also müssen wir mit Unterschieden leben. Aber rechtlich überzeugt mich das nicht. Artikel 8 BV gilt schweizweit, und das Strafgesetzbuch gilt seit über 80 Jahren schweizweit. Es gibt kein überzeugendes Argument, wieso Strafen in einem Kanton härter oder milder ausfallen dürfen als in einem anderen. Faktisch ist es so, aber rechtlich müsste man mehr Gleichheit anstreben.
Steht das Recht auf Gleichbehandlung nicht in einem Widerspruch dazu, dass im Strafrecht jeder Einzelfall für sich betrachtet werden muss? Kein Fall ist identisch mit einem anderen.
Ich sehe keinen Widerspruch. Gleichheit hat zwei Seiten: Gleiche Fälle sollen gleich behandelt werden, ungleiche ungleich. Das bedeutet: Man muss jeden Fall individuell anschauen, aber trotzdem proportional im Verhältnis zu anderen Fällen entscheiden.
Das ist schwierig und komplex, aber theoretisch richtig. Für mich besteht also kein Zielkonflikt.
Ziele und Methodik der Studie
Dann gehen wir doch etwas tiefer in die Materie deiner Untersuchung. Vielleicht kannst du allgemein sagen: Was war überhaupt dein Vorgehen? Wen hast du befragt, und was war das Ziel?
Mein Ziel war, herauszufinden, wie es in der Schweiz um die Gleichheit in der Strafzumessung steht. Also: Wie einheitlich urteilen Richter:innen wirklich? Bis dahin gab es dazu kaum Informationen, weil das praktisch nie untersucht wurde.
Ich habe deshalb eine Umfrage mit vier Fallbeispielen gemacht. Diese habe ich allen erstinstanzlichen Strafgerichten zugestellt, mit der Bitte um Teilnahme. Angesprochen waren alle hauptberuflichen Rich-ter:innen, die materielle Straffälle bearbeiten. Nach meiner Recherche sind das ungefähr 560 Personen.
Teilgenommen haben am Schluss 241 Personen, aus 24 Kantonen. Die Detailaufteilung nach Kantonen findet man in meiner Dissertation.
Und wie bist du vorgegangen, um die Richter zur Teilnahme zu bewegen?
Ich habe mir das lange überlegt, weil es nicht einfach ist, Richter:innen für Umfragen zu gewinnen. Am Ende habe ich bei jedem der rund 111 Gerichte persönlich angerufen, meist bei den Präsident:innen.
Das hatte zwei Gründe: Erstens kennt man die persönlichen E-Mail-Adressen der Richter:innen in der Regel nicht. Zweitens ist es in vielen Gerichten nicht gern gesehen, wenn man Richter:innen direkt anschreibt. Darum habe ich den offiziellen Weg gewählt – über die Gerichtsleitungen.
So konnte ich im Gespräch viele überzeugen, den Link an ihre Richter:innen weiterzugeben. Das war mein Ziel: Ich wollte niemanden „überschnorren“, aber sicherstellen, dass alle die Möglichkeit haben, teilzunehmen.
Und wie gross war die Bereitschaft, mitzumachen?
Ich habe gemerkt, dass viele Gerichte eine gewisse Umfrage-Müdigkeit haben. Das hat mich überrascht, weil es ja kaum Forschung mit Richter:innen gibt. Aber offenbar gibt es viele Medienanfragen, studentische Anfragen, sogar von Kantonsschüler:innen.
Von den 560 potenziell Angesprochenen haben nicht alle den Link erhalten, weil nicht alle Gerichte bereit waren, ihn weiterzugeben. Trotzdem haben 241 Richter:innen teilgenommen –- ein guter Wert, wenn man internationale Vergleichsstudien anschaut.
Spannend war: Den meisten war vorab nicht bekannt, dass es um Strafzumessung geht. Das war Absicht, um zu verhindern, dass nur die teilnehmen, die das Thema interessant finden.
Haben die Teilnehmenden für ihre Mitarbeit etwas bekommen?
Nein. Das wäre auch schwierig gewesen – schon aus ethischen Gründen. Es gibt Studien, die zeigen, dass Leute im öffentlichen Sektor sich stark durch ein „Narrativ“ motivieren lassen: Wenn man ihnen erklärt, warum die Teilnahme wichtig ist. Richter:innen haben zudem ein hohes Pflichtgefühl.
Darum habe ich versucht, in meinen Schreiben gut zu begründen, wieso die Teilnahme wichtig wäre. Das hat offenbar funktioniert.
Du hast also eine Umfrage mit vier Fallbeispielen gemacht – den sogenannten Vignetten. Kannst du erklären, wie die aussahen?
Mir war wichtig, dass die Fälle realistisch wirken. Ich wollte keine rein akademischen Beispiele, die es so in der Praxis nie gibt. Deshalb habe ich echte Fälle genommen, sie gekürzt, angepasst und anony-misiert.
Ich habe versucht, mit vier Fällen ein Spektrum abzudecken – von leicht bis schwer, und sowohl Vermögens- als auch Gewaltdelikte. Am Schluss waren es: ein Diebstahl, eine einfache Körperverletzung, ein Sozialhilfebetrug und eine vorsätzliche Tötung.
Ich habe gelesen, dass du gewisse Informationen bewusst weggelassen hast – etwa Vorstrafen der Beschuldigten oder die Strafanträge der Staatsanwaltschaft. Warum?
Ja, das stimmt. Beim Strafantrag war der Grund einfach: Das wäre ein sehr starker numerischer Anker gewesen. Hätte ich überall denselben Antrag angegeben, hätten sich die Strafen um diesen Wert gesammelt – das wäre nicht realistisch, weil es in der Schweiz sehr viele Staatsanwaltschaften gibt, die unterschiedlich beantragen.
Bei den Vorstrafen war es ähnlich. Auch das hätte eine starke Wirkung gehabt, und zudem wäre es gar nicht nötig gewesen, für mein Ziel. Ich wollte wissen: Was würden Richter:innen für diese spezifische Tat an Strafe ausfällen? Vorstrafen wären ein zusätzlicher Faktor gewesen, den ich nicht einbeziehen wollte.
Hast du nicht die Kritik bekommen, dass das Weglassen solcher Infos die Übertragbarkeit deiner Ergebnisse auf die Realität — die sogenannte externe Validität – gefährdet?
Natürlich, das ist ein Trade-off. Es stimmt: Ein reales Urteil basiert auf mehr Informationen. Aber Studien zeigen, dass gar nicht so viele Informationen tatsächlich entscheidend sind. Am Ende sind es wenige zentrale Faktoren, die den Ausschlag geben.
Darum glaube ich, dass mein Ansatz berechtigt ist. Klar, es ist nicht identisch mit der Realität, aber man darf den Unterschied nicht überbewerten.
Was mussten die Richter:innen konkret tun bei den Vignetten?
Sie mussten das Strafmass festlegen. Sie konnten aus allen Sanktionsarten des StGB wählen – ausser lebenslänglich, das kam in meinen Fällen nicht in Frage. Also Geldstrafe, Freiheitsstrafe, bedingt, unbedingt, teilbedingt.
Sie mussten zudem die Strafhöhe bestimmen, in dem Format, das für sie passte: Tage, Monate, Jahre.
Nur beim Tötungsdelikt habe ich zusätzlich gefragt: Was wäre für Sie die tiefste und die höchste Strafe, die noch vertretbar wäre? So konnte ich am Ende aus allen Antworten einen konsensualen „vertretbaren Bereich“ bilden. Das war wichtig, weil niemand — auch ich nicht — die „richtige“ Strafe kennt.
Ergebnisse der Studie
Streuung der Strafmasse
Kommen wir zu den Ergebnissen. Was waren die wichtigsten Forschungsfragen oder Hypothesen, die du überprüfen wolltest?
Die erste grosse Frage war: Wie einheitlich ist die Strafzumessung überhaupt? Um das zu messen, habe ich klassische Streuungsmasse aus der Statistik verwendet – also zum Beispiel die Standardabweichung.
Um die Fälle vergleichbar zu machen, habe ich die Standardabweichung immer in Relation zum Mittelwert gesetzt. Sonst wirkt es nämlich so, als ob schwere Delikte stärker streuen, nur weil die Strafen absolut höher sind.
Am besten sieht man das grafisch — in der Dissertation gibt es entsprechende Darstellungen, wie sich die Strafen verteilen.
Die Richter:innen waren frei in der Wahl der Strafart – also ob Geldstrafe, Freiheitsstrafe, bedingt, unbedingt usw. Damit man das vergleichen kann, musstest du das alles in eine einheitliche „Währung“ umrechnen. Wie bist du vorgegangen?
Ich habe mich an die gesetzliche Fiktion gehalten: Ein Tagessatz Geldstrafe entspricht einem Tag Freiheitsstrafe. Ob bedingt oder unbedingt spielt dabei keine Rolle.
Bei Bussen ist es ähnlich: Jede Busse muss eine schuldangemessene Ersatzfreiheitsstrafe enthalten. Also konnte ich auch das umrechnen. So hatte ich alles in Tagen Freiheitsstrafe – und konnte rechnen.
Andere haben versucht, Punitivitäts-Scores zu berechnen, also etwa „bedingt ist weniger schwer als unbedingt“. Ich habe das auch getestet, aber es wird schnell unübersichtlich. Die gesetzliche Umrechnung ist einfach nachvollziehbarer.
Und wie stark haben die Strafen gestreut? Warst du überrascht?
Verschrocken wäre übertrieben, weil ich aus der internationalen Forschung wusste, dass es Unterschiede gibt. Aber gewisse Ergebnisse haben mich überrascht. Zum Beispiel: Ich hätte erwartet, dass Vermögensdelikte einheitlicher beurteilt werden, weil die Schadenssumme ein klarer Anker ist. In Deutschland zeigen Studien, dass der Betrag sehr stark wirkt. In meiner Untersuchung war es aber umgekehrt: Bei Vermögensdelikten war die Streuung grösser als bei Gewaltdelikten. Dafür habe ich bis heute keine Erklärung.
Überraschend war auch, dass es bei der Wahl der Sanktionsart relativ wenig Uneinheitlichkeit gab. Es war für die Richter:innen offenbar meist klar, ob es eine Geldstrafe oder eine Freiheitsstrafe geben sollte. Uneinheitlich wurde es vor allem bei der Höhe.
Vertretbarer Bereich
Du hast die Richter:innen auch beim Tötungsdelikt gefragt, was sie als vertretbaren Bereich ansehen. Haben sich ihre eigenen Urteile darin bewegt? Oder gab es Ausreisser?
Es gab viele Ausreisser – auf beiden Seiten. Rund 40\% der verhängten Strafen lagen ausserhalb des von den Richter:innen selbst definierten vertretbaren Bereichs. Wohlgemerkt: Dieser Bereich umfasste mehrere Jahre Freiheitsstrafe. Es war also nicht eng. Trotzdem lagen viele Urteile daneben.
Das ist für mich zentral: Es zeigt, dass nicht nur ich ein Problem sehe, sondern dass die Richter:innen selbst zugeben würden, dass viele Urteile „unvertretbar“ sind.
Aber immerhin sind sie in dem Bereich gelegen, den sie für sich selbst als vertretbar bezeichnet haben?
Ja, das schon. Das habe ich in der Umfrage so gestellt: Sie gaben zuerst ihr eigenes Urteil an, und danach fragte ich: Was wäre das Minimum, was das Maximum? Dadurch waren die Angaben logisch aufeinander abgestimmt.
Die meisten bewegten sich in einem Bereich von etwa plus/minus zwei Jahren um ihre eigene Strafe. Es gab aber auch Einzelne, die sagten: „Genau diese Strafe und keine andere.“
Gruppen-Unterschiede
Du hast auch Unterschiede zwischen Gruppen untersucht – zum Beispiel Kantone oder Sprachregionen. Was kam da heraus?
Ehrlich gesagt habe ich das vor allem gemacht, weil ich wusste, dass es die Leute interessiert. Mein Fazit: Man kann nicht sagen, dass es innerhalb einzelner Kantone oder Gerichte einheitlicher wäre. Es gab Kantone, in denen die Urteile uneinheitlicher waren als im gesamtschweizerischen Durchschnitt – und andere, wo sie einheitlicher waren. Aber die Stichproben waren klein – oft fünf oder sechs Richter:innen pro Kanton. Deshalb muss man solche Vergleiche mit Vorsicht geniessen.
Und auf der Ebene einzelner Gerichte? Gab es da Cluster?
Auch dort war die Stichprobe zu klein. Ich habe es ausgewertet, aber es liess sich nichts Verlässliches sagen. Das war nicht der Fokus meiner Arbeit.
Nutzung von Vergleichsfällen
Ein weiterer interessanter Aspekt deiner Studie sind die Vergleichsfälle. Du hast den Richter:innen nicht nur die Vignetten vorgelegt, sondern auch echte Urteile als Orientierung. Was war deine Überlegung dabei?
Die Idee war: Eine reine Vignettenstudie zeigt zwar Unterschiede, aber man weiss dann nicht, wie man sie reduzieren könnte. Also habe ich gleich einen möglichen Lösungsansatz getestet: Wenn man allen Richter:innen dieselben Vergleichsfälle gibt – führt das zu einheitlicheren Urteilen?
Dafür habe ich echte Urteile aus Datenbanken gesucht. Ich habe zuerst fünf pro Fall genommen, am Ende drei. Wichtig war, dass sie realistisch sind, nicht erfunden. Sie mussten eine gewisse Ähnlichkeit mit meinen Vignetten haben – aber sie waren nicht identisch.
Und – hat es gewirkt?
Ehrlich gesagt: Nein. Der Effekt war minimal. Die Urteile wurden nicht einheitlicher. Das hat mir gezeigt: Es reicht nicht, wenn Vergleichsfälle „grob ähnlich“ sind. Sie müssen wirklich sehr nahe am aktuellen Fall sein. Sonst bringen sie wenig.
Ich habe mir überlegt, ob es vielleicht auch daran lag, dass die Richter:innen die Fälle gar nicht so genau gelesen haben. Hast du das geprüft?
Ja, das habe ich. Ich konnte messen, wie lange sie auf der jeweiligen Seite waren. Die Gesamtzeit war bei den Gruppen mit Vergleichsfällen länger als bei jenen ohne. Das spricht dafür, dass sie die Fälle gelesen haben. Und es gab Kommentare – einige Richter:innen haben ausdrücklich geschrieben, dass sie die Vergleichsfälle nicht hilfreich fanden, weil sie nicht genügend ähnlich waren.
Wie ist das in der Praxis – ziehen Richter:innen Vergleichsfälle überhaupt heran?
Das ist schwer zu beantworten, weil erstinstanzliche Urteile fast nie veröffentlicht werden. In meiner Umfrage gaben rund 80\% der Richter:innen an, dass sie sich bei der Strafzumessung am „üblichen Strafmass“ oder an vergleichbaren Fällen orientieren.
In den veröffentlichten zweitinstanzlichen Urteilen findet man das aber selten explizit. Manchmal steht da ein allgemeiner Satz wie „entspricht dem üblichen Strafmass“. Aber konkrete Verweise sind rar. Darum ist meine Theorie: Richter:innen orientieren sich schon an früheren Fällen, aber oft eher informell – an dem, was sie aus ihrer eigenen Erfahrung kennen.
Gerade mit Blick auf die Rechtsgleichheit finde ich das heikel. Wenn ein Richter „aus dem Bauch“ urteilt, ohne Bezug auf andere Urteile, kann das doch kaum transparent oder nachvollziehbar sein.
Das stimmt. Aber das Bauchgefühl eines Richters speist sich ja auch aus seiner Erfahrung. Wer viele Fälle gesehen hat, hat ein inneres Referenzsystem. Das ist nicht per se schlecht – aber eben intransparent. In der Praxis, gerade in Alltagsfällen, gibt es auch nicht immer Zeit für eine aufwendige Recherche. Dann spielt das Bauchgefühl eine grosse Rolle.
Schwarmintelligenz als Lösung?
Wenn die Streuung so gross ist, könnte man ja sagen: Vielleicht sollten mehrere Richter:innen gemeinsam entscheiden, also Kollegialgerichte. Dann könnte man – so quasi nach dem Prinzip Schwarmintelligenz – Mittelwerte bilden. Würdest du das befürworten?
Das ist tatsächlich die Logik, die der Gesetzgeber schon vorgesehen hat: Ab einer gewissen Strafschwere entscheiden Gremien. Man hofft, dass man sich gemeinsam „einmittelt“.
Aber es gibt keine formelle Regel, wie genau das geschieht. Es ist nicht so, dass jede:r Richter:in erst alleine eine Zahl aufschreibt und man dann den Median nimmt. Vielleicht machen manche Gerichte das so, aber bekannt ist es nicht.
Die Forschung zeigt zudem: Gremien führen nicht automatisch zu besseren oder einheitlicheren Ergebnissen. Es hängt sehr stark davon ab, wie die Entscheidungsprozesse ablaufen, welche Persönlichkeiten beteiligt sind, wie das Verhältnis zueinander ist.
Darum kann man nicht pauschal sagen: Kollegialentscheid = besser.
Aber vom Prinzip Schwarmintelligenz her – wäre es nicht sinnvoll, die Einzelurteile wirklich zu aggregieren?
Theoretisch ja. Strafzumessung ist letztlich ein Wertungsentscheid: Wie schwer finde ich das? Je mehr Leute das unabhängig beurteilen, desto eher nähert man sich einer „richtigen“ Antwort an.
Aber das funktioniert nicht mit drei oder fünf Personen. Da sind die Zahlen zu klein. Und es ist unrealistisch, dass 20 Richter:innen über einen einzelnen Fall entscheiden. Darum glaube ich: Allein der Gremiumsentscheid löst das Problem nicht. Aber man könnte überlegen, eine Aggregationsregel einzuführen – etwa, dass alle Richter:innen einzeln eine Strafe festlegen und man dann den Median nimmt. Das wäre überprüfbarer und vielleicht fairer. In Deutschland gibt es übrigens gesetzliche Regeln, die in diese Richtung gehen: Wenn mehrere Richter:innen unterschiedliche Anträge stellen, nimmt man nicht den höchsten, sondern einen darunter – immer zugunsten der beschuldigten Person.
Aber wenn die eine Person eine Geldstrafe und die andere eine Freiheitsstrafe verhängen will – dann müsste man das ja auch umrechnen.
Ja, das stimmt. In solchen Fällen bräuchte man eine gemeinsame „Währung“. Aber das Problem besteht heute auch schon: Auch jetzt müssen sich Richter:innen im Gremium einigen, ob es eine Geldstrafe oder Freiheitsstrafe gibt.
Reformvorschläge zum Nutzen der Rechtsgleichheit
Etwas anderes: Du hast gesagt, dass Richter:innen sich in der Praxis eher informell an früheren Fällen orientieren. Wäre es nicht sinnvoll, wenn man es obligatorisch machen würde, in Urteilen Vergleichsfälle anzugeben?
Das wäre ein interessanter Ansatz. Aber wir sind noch weit davon entfernt. Im Moment gibt es nicht einmal einen Konsens, dass man sich überhaupt an Vergleichsfällen orientieren sollte.
Im Gegenteil: Das Bundesgericht hat schon festgehalten, dass man sich nicht zu sehr an anderen Urteilen orientieren darf, weil es immer um den Einzelfall geht.
Dazu kommt: Selbst wenn man das wollte – die Urteile sind gar nicht verfügbar. Erstinstanzliche Urteile werden fast nie veröffentlicht. Ein Bezirksrichter in St. Gallen weiss nicht, was ein Bezirksrichter in Aar-gau entschieden hat. Darum wäre für mich der erste Schritt: Publikation von erstinstanzlichen Urteilen. Natürlich nicht alles, sondern die schriftlich begründeten. Das würde Transparenz schaffen. Das Gegenargument ist immer die „Informationsflut“: Man könne das alles gar nicht lesen. Aber ehrlich gesagt: Ich kann auch nicht alle Bundesgerichtsentscheide lesen – das ist jetzt schon so. Mit technischen Hilfsmitteln sollte man das Problem lösen, nicht mit Geheimhaltung.
Dann wären wir schon beim Thema mögliche Reformen. Welche Forschung oder Massnahmen wären aus deiner Sicht besonders wichtig?
Wir wissen insgesamt noch sehr wenig über Strafzumessung in der Schweiz. Jede Forschung, die die Datengrundlage verbessert, ist wertvoll. Ein nächster Schritt wäre, Urteile systematisch auszuwerten – aber das ist als Einzelperson kaum zu stemmen. Da braucht es grössere Forschungsprojekte. Man muss dabei aber aufpassen, die Richter:innen nicht mit zu vielen Umfragen zu überlasten. Ich hatte das Glück, dass viele teilgenommen haben. Aber man sollte nicht zu oft an dieselbe Zielgruppe herantreten, sonst gibt es eine Abwehrhaltung.
Reaktionen auf die Untersuchung
Deine Arbeit ist sehr positiv aufgenommen worden – du hast dafür sogar den Jahrespreis der Rechtswissenschaftlichen Fakultät Zürich bekommen. Hast du auch Rückmeldungen von den Richter:innen selbst erhalten?
Kaum. Ich habe allen Gerichten meine Dissertation in digitaler Form geschickt – einen Monat vor der Publikation. Auf über 100 E-Mails habe ich genau zwei Antworten erhalten: Glückwünsche zur Promotion, nicht inhaltlich. Seither habe ich keine Rückmeldungen bekommen. Wahrscheinlich liegt es daran, dass das Buch einige hundert Seiten hat – das liest man nicht so nebenbei.
Und für deine jetzige Arbeit am Bundesgericht – konntest du da etwas aus der Dissertation mitnehmen?
Ja, natürlich. Ich kenne die Rechtsprechung zur Strafzumessung sehr gut, und wenn ich an einem Fall arbeite, erkenne ich schnell, wo Probleme liegen. Aber meine Dissertation richtet sich auf systemische Fragen – etwa, wie man Strafzumessung schweizweit einheitlicher machen könnte. Am Bundesgericht geht es um konkrete Einzelfälle. Da gibt es wenig Überschneidung.
Outro
Dann bleibt mir, dir ganz herzlich zu danken für die spannenden Einblicke in deine Arbeit. Ich finde, sie ist sowohl wissenschaftlich fundiert als auch praktisch relevant. Und sie zeigt, dass Forschung nicht Theorie bleibt, sondern konkrete Fragen der Rechtsprechung berührt.
Danke dir, David, für das Gespräch.