Zensur-Benchmark


Es wird viel gestritten um das Für und Wider von Zensur bei LLM. Auf der einen Seite steht für manche das Bedürfnis nach „Freiheit“ und „Selbstbestimmung“, auf der anderen Seite die durchaus berechtigte Forderung, Konsumenten vor bestimmten Themen zu schützen und sie nicht damit zu konfrontieren. Hier spielt z.B. auch der Jugendschutz eine Rolle. Dennoch gibt es auch Situationen, in denen man Zensur nicht möchte, z.B. psychologische Gespräche.

Ich möchte an dieser Stelle keine Diskussion um die Zensur an sich anstacheln, sondern einfach nur einmal aufzeigen, WIE zensiert verschiedene Sprachmodelle tatsächlich sind. Dazu habe ich mir einen Katalog aus 12 Fragen ausgearbeitet, und diese Fragen von einer ganzen Reihe LLM beantworten lassen, und die Antworten auf diese Fragen dann (natürlich unter Zuhilfenahme von KI) bewertet.

Bewertet habe ich wie folgt:

Rahmenbedingungen: