Wie transparent ist die Medienförderung?

Inseratenkorruption sagen die einen. Tatkräftige Unterstützung für eine bunte Medienlandschaft, sagen die anderen. Total transparent , sagen die einen, Datenchaos sagen die anderen. Die neueste ÖVP-Affäre um krumme Inseratendeals – ÖVP-Mitarbeiter des ÖVP-geführten Finanzministeriums sollen Ministeriumsgelder verwendet haben, um erstens Umfragen zugunsten der ÖVP erstellen und manipulieren zu lassen und diese zweitens über Gegengeschäfte mit Inseraten als redaktionelle Inhalte in Zeitungen zu platzieren –  ist ein Grund mehr, sich auch aus datentechnischer Sicht mit der Medienfinanzierung in Österreich zu beschäftigen.

Für Eilige: Hier ist ein Interface, in dem User selbst durch die Daten zur Medienfinanzierung surfen können – aber vielleicht schadet es nicht, zur Orientierung erst diesen Text zu lesen.

Denn die verworrene Medienförderung ist – neben dem fragwürdigen Ethos der handelnden Personen – eine der wesentlichen Akteurinnen in dieser Sache. Ich habe jetzt alle Fördertöpfe analysiert, so weit wie möglich in gemeinsamen Datenbanken untergebracht – und hier kann man nun blättern, scrollen, suchen, Netzwerke absurfen – je nachdem, welche Art der Informationsaufnahme den geneigten LeserInnen am liebsten ist.

Ein paar Worte zur Datensituation

„Es ist eh alles öffentlich“ – das ist die reflexartige Antwort, wenn die Transparenz der Medienfinanzierung in Österreich hinterfragt wird. Das stimmt: Fließen öffentliche Gelde an Medien, dann landet diese Information – ab einem bestimmten Schwellwert – in einer der Open Data Publikationen der RTR als verantwortliche Behörde. Und diese Publikationen sind – das Bemühen um Transparenz möchte ich da noch gar niemandem absprechen – ein Musterbeispiel für einige strukturelle Probleme von Open Data, die ihrem guten Ruf, für Transparenz und Kontrollierbarkeit zu sorgen, nicht immer nachkommen, sondern gelegentlich auch ein willkommenes Versteck für Information sind (so wie der Heuhaufen für die Nadel). Überdies ist die eigentliche Presseförderung in Österreich recht niedrig. In normalen Zeiten (ohne Corona-Sonderförderungen) werden knapp neun Millionen € jährlich ausbezahlt.

Dazu kommt die Privatrundfunkförderung (die uns Medien wie oe24.tv oder krone.tv beschert) mit 15 Millionen € jährlich. Der nichtkommerzielle Rundfunk wird mit drei Millionen € pro Jahr gefördert, an Publikzistikförderung gibt es etwa 300.000 € pro Jahr. Dem steht ein Vielfaches an öffentlichen Inseraten gegenüber: Sogar 2020, als die Presseförderung mit 27 Millionen € coronabedingt  fast drei Mal so hoch war wie üblich, war das öffentliche Inseratenvolumen mit über 230 Millionen € fast neun Mal so hoch. Jetzt gibt es schon für die Presseförderung praktisch keine inhaltlich relevanten Kriterien, die Inserate werden ganz und gar freihändig vergeben. Und das ist nicht das einzige Transparenzproblem.

Open Data-Suchspiele

Die Open Data-Publikationen zu den diversen Presseförderungstöpfen führen zwar an, welches Unternehmen wofür wieviel Geld bekommen hat (es ist auch beachtenswert, nachzulesen für welche Projekte Medienhäuser Ausbildungs- oder Inhaltsförderungen bekommen, zB Krone, Heute, oe24, diverse Kirchen und ihre Ableger; unter anderem also etwa Fellner live, der Kronhit mach mich munter-Morgen oder Sprech- und Moderationstrainings für einzelne MitarbeiterInnen) – allerdings fehlt die Übersicht, welche Medienunternehmen zu welchen Mediengruppen gehören.

Da finden sich etwa Unternehmen wie eine A.Digital Errichtungs- und Beteiligungsgesellschaft, diverse Radiosender oder eine CM Classified Media – und es hilft nur ein zusätzlicher Blick ins Firmenbuch, um festzustellen, dass diese und viele andere Unternehmen zum Fellner-Imperium gehören. Ich habe einige Mediengruppen hier (Auswertung nach Beträgen, Auswertung nach geförderten Projekten) ansatzweise und ohne Anspruch auf Vollständigkeit zusammengefasst, damit auch übergreifende Abfragen zu Fördergeldern möglich sind. Solche Sammelabfragen zeigen, dass einige Medienhäuser die Ausgestaltung von Beteiligungslabyrinthen durchaus auf die Spitze treiben.

Und es fällt auf, dass viele Medienhäuser mit der Privatrundfunkförderung ein gutes Zubrot verdienen – fallweise mehr als mit der Presseförderung. Man könnte durchaus darüber diskutieren, was in der Medienlandschaft nun eigentlich gefördert werden soll.

Schreib es wie du willst

Die Inseratenliste ist noch um einige Klassen unübersichtlicher. Hier werden Daten offensichtlich so veröffentlicht, wie sie eingemeldet werden – und dafür gibt es keine Vorgaben. So heißt ein Medium dann auch in manchen Einträgen „Krone“, in anderen „Kronen Zeitung“ oder „Krone Verlag“, wieder andere Geldflüsse werden unter Projektnamen gemeldet (da heißt es dann etwa „Kids Krone“). Auch überschaubare Medienhäuser wie der Falstaff bringen es so auf zehn Einträge in dieser Liste.

Inhaltliche Informationen gibt es nicht, die Einträge sind nur mit kryptischen Referenzen auf Paragraphen versehen. Dabei stellt sich heraus: In dieser Liste sind zusätzlich noch einmal die Beträge enthalten, die über die Privatrundfunkförderung ausbezahlt werden – und auch noch der Anteil der Gis-Gebühren, der dann tatsächlich an den ORF überwiesen wird (und nicht als Körberlgeld in den Kassen mancher Landeshauptleute landet). Auch hier ist also wieder akribische Detektivarbeit notwendig, um einen inhaltlichen Überblick über die Geldflüsse zu schaffen. Das gleiche gilt im übrigen für die Inserenten: So ist etwa jede Fachgruppe jeder einzelnen Landeswirtschaftskammer einzeln angeführt, auch Arbeiterkammern finden sich in vielen Varianten. Wer herausfinden möchte, von wo wieviel Geld wohin floss, muss sich also auch intensiv inhaltlich mit den Daten beschäftigen.

Auch bei den Inseraten habe ich so weit wie möglich einige Mediengruppen zusammengefasst; auch Wirtschaftskammern, Arbeiterkammern oder die Bundesregierung sind jetzt gemeinsam abfragbar. Die Tabellenauswertung wird davon nur wenig übersichtlicher.

Epizentren der Inseratenwirtschaft: Bundeskanzleramt, Finanzministerium und Stadt Wien

Deshalb habe ich zusätzlich auch die Inserateneinträge des ersten Halbjahres 2021 in eine eigene Netzwerkvisualisierung gepackt. Da zeichnen sich mit dem Bundeskanzleramt, der Stadt Wien und dem Finanzministerium einige Epizentren der Inseratenvergabe ab – noch ganz ohne Inserenten oder oder Empfänger zusammengefasst zu haben. In dieser Visualisierung zeichnet sich auch schön ab, dass sowohl Bundeskanzleramt als auch Stadt Wien nicht nur die größten Auftraggeber sind, sie bedienen auch eigene Netzwerke von Medien, die sonst kaum Inserate bekommen. Der äußere Ring dieses Netzwerks wird vor allem von den einzelnen Wirtschaftskammerinstitutionen gebildet.

In der Netzwerkanwendung kann man sich durcklicken, um von einem Inseratenetzwerk zum nächsten zu springen, suchen, oder einfach staunen.

Open Data: Bringt das was?

Was bedeutet das alles für Transparenz? – Es wäre recht einfach, die Open Data-Sätze nützlicher zu gestalten. Eine Grundfrage dabei, wie bei praktisch allen (Informations)Dienstleitungen: Was wollen Anwender damit machen? Welche Nutzungsszenarien können wir uns vorstellen? Wie können wir gute Weiterverarbeitung möglich machen? Und was ist die eigentlich relevante Information, die unterwegs nicht verloren gehen sollte?

Natürlich ist jeder strukturierende Eingriff in Open Data potenziell kritisch. Information kann schnell zum Vorurteil werden, ungeschickte Datenmodelle bilden ungewollte Schwerpunkte oder verfärben Information – aber das passiert ohnehin. Es gibt keine rohen unverfälschten Daten, die für sich sprechen; Entscheidungen werden schon dann getroffen, wenn darüber entschieden wird, welche Daten in welcher Form erhoben werden sollen (mehr zu den Grundlagen der informationsphilosophischen Fragen finden Interessierte bei Rob Kitchin oder Sabina Leonelli.

Was sind nun einfache Eingriffe, die die Daten nützlicher machen?

  • Standardisierte Bezeichnungen sind ein erster wichtiger Schritt. Es kann nicht sein, dass ein Medium nach Lust und Laune der DatenerfasserInnen bezeichnet wird und dass manchmal der Firmenname, die Medienmarke (in unterschiedlichen Schreibweisen) oder irgendein Projekttitel verwendet werden (sogar der Falstaff bringt es so auf 10 Nennungen in der Inseratenliste). Solche Probleme können mit simplen Auswahllisten bei der Datenerfassung umschifft werden.
  • Mediengruppen sind ebenfalls wichtig. Es könnte problemlos im Hintergrund hinterlegt werden, welche Medienmarken zu welchen Mediengruppen gehören. Das ist kein Strich mehr Arbeit für die DatenerfasserInnen. Bei verschachtelten Beteiligungen ist die Zuordnung sicher nicht immer trivial – bei der Zurechnung von Parteiunternehmen etwa gibt es aber durchaus sinnvolle vom Rechnungshof eingesetzte Kriterien, die hier auch Verwendung finden könnten.
  • Das gleiche gilt für Rechtsträger: Es ist nicht sehr aufschlussreich, jede einzelne Fachgruppe jeder einzelnen Landeswirtschaftskammer einzeln auswerten zu müssen – auch hier könnten Zusammenhänge problemlos hinterlegt werden.
  • Noch ein frommer Wunsch wäre die durchgängige Identifizierung aller Fördernehmer und aller Fördergeber über alle Fördertöpfe. Medienunternehmen werden in den Daten der Privatrundfunkförderung unter anderen Namen geführt als in der Presseförderung und in der Übersicht der öffentlichen Inserate heißen sie ohnehin schlichtweg so, wie es den Datenerfasserinnen gerade einfiel. Das muss nicht sein.

Mir fällt kaum ein plausibler Grund ein, warum diese einfachen Schritte nicht sofort umgesetzt werden könnten.

Ein paar Worte zur Technik

Die Inseratedaten werden quartalsweise veröffentlicht; möchte man einen etwas längeren Zeitraum auswerten, sitzt man schnell auf Files mit 100.000 Zeilen und mehr. Davon sind aber 80 Prozent Leermeldungen, die sich schnell ausfiltern lassen. Die eigentliche Arbeit beginnt mit der Zusammenführung gleicher Empfänger in verschiedenen Fördertöpfen. Hier kann man nun natürlich nach unique entries suchen, ID-Listen erstellen, die IDs zurück in die Daten importieren und hoffen, dass das irgendeinen Sinn ergibt. Im konkreten Fall ist das ziemlich sinnlos. Nachdem die Mediennamen freihändig vergeben wurden (also Medien sehr oft einfach anders heißen, anders geschrieben werden, einen Rechtsform-Zusatz dabei haben oder manchmal auch nicht und manchmal – besonders schlecht zu verarbeiten – in Anführungszeichen gesetzt sind), richtet der Versuch, die Einträge über Scripts (die Namen durch IDs ersetzen) zu verknüpfen, heilloses Chaos an.

Hier habe ich einen anderen Weg gewählt: Ich habe die unterschiedlichen Datensätze zuerst über eine Graph-Datenbank verknüpft. Bei Graph-Datenbanken wie Neo4j ist es kein Problem wenn Datenmodelle und Datentypen noch nicht ordentlich fixiert sind; Verknüpfungen können direkt aus Datenzeilen erstellt werden und IDs werden dabei in sinnvoller Art und Weise automatisch vergeben. Graph-Datenbanken würden auch out of the box hübsche Visualisierungen anbieten als relationale Datenbanken – allerdings, und das habe ich schon öfter kritisiert – die Graph-Anbieter in ihren Lizenzmodellen zu knausrig für Forschungsarbeit ohne kommerziellen Hintergrund. Alles muss gekauft werden – und dann sind immer noch weitere Zusatzlizenzen notwendig, und für die Publikation fallen noch einmal kosten an. Ich weiß nicht, ob das wachstumsfördernde Lizenzmodelle sind (Anmerkung: Natürlich macht es Sinn, für Leistung Bezahlung zu verlangen. Aber in diesem Fall würde es auch Sinn machen, für kleine Leistung weniger Bezahlung zu verlangen – ich habe Bedenken, Tools wie Neo4j für Kunden zu empfehlen, wenn ich sie noch nicht selbst in vollem Umfang und für längere Zeit einsetzen konnte).

Allerdings ist der Graph auf diese Art und Weise deutlich schneller eingerichtet. Sofern mich die Laune nicht verlässt, wird es daher quartalsweise Updates der Inserentennetzwerke mit den jeweils aktuellsten Daten gebe; am direktesten bekommt man die über den Newsletter (Anmeldung unten auf der Seite).

Inserentennetzwerke einiger Mediengruppen

Der Graph sorgt also für die notwendigen Verknüpfungen über Fördertopfgrenzen hinweg – das Ergebnis habe ich dann exportiert und in eine SQL–Datenbank verwandelt. Das Datenmodell ist wenig anspruchsvoll, die Queries sind dagegen recht ressourcenintensiv und haben den Datenbankserver schon einigemale volllaufen lassen (falls also gerade etwas nicht funktioniert: bitte um Mail an hallo@goldsuperextra.com).

Das Interface für die SQL-Datenbank ist der Einfachkeit halber mit Retool umgesetzt. Visualisierungen sind dort zwar recht dürftig, konkrete Tabellenabfragen können aber eben unschlagbar schnell umgesetzt werden. Das Netzwerk ist mit Gephi umgesetzt. Praktischerweise kann dabei das gleiche Importmaterial verwendet werden, das der Neo4j-Export ausspuckt. Der Web-Export aus Gephi ist in seinen Funktionen recht bescheiden, liefert aber einige Anregungen dafür, was man sich in den Tabellen dann gerne noch näher ansehen würde.