Es gibt in einer volldigitalisierten Welt keinen Grund mehr, Milliarden Fotos auf Facebook pauschal zu schützen, obwohl nur wenige Aufnahmen besondere Fertigkeiten erfordern oder seltene Dinge zeigen. Das gilt auch für den zweihundertsten Aufguss einer Online-Tagesnachricht, der kaum den Inhalt ändert, sondern nur die Form. Dieses Vorgehen stiftet keinen zusätzlichen Nutzen, der neue Text ist selbst inhaltlich eine Kopie.
Trotzdem darf man nicht vom Status quo des heutigen Gefüges zwischen Urhebern, Verwertern und Publikum ausgehen. Noch vieles wird sich ändern. Wahrscheinlich werden Intermediäre, Vermittler - vor allem heutige Verwerter - unter Druck geraten, weil mit digitalen Marktteilnehmern neue Torwächter entstehen. Ihre Leistungsketten brechen, und monolithische Organisationen verlieren ihre Grenzen.
Diese Entwicklung kann zugunsten der Urheber sein. Die Verwerter haben die weitere Entwicklung zu ihren Ungunsten längst ins Kalkül gezogen und spielen ihre Position gegenüber Urhebern (Total Buyout), Kunden (Bezahlinhalte) und der Öffentlichkeit (Leistungsschutzrecht) aus, solange sie es noch können. Langfristig gewinnen die Urheber, die Werte schaffen, und die Gesellschaft, die von der neuen Vielfalt und ihrer Schnelligkeit profitiert.
Wagen wir einen Blick in die Zukunft: Der Zeitungskongress des Bundesverbandes Deutscher Zeitungsverleger 2014 begann mit einer Rede des neuen Kulturstaatsministers Dr. Dietrich von Klaeden. Die versammelte Verlegerzunft erwartete ein paar Antworten auf die eskalierende Krise der Branche.
Realistische Projektion der Entwicklung in Deutschland, die bei Verabschiedung des “Leistungsschutzrechts” zu erwarten ist, in der FAZ vom 15.3.2012.
Die Annahme, künstliche Knappheit eines im Überfluß vorhandenen Gutes (Nachrichteninhalte) durch Gesetze zu erzeugen, ist bestenfalls naiv. Das Web wird Wege zur Umgehung der künstlichen Knappheit finden, wie das auch schon bei Telekommunikations- und Finanzdienstleistungen geschehen ist.
Wie das neue Verwertungsrecht im Detail ausgestaltet werden soll, ist im Protokoll des Koalitionsausschusses nicht nachzulesen. Ob künftig schon ein Link auf einen Nachrichtenartikel kostenpflichtig wäre, in welcher Form andere Inhalte-Anbieter, etwa Blogger, von dem Recht betroffen wären, wie Leitungsschutz- und Zitatrecht miteinander vereinbart werden sollen, ist völlig unklar. Die kommenden Monate dürften hitzige Diskussionen zwischen Verlegerverbänden, Internetaktivisten und Unternehmen wie Google bringen.
Spiegel Online, Journalismus im Internet: Koalition will Leistungsschutzrecht für Verlage einführen, 05.03.2012
Kritik an Algorithmen: Wie verändern sich Kunden durch Software, die filtert und empfiehlt?
Kathrin Passig schreibt in der Berliner Gazette über den Stand der Diskussion zum Einsatz von Algorithmen zur Personalisierung von Inhaltsangeboten.
Hier ein Auszug aus häufig geäußerten Vorwürfen, die sie widerlegt:
„Empfehlungs- und Filteralgorithmen verlängern auf langweilige Weise die Vergangenheit in die Zukunft hinein.“
„Durch das Ausblenden von unbekannten Variablen entsteht ein gleichförmiger Fluss von Mainstreaminhalten.“
„Computer werden uns immer nur mehr desselben empfehlen, anstatt uns – wie ein guter Freund oder Fachmann – auch mal an das heranzuführen, was unseren Horizont erweitern könnte.“
„Die Softwaremodelle, auf die wir uns beispielsweise bei der Erstellung von Klimamodellen verlassen, sind zu komplex, ihre Urteile für uns nicht nachvollziehbar.“
„Wer computergenerierte Empfehlungen verteidigt, der überschätzt die Fähigkeiten der Maschinen.“
„Algorithmen kommen aus Maschinen und sind deshalb unmenschlich.“
Sie listet sodann aus ihrer Sicht reale Probleme des Einsatzes von Filtern und Algorithmen auf, unter anderem:
Viele Empfehlungsalgorithmen sind einfach nicht besonders ausgefeilt,
Intransparente Filter wie bei Facebook sind zwar bequem und verwirren die Nutzer nicht durch komplexe Einstellungsmöglichkeiten, führen aber zu einem nicht unberechtigten Gefühl der fehlenden Nachvollziehbarkeit und Kontrolle.
Durch die fehlende Transparenz ist es zu leicht für Anbieter, ihre eigene Agenda in die Empfehlungsgestaltung einfließen zu lassen.
Kollaborative Filter können nur die Daten über beispielsweise Musikkonsumgewohnheiten verwenden, die unser Verhalten eben hergibt.
Der Artikel liefert einen guten Überblick, beschränkt sich aber im Wesentlichen auf den Stand der Diskussion in Deutschland. Darüber hinaus läßt er eine Systematik der Argumente vermissen (siehe hierzu den interessanten Kommentar von Sandor Ragaly).
Aus unserer Sicht hilfreich ist zunächst einmal eine Unterscheidung der Algorithmen nach Ihrer Grundlage:
- Social Graph. Hier nutzt der Algorithmus die Beziehung zwischen Personen zur Relevanzbestimmung von Inhalten: der Leser bekommt Inhalte, die von mit ihm verbundenen Kontakten gelesen und bewertet wurden (Facebooks EdgeRank)
- Interest Graph. Der Algorithmus nutzt die aus vergangenem Verhalten erkannte Beziehung zwischen Leser und Inhalten zur Bestimmung der Relevanz anderer Inhalte (Amazon)
- Social Interest Graph. Hier verwendet der Algorithmus eine Kombination der beiden oben genannten Graphen (Twitter, Google+)
Die Wahl des Graphen als Grundlage eines Algorithmus bestimmt ganz wesentlich seine Leistungsfähigkeit.
In der Tat führt der Social Graph zu einer Art “Sozialer Blase”: die Inhalte basieren auf dem Mainstream meiner Kontakte. Bereits im Kindesalter bestimmen so die Mitschüler eines Kindes dessen Inhaltsangebot.
Der Interest Graph führt - je nach Qualität der genutzten Ontologie - schnell zu einem Echo Chamber-Effekt, durch den sich das Inhaltsangebot ständig stärker fokussiert.
Die Nutzung des Social Interest Graph verspricht, die Nachteile der beiden vorgenannten Grundlagen zu kompensieren: Die (bekannten) Interessen des Lesers werden durch die Popularität von (unbekannten) Themen ergänzt. Hervorragende Beispiele für die Praxistauglichkeit dieses Ansatzes finden sich in Form der iPad-App Zite sowie des Online-Angebots Eqentia. Wer die Leistungsfähigkeit von Algorithmen beurteilen möchte, sollte dies unbedingt erst nach Verwendung dieser Systeme über mehrere Tage tun.
Relevancer liefert semantische Suche für Wissenschaftsportal Owidi

Am 11. November 2011 kündigte die Deutsche Gesellschaft für Zahn-, Mund- und Kieferheilkunde (DGZMK) den Launch ihres Portals Owidi an. Owidi stellt dabei den Mitgliedern der DGZMK eine Internetplattform für gezielte fachliche Recherchemöglichkeiten mit Online-Lernen und Social Networking zur Verfügung. Content hierfür wird geliefert unter anderem von Deutscher Ärzte-Verlag, Quintessenz Verlag and Springer Medicine.
“Herzstück bei der Informationssuche auf dem zahnmedizinischen Wissensportal owidi ist die Verknüpfung mit der intelligenten Suchtechnologie myQ, die vom Quintessenz Verlag ursprünglich für die eigenen Produkte entwickelt wurde und nun gemeinsam mit der DGZMK zur Recherche des gesamten Wissensraumes der Zahnmedizin eingesetzt wird. Diese fortschrittliche Suchtechnologie vereint das intelligente Bewerten und Kategorisieren von Fundstellen unter Einbeziehung einer semantischen Suche und auf Wunsch mit einem lernfähigen und nutzerbezogenen Suchprofil, dem sogenannten Relevancer. So wird sichergestellt, dass aus einer Flut von Informationen zielgenau die Antworten ausgewählt werden, die für den Nutzer interessant sein könnten. Diese Suche nach und das Finden von relevanten fachmedizinischen Inhalten ist eines der zentralen Instrumente von owidi.
Die Suchmaschine nutzt bei der Suche sämtliche verfügbaren Quellen, etwa Leitlinien und Stellungnahmen der DGZMK und ihrer Fachgruppierungen, aber auch fachlich hochwertige Beiträge in den angeschlossenen Foren, digitale Medien der kooperierenden Verlage, Beiträge aus wissenschaftlichen Zeitungen sowie entsprechende Fortbildungsangebote der APW. Während viele solcher Inhalte bislang über teure und umständliche Abonnements erworben werden mussten, bietet owidi eine preiswerte und leicht zu bedienende Alternative. Mit dem über das Portal integrierten Micropayment-System können kostenpflichtige Inhalte einfach bestellt, bezahlt und sofort genutzt werden.”
Relevancer nutzt die drei Engines (Aggregation, Analysis, Curation) für die individuelle Zusammenstellung von Inhalten aus dem gesamten Corpus in Deutsch und Englisch - zur Laufzeit und basierend auf dem individuellen Interest Graph des Useres. Als Ergebnis stellt Owidi die Implementierung eines State-of-the-art-Portals mit Algorithmic Content Curation dar.
Owidi ist zur Zeit in Private Beta und wird Anfang 2012 live gehen.
Dieser Beitrag erschien im Original am 14.11.2011 auf Relevancer
