Schlagwort: daten

Wikipedia entwickelt eine Art offenes Content-Management-System für die ganze Welt

Viele Verlage haben, um sich fit für die digitale Welt mit der dort notwendigen Vielzahl an Produkten zu machen, erstmal ein zentrales CMS eingeführt, aus dem sich die unterschiedlichen Inhalte-Produkte speisen sollen. Vielen steht das aber auch noch bevor. In den meisten Häusern ist so eine Software-Einführung ein mit großen Herausforderungen verbundenes Projekt (Change-Prozesse werden ausgelöst, Produktpolitik muss überdacht werden, Mitarbeiter müssen sich umgewöhnen, …).

Wikipedia macht jetzt etwas ganz ähnliches. In diesem Fall werden die dann zentral gepflegten Daten aber frei zur Verfügung stehen und auch auf fremden Websites sowohl technisch als auch rechtlich nutzbar sein. Wenn das erstmal steht, ist es für die Nutzer eine super Sache und für manchen Verlag ein durchaus relevanter Wettbewerber:

Vom 30. März bis 1. April findet in Berlin die jährliche Wikimedia Conference mit Teilnehmern aus 40 Ländern statt. Zeitgleich startet Wikimedia Deutschland mit Wikidata ein völlig neues Wikimedia-Projekt. Wikidata wird eine offene Datenbank für das Wissen der Welt werden, an der jeder mitarbeiten kann. Das erste Ziel des Projekts ist es, die mehr als 280 Sprachversionen von Wikipedia mit einer einzigen gemeinsamen Datenquelle auszustatten. Damit können weltweit die Daten der Artikel in allen Sprachen der freien Enzyklopädie ergänzt und zentral gepflegt werden. Aber auch außerhalb von Wikipedia können die Daten verwendet werden, zum Beispiel in Blogs oder auf Webseiten. Das Prinzip einer gemeinsamen Datenquelle soll die Qualität und Übereinstimmung von Wikipedia-Artikeln verbessern. Durch Wikidata werden mehr Informationen in kleineren Sprachversionen von Wikipedia verfügbar gemacht. Gleichzeitig wird es für Zehntausende freiwillige Wikipedia-Autoren erheblich einfacher, Daten in der Enzyklopädie aktuell zu halten.

Der Vorstand von Wikimedia Deutschland, Pavel Richter, erklärt : “Wir betreten Neuland. Wikidata ist das größte technische Projekt, das jemals eine der 40 Länderorganisationen der Wikimedia-Bewegung in Angriff genommen hat. Wikimedia Deutschland widmet sich mit Begeisterung der Aufgabe, durch Wikidata die Datenverwaltung der größten Wissenssammlung der Menschheit deutlich zu verbessern.”

Es gibt auch schon einen ersten Screenshot:

Bildquelle: Wikimedia (Creative Commons CC0 1.0 Universal Public Domain Dedication.)
via: netzpolitik.org

Wir brauchen mehr Experimente im Publishing

Die Idee, Bücher als Start-ups zu begreifen, ist nicht neu, aber auch heute nicht minder wertvoll. Letztlich geht es um die Anwendung erprobter Verfahren im Umgang mit Situationen hoher Unsicherheit. Das Management-Wissen rund um den Aufbau neuer Unternehmen scheint hierfür sehr gut geeignet zu sein. Das bedeutet, Experimente durchzuführen sowie Daten zu erheben und zu analysieren. Das wird aber bisher im Publishing zu selten getan.

Eric Ries hat den Begriff „Lean Startup“ geprägt und wendet den Gedankenansatz auch auf’s Publishing an. Seine in diesem Zusammenhang interessante Sicht erklärt er in diesem Interview:

(Video, 8 min.)

—————————————————-
Abo + Austausch: Feed, E-Mail, Facebook, Google+, Twitter, Xing, Über mich

Peter Collingridge: Heutiges Buch-Marketing taugt nicht viel – Daten sind die Lösung

„[Random House must…] change from being a B2B company to being a B2C company.“ Markus Dohle, CEO Random House

„It’s difficult to determine what marketing strategies helped [my book], hurt or were just a waste of time.“ David Wolman, WIRED author

„When it comes to the really important decisions, data trumps intuition every time.“ Jeff Bezos, Amazon

„We need to develop new skills in data analytics, listen to our readers, and understand what they want and what they will pay for.“ John Makinson, CEO Penguin

Peter Collingridge, Mitgründer von Enhanced Editions, sagt viele richtige Dinge in dem Video unten, in welchem er seine Neugründung Bookseer vorstellt, ein Daten-Analyse-Tool für den Buchmarkt. Er spricht sich aus für einen datengetriebenen und endkundenorientierten Marketing-Ansatz und bringt auch die Rolle von „Social“ auf den Punkt:

Right now, sales drives social — not the other way round. However, I believe there will come a point when that’s not the case, and we will be able to identify that.

(Video, 10 min.)

via: O’Reilly Radar
—————————————————-
Abo + Austausch: Feed, E-Mail, Facebook, Google+, Twitter, Xing, Über mich

Der Newsstream von Pinterest ist potenziell relevanter als der von Facebook oder Google+

Dass ich die Bilder-Sharing-Seite Pinterest als Plattform sehr gut und intelligent gestaltet finde, hatte ich im November hier erwähnt. Erwähnt hatte da ich auch die am Beispiel von Pinterest ersichtlichen Herausforderungen beim alltäglichen Umgang mit dem Urheberrecht.

Jon Mitchell weist nun bei ReadWriteWeb auf einen interessanten Punkt hin. Kurze Hinleitung: Das Abo-Prinzip ist ein sehr wichtiges Element im Social Web beim Umgang mit den verfügbaren unendlichen Datenmengen. Wir gehen häufig nicht mehr aktiv auf die Suche nach Informationen, weil das zu zeitaufwändig wäre, sondern lassen uns diese zuliefern – im Abo. Daher ist es sehr wichtig, wie die aus dem Abo-Prinzip resultierenden Datenströme gestaltet sind und wie sie gefiltert werden (können). Denn am Ende geht es um Relevanz.

Es ist kein Geheimnis, dass das Anlegen von Listen (Facebook) oder Kreisen (Google+) bestimmter Abo-Quellen (Menschen, Marken, Anwendungen, …) nur bedingt funktioniert. Der Aufwand seitens des Abonennten ist einfach zu groß. Zudem kann der Abonnent sowohl bei Google+ als auch bei Facebook im Prinzip nur einstellen, dass er mehr oder weniger der Nachrichten von Nutzern im Stream angezeigt bekommen möchte. Eine thematische Auswahl ist nicht möglich:

But neither of those networks offer much control for the person on the receiving end. Facebook’s News Feed algorithm is a bit of a magic soup. You can tell it you want more or fewer updates from certain things in certain situations, but for the most part, if they’re sharing it with you, you’re going to get it. Google+ lets you turn down the volume on your circles, so you can adjust the noisiness of groups you’re following, but the people in those circles are just sharing wherever they share. The recipient has to do her or his best to keep all the senders organized.

Anders Pinterest. Hier können seitens der Nutzer so genannte Boards angelegt werden, auf denen sie Bilder bestimmter Themen sammeln. Letztlich sind diese Boards nichts anderes als eine optisch aufgehübschte Verschlagwortung. Das Besondere ist, dass diese Boards bzw. Schlagworte separat abonnierbar sind (ganz ähnlich wie bei den guten alten Bookmarking-Diensten). Ein Nutzer kann also von anderen Nutzern komplett abonniert werden (inkl. aller Boards) oder es werden nur einzelne seiner Boards abonniert, die zu den Interessen des anderen Nutzers passen. Der entscheidende Unterschied zu Facebook und Google+ ist bei diesem Ansatz, dass der die Inhalte erstellende Nutzer selbst die Sortierung/Verschlagwortung seiner Postings nach Themen vornimmt. Er hat ein Eigeninteresse, das zu tun. Die Abonnenten können sich dann passende nach Themen geordnete Abo-Quellen heraussuchen und haben nur geringen Aufwand. So wird es auch möglich, dass man für die Allgemeinheit sehr unterschiedlich relevantes Bildmaterial postet und dennoch eine relevante Abo-Quelle sein kann:

If someone you like has a board for „desserts,“ which you like, and a board for „spaceships,“ which you love, but they also post to their „cute puppies“ board all day long (and you hate puppies), the solution is simple: You unfollow „cute puppies,“ and everything else remains. Both the pinner and the follower only have to think about their own tastes. They don’t have to guess what other people are like.

—————————————————-
Abo + Austausch: Feed, E-Mail, Facebook, Google+, Twitter, Xing, LinkedIn

Kulturanalyse über Jahrhunderte hinweg mittels Text-Analyse von Millionen von Büchern

Have you played with Google Labs‘ NGram Viewer? It’s an addicting tool that lets you search for words and ideas in a database of 5 million books from across centuries. Erez Lieberman Aiden and Jean-Baptiste Michel show us how it works, and a few of the surprising things we can learn from 500 billion words

Unterhaltsame Präsentation:

(Video, 14 min.)

Nur mal ein Beispiel: Die Geschichte Leipzigs lässt sich auch ganz gut auch über das Analyse-Tool darstellen:

via: Kevin Kelly

—————————————————-
Abo + Austausch: Feed, E-Mail, Facebook, Google+, Twitter, Xing, LinkedIn

Warum es rational ist, im Internet viele Daten über sich preiszugeben

Ende letzter Woche war ich auf dem Werbeplanung.at Summit 11 in der Wiener Hofburg, wo ich an einer Diskussionsrunde teilnehmen durfte. Die Closing Keynote hielt Karin Frick. Sie „ist Leiterin Research und Mitglied der Geschäftsleitung des Schweizer Gottlieb Duttweiler Instituts (GDI). Als Ökonomin erforscht und analysiert sie seit vielen Jahren Trends und Gegentrends in Wirtschaft, Gesellschaft und Konsum.

In ihrem Vortrag erwähnte sie sehr viel Interessantes zum Thema Social Data. Sehr gelungen fand ich ihre schön auf den Punkt gebrachte Folie (s.u.), die zeigt, warum wir als Nutzer so viel Daten über uns preisgeben und wo die Chancen für innovative Unternehmen wie Katango & Co. liegen. Der Punkt ist, dass wir Dunbar zufolge ab einem gewissen Volumen soziale Beziehungen ohne Hilfsmittel nicht mehr „managen“ können. Dennoch steigt Metcalfe zufolge der Wert eines Netzwerkes weiter durch das Hinzufügen zusätzlicher Knotenpunkte. Genau hier bieten sich also vielfältigste Chancen, die wir und die Unternehmen aber wie zitiert nur dann nutzen können, wenn wir uns auch öffnen:

The cost of privacy is generic relationships – if you’re unknown to everyone, it’s hard to customize to you. On the other side, you can have high transparency and high personalization, and people seem to be willing to push the slider far in that direction. The difference between quantified self and intimate surveillance is, basically, permission.

—————————————————-
Abo + Austausch: Feed, E-Mail, Facebook, Google+, Twitter, Xing, LinkedIn

Der Megatrend „Lifeblogging“ als wichtige Ursache für die Ver-x-fachung der Datenmengen im Internet

Es stellt sich die Frage, wo die Mengen an vorausgesagten Daten herkommen sollen, die wir künftig teilen:

Mark Zuckerberg sagt voraus: Die Menge der im Social Web geteilten Inhalte wird sich jedes Jahr verdoppeln

Ich denke, verschiedene Datenquellen werden mit hineinspielen. Zum einen wird alles uns Umgebene Teil des Internets und über Sensoren u.ä. zu Datenquellen – eine Art „Outernet“ entsteht. Dieses fordern wir sogar ein, weil wir vom Internet und seinen Möglichkeiten Verwöhnten immer öfter feststellen müssen, dass die analoge Welt in vielen Bereichen neben Vorteilen tatsächlich auch Nachteile hat:

Die analoge Welt ist “broken” – Die Netzwelt als Standard auch im “echten” Leben

Künftig wird also alles – entsprechend über Algorithmen und Social-Media-Crowdsourcing vorgefiltert – abonnierbar sein oder andernfalls an Bedeutung verlieren. Da Zeit das ordnende Prinzip ist, werden wir überall umgeben sein von Streams, in die wir bei Interesse eintauchen können, so wie wir es heute im Netz schon zu tun beginnen:

Alles im Fluss? – Das Social Web als Abo-Dienst

Hinzu kommt aber noch, dass nicht nur die uns umgebenen Objekte Teil des Internets sind/werden, sondern auch wir selbst mit allem was wir haben und was uns ausmacht. Wir Menschen werden zu wandelnden „Lifeblogs“ – was Heavy User von Foursquare & Co. ja schon heute in Ansätzen sind:

The Quantifiable Self

Ein paar aus meiner Sicht besonders interessante Zitate von Kevin Kelly bzw. Ethan Zuckerman zum Megatrend „Lifeblogging“:

(…)
Through technology we are engineering our lives and bodies to be more quantifiable. We are embedding sensors in our bodies and in our environment in order to be able to quantify all kinds of functions. Just as science has been a matter of quantification — something doesn’t count unless we can measure it — now our personal lives are becoming a matter of quantification. So the next century will be one ongoing march toward making nearly every aspect of our personal lives — from exterior to interior — more quantifiable. There is both a whole new industry in that shift as well as a whole new science, as well as a whole new lifestyle.
(…)
These lifestreams intersect with each other and are, in a way, creating a new media. If we organize computation around lifestreams, an intersection between our lifestreams is a communication, an event of some sort. The media we are in is these streams of data. Everything around us has a sliver of intelligence in it, and is generating bits of data. Each of those objects has a lifestream of data, from the hotel room to your shoes. This environment, with data streams and life streams, is the space where we’ll do the work of the quantified self.
(…)

Gerade für Verlage, die sich als Erlebnis-Agenturen verstehen, bieten sich hier Chancen:
We don’t really care about data, he reminds us – we care about experience.

Weiter:

(…)
Everything that can be shared will be shared, because sharing things increases their value.
(…)
The cost of privacy is generic relationships – if you’re unknown to everyone, it’s hard to customize to you. On the other side, you can have high transparency and high personalization, and people seem to be willing to push the slider far in that direction. The difference between quantified self and intimate surveillance is, basically, permission.
(…)
The third question KK offers is who owns this data? Who owns your friendships? There’s another party involved. Who owns your genes? 99.9% are shared by other humans. Who owns your location? The knowledge that you’re in a public space is hard to own. Your reputation or history? Your conversations? The real issue is that we’re moving away from ownership altogether to access.
(…)
We’re going to become quantifiable to the point where we’re real time and changing ourselves in real time.
(…)

Insgesamt alles sehr anregend und bedenkenswert. Viele Vorläufer dieser Zukunft sehen wir heute bereits, wie das immer der Fall ist, was Kelly an anderer Stelle treffend beschreibt:

Well, one lesson we can take from the web today is that any possible behavior is already happening somewhere at least once in the world. The very long tail of the future is already here.
(…)
„The future is unevenly distributed,“ to paraphrase the great Gibson.

————————–
Blog-Abo: Feed E-Mail Facebook Google+ Twitter
————————–

Mark Zuckerberg sagt voraus: Die Menge der im Social Web geteilten Inhalte wird sich jedes Jahr verdoppeln

In Mark Zuckerberg’s Law of Social Sharing, Y = C *2^X — Where X is time, Y is what you will be sharing and C is a constant.
(via TechCrunch)

Klingt nicht unwahrscheinlich. Man denke nur daran, welche Daten-Mengen beim Tracking von Körperfunktionen u.ä. erzeugt werden (siehe quantifiedself.com):

(2 min.)

————————–
Blog-Abo: Feed E-Mail Facebook Google+ Twitter
————————–