SEO fürs Dateisystem

Computer speichern Dateien in einer Ordnerstruktur. Jahrzehntelang haben Computerneulinge mit dem Prinzip des hierarchischen Filesystems, das alle gängigen Betriebssysteme verwenden, mehr oder weniger gekämpft. Dabei kannten die ersten Versionen von MS-DOS beispielsweise noch keine Unterordner — interessant, wie unsere Terabyte-Festplatten ohne Ordner aussähen …  Moderne Betriebssysteme wie Mac OS X sorgen mit ihren “intelligenten” Ordnern allerdings dafür, dass der tatsächliche Speicherort (der Verzeichnispfad) immer irrelevanter wird. Und iOS verbirgt die interne Ordnerstruktur gleich komplett vor dem Nutzer.

Es gibt gute Gründe, die für eine Ablösung des bisherigen “Ordnermodells” sprechen. Die schiere Menge an Dateien auf einer durchschnittlichen Festplatte lässt sich ohne intelligente Suche kaum noch in den Griff bekommen. Die zuletzt bearbeiteten Dateien merken sich die meisten Programme gleich selbst (bzw. das Betriebssystem.) Cloudservices bringen oft eigene Strukturierungsmodelle mit (Facebook setzt mit der Chronik beispielsweise ganz stark auf den Ordnungsfaktor “Zeit”, Flickr bietet Alben an, aber auch einen Fotostream — außerdem unterstützen die meisten Angebote ein tag-orientiertes Modell.)

Tagging statt Ordner

Nach jahrelangen Bemühungen, Ordnerstrukturen zu etablieren, wächst eine Generation heran, die mit Verzeichnispfaden kaum noch etwas anfangen kann, geschweige denn will. Nicht der Pfad zu einer Information und deren tatsächlicher Speicherort ist relevant, sondern der Link und der Zugang. Dahinter steckt ein Paradigmenwechsel. Der endgültige Durchbruch des Prinzips Google: Durch eine nahezu ubiquitäre Suche, die sich verschiedener Hilfsmittel wie Tagging, Gesichtserkennung, GPS-Informationen, etc. bedient, erschließen wir uns die Weiten unserer heimischen Festplatte ebenso wie soziale Medien oder ganz allgemein “das Internet.”

Was verändert sich dadurch für den Ersteller von Informationen (den Autor) und was verändert sich für den Nutzer (den Leser)?

Bisher hat der Ersteller im Wesentlichen vier Möglichkeiten gehabt, Dateien auffindbar zu halten:

  1. den Dateinamen — viele Organisationen haben dazu Namenskonventionen entwickelt oder greifen auf informelle Standards zurück
  2. das Erstell- bzw. Veränderungsdatum  — diese Informationen werden in der Regel vom Betriebssystem automatisch erzeugt. Wie wenig zum Beispiel die vom jeweiligen System erzeugten Datumsinformationen genutzt werden, zeigt die vielfache Integration des “Versionsdatums” einer Datei in den Dateinamen. Diese Information wird, um danach sortieren zu können, häufig an den Anfang eines Dateinamens gestellt. So finden sich auf unzähligen Servern Dateien, die mit der Konvention JJMMDD beginnen, also Jahr, Monat, Tag. 120321-Angebot_KundeA.doc gibt also Aufschluss über den Tag bzw. die Version des Angebots. Viele Informationen in einem “kleinen” Dateinamen.
  3. der Dateityp — auch diese Information wird in der Regel vom Betriebssystem bereitgestellt.

Die vierte Möglichkeit ist der Speicherort. In vielen Organisationen haben sich Mitarbeiter die Köpfe über “Serverstrukturen” zerbrochen, immer wieder, immer wieder neu. Wo lege ich Informationen ab, wenn sie auch Kollegen finden sollen? Mit zunehmender Größe heimischer Festplatten ist das auch ein Thema der Selbstorganisation geworden.

Der Leser kannte entweder die vorliegenden Konventionen, dann hatte er eine realistische Chance, ein gesuchtes Dokument zu finden. Oder er kannte sie nicht.

SEO für die eigenen Dateien

Und heute? Heute vergibt der Autor Schlagworte oder sein Speichersystem erstellt diese automatisch. Dateien werden indexiert. Nutzer ergänzen diese Informationen absichtlich durch die Vergabe von weiteren Tags oder durch Kommentare oder unabsichtlich durch die einfache Nutzung / Rezeption und damit durch die Ergänzung von Nutzerinformation (ja, auch Informationen haben einen Social Graph.)

Entscheidend ist nicht mehr der physikalische Speicherort, sondern ein eindeutiges Identifizierungsmerkmal des Inhalts. Im Gegenteil, die Möglichkeit, den eindeutigen Identifier zu behalten, auch wenn sich der Speicherort ändert, gewinnt immer stärker an Bedeutung.

Der eindeutige Identifier ist – wie früher der physikalische Speicherort (die Pfadangabe) – vor allem deshalb wichtig, um eine konsistente Information über einen längeren Zeitraum zu gewährleisten. Der Paradigmenwechsel erfolgt durch die generelle Findbarkeit. Wie im Web ist der Autor einer Information dafür verantwortlich, dass gute Suchergebnisse erzielt werden.

Information Osmosis

Iqbal hat in seinem Beitrag über Information Osmosis sehr gut beschrieben, wie Informationen in und aus einem Unternehmen fließen (sollten). Der gleiche Gedanke lässt sich generell auf alle Arten von elektronisch gespeicherten Informationen anwenden. Der Autor baut in seine Informationen die Möglichkeit der Findbarkeit ein. Um Iqbal zu zitieren:

Osmosis itself extracts no energy from the cell to transport water – instead it is a property inherent in water, coercing it to perpetually flow from an area of low solute concentration to an area of high solute concentration.

Die Information (die Datei …) enthält alles, um leicht (=ohne Energieverlust) gefunden zu werden. Und im Umkehrschluss werden wir keinen ungehinderten Zugang zu Informationen haben, die nicht daraufhin optimiert wurden. Dies gilt zunehmend auch für Dateien, die wir selbst erstellt haben.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert