Offenes Wissen für KI-Agenten: Was das Open Knowledge Format verändert

Verfasst von

in

Das Open Knowledge Format gibt Markdown-Wissensbeständen eine gemeinsame, maschinenlesbare Struktur. Der Abgleich mit dem Agentic Vault bestätigt dessen Grundidee, zeigt aber auch, wo Navigation und Metadaten vereinfacht werden mussten.

Das Open Knowledge Format

Am 12. Juni 2026 veröffentlichte Google Cloud im offiziellen GitHub-Repository die erste Fassung des Open Knowledge Format. Die Version 0.1 ist noch ein früher Entwurf. Sie beschreibt jedoch bereits eine gemeinsame Grundstruktur für Wissensbestände, die Menschen und KI-Systeme gleichermaßen lesen können. Für den Agentic Vault stellte sich damit unmittelbar die Frage, wie gut die eigene Struktur zu dieser neuen Konvention passt. Der Entschluss, den Vault so früh wie möglich daran auszurichten, war deshalb schnell getroffen.

Die Grundidee von OKF ist bewusst einfach. Jede inhaltlich relevante Markdown-Datei bildet ein Concept – eine einzelne Wissenseinheit. Das kann die Beschreibung eines Datensatzes sein, eine fachliche Einordnung, eine Synthese oder eine Arbeitsanweisung. Am Anfang der Datei steht ein YAML-Frontmatter, also ein klar abgegrenzter Metadatenblock. Darin wird mindestens festgehalten, um welche Art von Inhalt es sich handelt. Weitere Angaben wie Titel, Beschreibung, Quelle, Schlagwörter oder Zeitpunkt können ergänzt werden. Der eigentliche Inhalt bleibt normales Markdown und damit ohne Spezialsoftware lesbar.

Mehrere Concepts bilden gemeinsam ein Knowledge Bundle, also ein in sich abgegrenztes Wissenspaket. Die Verzeichnisstruktur ordnet die Dateien und damit die einzelnen Concepts. Der jeweilige Dateipfad dient zugleich als eindeutige Adresse. OKF bezeichnet diese Adresse ohne die Endung .md als Concept ID. Für Nichttechniker lässt sich das mit der Signatur eines Buches in einer Bibliothek vergleichen: Sie zeigt nicht nur, welches Werk gemeint ist, sondern auch, wo es zu finden ist. Wird eine Datei verschoben, ändert sich ihre Adresse – Verweise müssen also nachgeführt werden.

Die Beziehungen zwischen den Wissenseinheiten entstehen durch normale Markdown-Links. Verweist eine Datei auf eine andere oder eine Konzeptseite auf einen verwandten Begriff, wird dieser Link zugleich zu einer Verbindung im Wissensgraphen. Eine separate Graphdatenbank ist hierfür nicht erforderlich. Welche Bedeutung eine Verbindung hat, ergibt sich aus dem umgebenden Text. Für den Menschen bleibt sie ein anklickbarer Verweis; ein KI-System kann die Links nutzen, um inhaltliche Zusammenhänge abzuleiten oder eine grafische Darstellung des Wissensnetzes zu erzeugen.

Damit eine KI nicht bei jedem Aufruf alle gespeicherten Inhalte lesen muss, sieht OKF auf jeder Verzeichnisebene eine optionale index.md vor. Diese listet auf, welche Unterbereiche und Wissenseinheiten vorhanden sind, und führt über gezielte Links schrittweise tiefer in die Verzeichnisstruktur. OKF nennt dieses Prinzip Progressive Disclosure: Zunächst wird nur die Übersicht geladen, anschließend genau der Teil, der für die konkrete Aufgabe relevant ist. Das spart Platz im Kontextfenster eines KI-Agenten; für den Menschen bleibt die Struktur wie ein normales Inhaltsverzeichnis lesbar.

Verwendete Quellen werden am Ende eines Concepts unter der Überschrift # Citations aufgeführt. So bleibt nachvollziehbar, worauf eine Aussage beruht. Zugleich verlangt OKF nur wenige verpflichtende Angaben. Es schreibt weder eine bestimmte Software vor noch legt es abschließend fest, welche Arten von Wissenseinheiten es geben darf. Diese Offenheit ist entscheidend: Das Format soll keinen weiteren Wissensspeicher schaffen, sondern eine gemeinsame Konvention, mit der unterschiedliche Werkzeuge dieselbe Wissenssammlung erzeugen, austauschen und lesen können. Genau darin liegt seine Bedeutung für den Agentic Vault.

Was das Open Knowledge Format bestätigt

Der Abgleich des Agentic Vaults mit OKF führte zunächst nicht zu einem Neubau. Im Gegenteil: Er bestätigte wesentliche Entscheidungen, auf denen der Vault bereits beruhte. Wissen sollte dauerhaft in einer offenen und nachvollziehbaren Form gespeichert werden. Menschen sollten die Inhalte ohne Spezialsoftware lesen und bearbeiten können. Zugleich sollten KI-Systeme in der Lage sein, die Dateien einzuordnen, miteinander zu verknüpfen und gezielt auf relevante Inhalte zuzugreifen. Genau diese Grundrichtung findet sich auch im Open Knowledge Format wieder.

Bestätigt wurde vor allem die Entscheidung, Wissen in einfachen Markdown-Dateien zu speichern. Der Inhalt bleibt dadurch unabhängig von einer bestimmten Schreib- oder Wissensplattform und kann mit einfachen Texteditoren gelesen werden. Das Frontmatter ergänzt die Angaben, die ein KI-System für die Verarbeitung benötigt. Inhalt und Metadaten stehen in derselben Datei: Der Mensch liest den Text, während die KI anhand von Angaben wie Dokumentart, Beschreibung und Quelle erkennt, womit sie arbeitet.

Auch die Verknüpfung des Wissens durch normale Links hat sich als tragfähig erwiesen. Aus einzelnen Dateien entsteht ein Netz von Quellen, Synthesen und weiterführenden Inhalten, ohne dass daneben eine zweite Datenstruktur gepflegt werden muss. Quellenangaben machen zugleich sichtbar, worauf eine Aussage beruht. Auch die automatisch erzeugten Indizes als Navigationshilfe wurden durch OKF bestätigt.

Ebenso wichtig ist die dadurch gestärkte Unabhängigkeit von einzelnen KI-Modellen und Anwendungen. Das Wissen liegt weder in einem bestimmten Chatverlauf noch in einer geschlossenen Datenbank. Unterschiedliche KI-Systeme können mit denselben Wissensinhalten arbeiten, solange sie Markdown-Dateien und ihre Metadaten verarbeiten können. Wird ein Modell oder ein Werkzeug ausgetauscht, muss das Wissen nicht mit umziehen. Der Vault bleibt die beständige Wissensschicht, während die darauf zugreifenden Systeme austauschbar bleiben.

Was angepasst werden musste

Die Bestätigung der Grundidee bedeutete allerdings nicht, dass der Agentic Vault unverändert bleiben konnte. Gerade der Abgleich mit einer allgemeinen Spezifikation machte sichtbar, an welchen Stellen die eigene Lösung unnötig kompliziert oder zu stark an einzelne Werkzeuge gebunden war. Der größte Anpassungsbedarf betraf die Navigation durch die Wissensinhalte.

Im zweiten Beitrag dieser Serie hatte ich eine zentrale Einstiegskarte, ein strukturelles Inventar und einen thematischen Inhaltsindex als eigene Navigationsschicht beschrieben. Das Konzept war nachvollziehbar: Eine KI sollte über vorbereitete Übersichten schnell zu den relevanten Dateien finden. In der Praxis wurden diese parallelen Übersichten von den entscheidenden Arbeitsabläufen jedoch nicht zuverlässig genutzt. Der Syntheseprozess griff beispielsweise direkt auf die Quellenverzeichnisse zu. Damit entstand zusätzlicher Pflegeaufwand für eine Navigationsschicht, die ihre vorgesehene Funktion nur teilweise erfüllte.

Diese parallele Navigationsschicht wurde aufgegeben. An ihre Stelle trat der bereits beschriebene, automatisch erzeugte index.md-Baum. Er folgt unmittelbar der tatsächlichen Verzeichnisstruktur und erfordert keine davon unabhängig gepflegte Ordnung.

Ein weiterer Anpassungspunkt betraf das Frontmatter. Verschiedene Prozesse hatten Metadaten mit unterschiedlichen Feldnamen oder nach leicht abweichenden Regeln geschrieben. Solange nur die eigene Software damit arbeitete, ließ sich das ausgleichen. Für eine übertragbare Wissenssammlung braucht es jedoch eine einheitliche Form. Die Feldnamen wurden deshalb vereinheitlicht und die Regeln für das Schreiben der Metadaten an einer Stelle zusammengeführt. Unabhängig davon, wie eine Datei in den Vault gelangt, soll ihre Bedeutung nach denselben Regeln erkennbar sein.

Keine dieser Änderungen stellt die bisherige Arbeitslogik infrage. Sie räumen vielmehr Strukturen auf, die sich während des Aufbaus angesammelt hatten. Aus mehreren parallelen Übersichten wurde ein automatisch erzeugter Navigationsbaum, aus unterschiedlichen Metadatenregeln wurde eine gemeinsame Form. Die wichtigste Wirkung des OKF-Abgleichs bestand deshalb nicht in zusätzlicher Technik, sondern in der Vereinfachung des bestehenden Systems.

Was das Open Knowledge Format nicht leistet

OKF löst ein klar umrissenes Problem: Es beschreibt, wie Wissen strukturiert und zwischen unterschiedlichen Systemen ausgetauscht werden kann. Die Spezifikation nennt Menschen und KI-Agenten als mögliche Erzeuger und Nutzer dieser Wissensinhalte. Sie legt aber nicht fest, welche Rolle beide übernehmen oder wie sie zusammenarbeiten. Genau an diesem Punkt geht der Agentic Vault über OKF hinaus.

Ein zentrales Prinzip des Agentic Vaults ist die Trennung zwischen administrativer Pflege und inhaltlicher Arbeit. Wiederkehrende Aufgaben wie das Abrufen und Einordnen neuer Quellen, das Ergänzen von Metadaten, das Aktualisieren der Indizes und die Prüfung der Verzeichnisstruktur übernimmt das KI-System. Der Mensch soll nicht zum Verwalter seiner Wissensumgebung werden. Seine Aufgabe ist es, Themen zu setzen, Quellen zu bewerten, Fragen zu schärfen und über die inhaltlichen Ergebnisse zu entscheiden.

Die inhaltliche Arbeit erledigt der Mensch gemeinsam mit der KI. Dabei recherchiert die KI, führt vorhandene Inhalte zusammen und formuliert erste Entwürfe. Der Mensch steuert den Prozess, prüft die Aussagen und entscheidet, was übernommen, verworfen oder weiterentwickelt wird. Die KI übernimmt damit nicht die inhaltliche Verantwortung. Sie schafft vielmehr die Voraussetzungen dafür, dass sich der Mensch auf Einordnung, Urteil und Ergebnis konzentrieren kann. Diese Arbeitsteilung ist ein Grundprinzip des Agentic Vaults. Im Open Knowledge Format wird sie jedoch nicht behandelt.

Auch die Regeln für diese Zusammenarbeit liegen außerhalb von OKF. Die Spezifikation sagt einem KI-Agenten nicht, für wen er arbeitet, welche Ablageregeln gelten, welchen Schreibstil der Mensch bevorzugt oder wie ein Ergebnis in den Vault zurückgeführt werden soll. Im Agentic Vault wird dieser Arbeitskontext in Instruktionsdateien, persönlichen Kontextdateien und festgelegten Rückflusspfaden abgebildet. Erst dadurch wird aus einer lesbaren Wissenssammlung ein gemeinsamer Arbeitsraum für Mensch und KI.

Wie diese administrativen Aufgaben ausgeführt und geprüft werden, regelt OKF ebenfalls nicht. Dafür braucht der Agentic Vault eigene Abläufe, die Quellenaufnahme, Aktualisierung und Fehlererkennung verlässlich steuern.

Schließlich garantiert ein korrekt formatiertes Knowledge Bundle noch keine inhaltliche Qualität. Quellenangaben machen Aussagen nachvollziehbar, bewerten aber weder die Verlässlichkeit einer Quelle noch die Güte einer daraus entstandenen Synthese. Diese Bewertung bleibt Teil der gemeinsamen Arbeit von Mensch und KI – mit dem Menschen in der entscheidenden Rolle. OKF liefert somit die gemeinsame Sprache für die Wissensschicht. Der Agentic Vault ergänzt das Arbeitsmodell, die Rollenverteilung und die Prozesse, die daraus eine funktionsfähige Arbeitsumgebung machen.

Zusammenwirken und Ausblick

Die Anwendung des OKF v0.1 auf den Agentic Vault ist inzwischen abgeschlossen. Das bedeutet nicht, dass aus dem frühen Entwurf bereits ein fertiger Standard geworden ist. Es zeigt jedoch, dass sich die grundlegenden Vorgaben praktisch umsetzen lassen.

Offen bleibt die Frage, wie aus dem vollständigen Arbeits-Vault übertragbare Wissenspakete für unterschiedliche Aufgaben entstehen. Denn nicht jede Quelle, jede Instruktion und jeder persönliche Kontext soll an jedes KI-System weitergegeben werden. Der nächste Beitrag zeigt deshalb, wie solche Pakete bedarfsgerecht zusammengestellt werden und welche Abläufe sie verlässlich erzeugen und prüfen.

OKF beantwortet, wie Wissen strukturiert sein muss, damit unterschiedliche Systeme es verstehen können. Der Agentic Vault beantwortet, wie Mensch und KI mit diesem Wissen dauerhaft zusammenarbeiten. Erst beides zusammen macht aus offenen Dateien eine funktionsfähige Arbeitsumgebung.

Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert