bloginista
Massimiliano Siddi
Home
  • Blog

DocBook-Dokumente nach OpenOffice konvertieren

20. Mai 2010 12:06 von madmax

Mit dem Programm docbook2odf lassen sich Docbook-Dateien in das ODF-Format konvertieren. Damit ist eine weitere Verarbeitung der Dokumente mit OpenOffice möglich. Zudem kann man in OpenOffice das Dokument als Word-Datei abspeichern, sodass die Datei auch an Windows-Benutzer weitergegeben werden kann, die ausschließlich Word benutzen.

Vereinfacht wird diese Konvertierung dadurch, dass Docbook genau wie ODF eine standardisierte XML-Anwendung ist, die einfach per XSLT konvertiert werden können. Das XML-Format beider Dokumenttypen ist also bekannt und gut dokumentiert. Die Formate der Quell- bzw. Zieldokumente müssen also nicht durch aufwendiges und fehlerträchtiges "Reengineering" rekonstruiert werden.

Solche Konvertierungen bieten sich an, wenn bspw. ein Kunde mit einem XML-Dokument (beispielsweise ein Pflichtenheft) arbeiten möchte, der keine XML-Kenntnisse hat.

docbook2odf besorgen

Das Programm ist als Debian-Paket erhältlich und wird auf sourceforge gehostet. Zudem kann man sich als Debian/Ubuntu-Nutzer per apt-get install auf einfache Weise eine Version von docbook2odf beschaffen. Des Weiteren wird ein installierter XSLT-Prozessor wie xsltproc vorausgesetzt sowie die Bildkonvertierungssoftware ImageMagick.

Funktionsweise von docbook2odf

docbook2odf besteht im Wesentlichen aus einem Perl-Script, das über die Kommandozeile aufgerufen wird. Mitgeliefert wird eine umfangreiche XSLT-Anwendung, mit der die Docbook-Dokumente in das XML-Format für OpenOffice Writer umgewandelt wird.

Ein ODF-Dokument ist ein ZIP-Archiv, das verschiedene XML-Dateien sowie die eingebetteten Bilder erhält. docbook2odf wandelt das Docbook-XML also in die verschiedenen XML-Dateien um, soweit dies möglich ist. Verschiedene Formatierungen werden in separaten XML-Dateien vorgegeben, die das Templatesystem von docbook2odf mitliefert. Es ist also möglich, das Layout anzupassen.

Über ImageMagick werden die Bilder, die im DocBook referenziert werden, in ein ODF-kompatibles Format konvertiert. Anschließend werden die XML-Dateien inklusive der konvertierten Dokumente in ein ZIP-Archiv gepackt und mit der Endung .odf versehen. Die Datei kann anschließend mit OpenOffice Writer geöffnet werden.

Docbook-Dokument erstellen

Um die Umwandlung von Docbook nach ODF zu dokumentieren, habe ich ein einfaches Docbook-Dokument erstellt. Es besteht aus einem bookinfo-Element mit Titel, Datums- und Autorenangaben sowie aus zwei Kapiteln. In einem Kapitel ist zudem ein Bild eingebunden worden. Bilder werden in Docbook einfach per Referenz eingebunden. Das folgende Screenshot zeigt die XML-Datei im XML-Editor XMLMind:Docbook-Datei

Im folgenden Schritt kann dieses Docbook-Dokument in das ODF-Format umgewandelt werden.

docbook2odf benutzen

Um docbook2odf zu benutzen, gehen Sie einfach folgenden Befehl in die Kommandozeile ein:

docbook2odf <Docbook-Dateiname>

<Docbook-Dateiname> steht hier für den aktuellen Dateinamen der Docbook-Datei.

Das Script wandelt das XML direkt in das ODF-format um, fügt einige zusätzliche Formatierungsangaben hinzu, wandelt alle referenzierten Bilddateien in das JPEG-Format um und packt schließlich alles in eine ZIP-Datei, die den Namen der angegebenen Datei enthält. Die Ausgabedatei erhält zudem die Dateiendung .odt.

Unter Ubuntu kann man die umgewandelte Datei entweder direkt mit OpenOffice öffnen oder folgenden Befehl in die Kommandozeile eingeben:

ooffice <ODT-Dateiname>

ODT-Dateiname steht hier für den Dateinamen des Office-Dokuments im Writer-Format. Writer ist der Name des Textbearbeitungsdokuments der OpenOffice-Suite.

Der folgende Screenshot stellt die umgewandelte Datei in OpenOffice vor:

Umgewandelte Docbook-Datei in OpenOffice

Weitere Schritte: Templates anpassen

Im Prinzip kann man die Style-Vorlagen von docbook2odf an die eigenen Bedürfnisse anpassen. Unternehmen könnten beispielsweise eigene Corporate-Design-Vorgaben benutzen, indem die Stylesheets aus dem docbook2odf-Templatesatz abgeleitet werden. Näheres ist auf der Projektseite des Maintainers von docbook2odf zu erfahren. Leider ist auf der Sourceforge-Projektseite bisher noch keine Dokumentation erhältlich (Letzter Zugriff: 28.05.2010), sodass man sich die Templates selber anschauen muss, wenn man Anpassungen vornehmen möchte.

Posted in Dokumentation, XML, XSLT

Keine Kommentare


(Kommentarbereich geschlossen)

← Ältere Einträge