Automatisierte WWW-Veröffentlichung auf der Basis formaler Auszeichnungssprachen

von

Stefan Mintert

Stand: 1999-01-28T17:09:34

Inhaltsverzeichnis

1Einleitung
 
1.1Aufgabenbeschreibung
 
1.2Lösungsansatz
 
1.3Aufbau der Diplomarbeit
2Grundlagen und Einordnung in das Themengebiet
 
2.1SGML und XML
 
 
2.1.1Ideen und Konzepte
 
 
2.1.2SGML-Syntax - Ein Beispiel
 
 
2.1.3Hypertext Markup Language
 
 
2.1.4Extensible Markup Language
 
2.2DSSSL und XSL
 
 
2.2.1Extensible Style Language
 
2.3Bestehende Systeme
3Beschreibung des Gesamtsystems
 
3.1Überblick
 
3.2Komponenten
 
 
3.2.1Suchmuster
 
 
3.2.2Atome
 
 
3.2.3DSSSL-Formatierungsrahmen und -rumpf
 
 
3.2.4Stichwortindex
 
 
3.2.5Formularmasken für die Benutzereingabe
 
 
3.2.6CGI-Skripte
4Anwendung am Beispiel der XML-Spezifikation
 
4.1Schritt 1: Initialisierung
 
4.2Schritt 2: Das Dokument
 
4.3Schritt 3: Erstellen der Suchmuster
 
4.4Schritt 4: Aufnehmen des neuen Dokuments
 
4.5Schritt 5: Modifikation der generierten HTML-Datei
 
4.6Anwendung aus Benutzersicht
5Implementation
 
5.1Entwurf der Suchmuster
 
 
5.1.1Elementidentifikation in anderen Systemen
 
 
5.1.2Elementidentifikation in IP4W3
 
5.2Programme
 
 
5.2.1Formulargenerator
 
 
5.2.2Indexierung von und Indexsuche in SGML/XML-Dokumenten
 
 
5.2.3Prüfen auf Übereinstimmung mit dem Suchmuster und Ermitteln des passenden Atoms
 
 
5.2.4Formatierer (DSSSL-Rahmen)
 
 
5.2.5Administrations-Werkzeug
 
5.3CGI-Skripte
 
5.4JavaScript-Funktionsbibliothek
 
5.5Programmabläufe
6Umwandlung der gegeben Daten in SGML/XML-Form
 
6.1Ausgangsdaten
 
6.2Strukturelle Analyse
 
6.3Umwandlung
 
6.4Auszeichnungen
 
6.5DSSSL-Rumpf zur Transformation in HTML
7Ausblick
 
7.1Suchen in mehreren Dokumenten
 
7.2Konformität zu Standards
 
7.3Persistenz von URLs
 
7.4Erweiterungen und Änderungen
 
 
7.4.1Wertebereiche in Formularen
 
 
7.4.2Druckausgabe mit DSSSL
 
7.5IP4W3 und Hypertext
 
7.6Lernen aus Benutzerverhalten
 
7.7Trennung von Suchmustern und Atomen
ABenutzung des Systems
 
A.1ip4w3-manager
 
A.2makeindex
 
A.3ergaenze-ids
BDokumenttyp-Definitionen und DSSSL-Sylesheets
 
B.1DTD für Suchmuster
 
B.2DTD für die Uebe-Bücher
 
B.3DSSSL-Stylesheet für die Uebe-DTD
Bibliographie

Abstract

Das Ergebnis dieser Diplomarbeit ist ein System, das SGML/XML-kodierte Dokumente für die Veröffentlichung im World Wide Web aufbereitet. Der Benutzer, d.h. der Leser, hat die Möglichkeit, nach Stichworten in einer von mehreren Kategorien zu suchen. Suchbegriff und Suchkategorie ersetzen die häufig zu ungenaue Volltextsuche. Im Gegensatz zu den Ausgaben von herkömmlichen Suchfunktionen erhält er als Ergebnis keinen vorgefertigten Ausschnitt aus dem Dokument (z.B. ein Kapitel, einen Abschnitt usw.). Vielmehr wird der Ausschnitt in Abhängigkeit der Textstelle bestimmt, die bei der Suche als Treffer ermittelt wurde.

Die Definition solcher Dokumentausschnitte und der Suchkategorie findet mit Bezug auf den Dokumenttyp, nicht bezüglich des konkreten Textes statt. Diese Herangehensweise besitzt den Vorteil, notwendige Konfigurationen nur einmal je Dokumenttyp machen zu müssen, die dann für sämtliche Dokumente dieses Typs sind.

Danksagung
Die Zahl der Menschen, die mich während der Bearbeitung dieser Diplomarbeit vorangetrieben und für meine geistige Unversehrtheit gesorgt haben, ist zu groß, als daß ich sie alle nennen könnte. Obwohl ich jedem einzelnen meinen Dank schulde, beschränke ich mich bei der namentlichen Nennung auf all diejenigen, die unmittelbaren fachlichen Einfluß auf meine Arbeit hatten. Dies sind vor allem meine Betreuer, Prof. Katharina Morik und Stefan Haustein, die gestaltend auf den Programmentwurf und den Text eingewirkt haben. Für die Ordnung meiner Gedanken in ungezählten Stunden der Diskussion danke ich Henning Behme (die Telekom dankt auch), Eduard Paul und Rainer Stoll (ich sag' nie wieder SGML in Eurer Gegenwart) sowie Sven Schröter (Küchentisch in Hörde). Frei nach Brecht gilt für alle: Ihr habt Vorschläge gemacht, ich habe sie angenommen; nicht jeden, aber viele.
Daß diese Diplomarbeit frei von Rechtschreibfehlern ist, kann ich nicht garantieren. Daß dem Leser viele erspart geblieben sind, danke ich den prüfenden Blicken von Eduard Paul und Rainer Stoll sowie Susanne Collet, die darüber hinaus auch noch mein Wissen über Makroökonomie auf knapp über Null gebracht hat; mehr ist nicht möglich, so viel weiß ich jetzt.
Thanks always to Jackson.

Let the music keep our spirits high


© Stefan Mintert
checked HTML4