Automatische HTML-Inhaltsanalyse in Webseiten

Autor:	Jörg Peschke
EAN:	9783836494991
eBook Format:	PDF
Sprache:	Deutsch
Produktart:	eBook
Veröffentlichungsdatum:	08.04.2008
Untertitel:	Verfahren zur Extraktion von Inhalten basierend auf Web-Seiten-Änderungen
Kategorie:	Computer
Schlagworte:	Analyse Data Mining Differenzanalyse HTML Informatik WWW Web-Seiten Web3D Änderungen

49,00 €*

inkl. MwSt.

zzgl. Versandkosten

(ab 25 Euro versandkostenfrei) *außer auf ausgewälte Artikel

Versandkostenfrei

Die Verfügbarkeit wird nach ihrer Bestellung bei uns geprüft.
Bücher sind in der Regel innerhalb von 1-2 Werktagen abholbereit.

Die automatische Analyse von HTML-kodierten Inhalten stellt ein häufiges Problem in der Dokument-Verarbeitung dar. Ein Spezialfall ist die Analyse versionierter Varianten von HTML-Dateien, welche sich z.B. aus der periodischen Sicherung von Web-Seiten ergibt. Für dieses Buch wurden neue Ansätze zur Extraktion von Inhalten aus HTML-Seiten entwickelt, welche auf der Differenz-Analyse zweier Sicherungspunkte einer HTML-Seite basieren. Das Buch richtet sich in erster Linie an Leser im akademischen Umfeld, die sich mit neuen Verfahren zur Verarbeitung von HTML-kodierten Inhalten auseinander setzen möchten, aber auch an Software-Entwickler, in deren Umfeld die automatischen Archivierung und Analyse von Webseiten eine entscheidende Rolle spielt. Es basiert auf einer 2004 entstandenen Diplomarbeit am Lehrstuhl für Kommunikationssysteme und Rechnernetze der Friedrich-Alexander-Universität in Erlangen.

Jörg Peschke, Dipl.Inf.: Studium der Informatik an der FAU Erlangen-Nürnberg. Seit 2004 Leiter für den Bereich Software Entwicklung bei der Firma etone Intermedia GmbH, Nürnberg.

Verwandte Artikel

Download

PDF

Automatische HTML-Inhaltsanalyse in Webseiten Jörg Peschke

49,00 €*