Web Content Mining van Hidden Web

World Wide Web is een enorme compilatie van multi-variant data. Voor beter kennismanagement is het belangrijk om nauwkeurige en volledige gegevens op te halen. Het verborgen web, ook wel het onzichtbare web of deep web genoemd, heeft aanleiding gegeven tot een nieuwe kwestie van onderzoek naar webmining. De meeste documenten op het verborgen web, inclusief pagina's die verborgen zijn achter zoekformulieren, gespecialiseerde databases en dynamisch gegenereerde webpagina's, zijn niet toegankelijk voor algemene webminingtoepassingen. In dit artikel wordt een systeem ontworpen dat een robuust vermogen heeft om toegang te krijgen tot deze verborgen webpagina's met behulp van webstructuur-miningtechnieken voor beter kennisbeheer. Aangezien het genereren van dynamische inhoud wordt gebruikt in moderne webpagina's, worden gebruikersformulieren gebruikt om informatie van een bepaalde gebruiker op te halen en in een database op te slaan. De verbindingsstructuur die in deze vormen ligt, is niet toegankelijk tijdens conventionele mijnbouwprocedures. De nauwkeurigheidsverhouding van hiërarchische structuren van webpagina's kan worden verbeterd door deze verborgen webpagina's op te nemen in het proces van webstructuur-mining. Het ontworpen systeem is voldoende sterk om zowel de dynamische als de statische webpagina's te verwerken.

Weitere Produkte vom selben Autor