Exploration de contenu Web à partir du Web caché

Le World Wide Web est une énorme compilation de données à variantes multiples. Pour une meilleure gestion des connaissances, il est important de récupérer des données précises et complètes. Le Web caché, également connu sous le nom de Web invisible ou Web profond, a donné lieu à un nouveau problème de recherche sur le Web mining. La plupart des documents du Web caché, y compris les pages cachées derrière des formulaires de recherche, des bases de données spécialisées et des pages Web générées dynamiquement, ne sont pas accessibles par l'application d'exploration Web générale. Dans cet article, un système est conçu qui a une capacité robuste d'accéder à ces pages Web cachées en utilisant des techniques d'exploration de structure Web pour une meilleure gestion des connaissances. Comme la génération de contenu dynamique est utilisée dans les pages Web modernes et les formulaires utilisateur sont utilisés pour obtenir des informations d'un utilisateur particulier et stockés dans une base de données. La structure de liaison se trouvant sous ces formes n'est pas accessible pendant les procédures d'exploitation minière conventionnelles. Le taux de précision des structures hiérarchiques des pages Web peut être amélioré en incluant ces pages Web cachées dans le processus d'exploration de structures Web. Le système conçu est suffisamment solide pour traiter les pages Web dynamiques avec les pages statiques.

Weitere Produkte vom selben Autor

Estrazione di contenuti Web da Web nascosto Naeem, Muhammad Asif

49,00 €*
Mineração de conteúdo da web na web oculta Naeem, Muhammad Asif

49,00 €*
Web Content Mining van Hidden Web Naeem, Muhammad Asif

49,00 €*