Exploration de contenu Web à partir du Web caché
Autor: | Naeem, Muhammad Asif |
---|---|
EAN: | 9786203298017 |
Sachgruppe: | Wirtschaft |
Sprache: | Französisch |
Seitenzahl: | 92 |
Produktart: | Kartoniert / Broschiert |
Veröffentlichungsdatum: | 02.08.2021 |
Untertitel: | Une approche méthodique de l'exploration Web pour l'extraction automatisée d'informations à partir de pages Web dynamiques |
49,00 €*
Die Verfügbarkeit wird nach ihrer Bestellung bei uns geprüft.
Bücher sind in der Regel innerhalb von 1-2 Werktagen abholbereit.
Le World Wide Web est une énorme compilation de données à variantes multiples. Pour une meilleure gestion des connaissances, il est important de récupérer des données précises et complètes. Le Web caché, également connu sous le nom de Web invisible ou Web profond, a donné lieu à un nouveau problème de recherche sur le Web mining. La plupart des documents du Web caché, y compris les pages cachées derrière des formulaires de recherche, des bases de données spécialisées et des pages Web générées dynamiquement, ne sont pas accessibles par l'application d'exploration Web générale. Dans cet article, un système est conçu qui a une capacité robuste d'accéder à ces pages Web cachées en utilisant des techniques d'exploration de structure Web pour une meilleure gestion des connaissances. Comme la génération de contenu dynamique est utilisée dans les pages Web modernes et les formulaires utilisateur sont utilisés pour obtenir des informations d'un utilisateur particulier et stockés dans une base de données. La structure de liaison se trouvant sous ces formes n'est pas accessible pendant les procédures d'exploitation minière conventionnelles. Le taux de précision des structures hiérarchiques des pages Web peut être amélioré en incluant ces pages Web cachées dans le processus d'exploration de structures Web. Le système conçu est suffisamment solide pour traiter les pages Web dynamiques avec les pages statiques.