Détail de l'auteur
Auteur Stephen Robertson |
Documents disponibles écrits par cet auteur
Ajouter le résultat dans votre panier Affiner la recherche Interroger des sources externes
Recherche d'information : applications, modèles et algorithmes / Massih-Reza Amini
Titre : Recherche d'information : applications, modèles et algorithmes Type de document : texte imprimé Auteurs : Massih-Reza Amini, Auteur ; Éric Gaussier, Auteur ; Stephen Robertson, Postfacier, auteur du colophon, etc. ; Grégoire Péan, Collaborateur Editeur : Paris [France] : Editions Eyrolles Année de publication : 2013 Collection : Algorithmes, ISSN 1625-113X Importance : 1 vol. (233 p.) Présentation : ill. Format : 24 cm ISBN/ISSN/EAN : 978-2-212-13532-9 Prix : 39 € Note générale : La couverture porte en plus : "Fouille de données, décisionnel et big data" Langues : Français (fre) Catégories : Algorithmes
Bases de données
Données massives
Informatique
Recherche documentaire
Recherche documentaire automatisée
Recherche sur Internet
WebIndex. décimale : 004C Informatique documentaire - Recherche de l'information Résumé :
"Le premier ouvrage francophone sur les algorithmes qui sous-tendent les technologies de big data et les moteurs de recherche !
Depuis quelques années, de nouveaux modèles et algorithmes sont mis au point pour traiter des données de plus en plus volumineuses et diverses. Cet ouvrage présente les fondements scientifiques des tâches les plus répandues en recherche d'information (RI), tâches également liées au data mining, au décisionnel et plus généralement à l'exploitation de big data.
Il propose un exposé cohérent des algorithmes classiques développés dans ce domaine, abordable à des lecteurs qui cherchent à connaître le mécanisme des outils quotidiens d'Internet.
Le lecteur approfondira les concepts d'indexation, de compression, de recherche sur le Web, de classification et de catégorisation, et pourra prolonger cette étude avec les exercices corrigés proposés en fin de chapitre.
Ce livre s'adresse tant aux chercheurs et ingénieurs qui travaillent dans le domaine de l'accès à l'information et employés de PME qui utilisent en profondeur les outils du webmarketing, qu'aux étudiants de Licence, Master, doctorants ou en écoles d'ingénieurs, qui souhaitent un ouvrage de référence sur la recherche d'information." (4e de couverture)
Note de contenu :
PREFACE
LISTE DES ALGORITHMES
NOTATIONS
LISTE DES FIGURES
1. INTRODUCTION
1.1. Concepts étudiés dans ce livre
1.2. Organisation du livre
2. REPRESENTATION ET INDEXATION
2.1. Prétraitements linguistiques
--- 2.1.1. Segmentation
--- 2.1.2. Normalisation
--- 2.1.3. Filtrage par antidictionnaire
2.2. Les deux lois de base en recherche d'information
--- 2.2.1. Loi de Heaps
--- 2.2.2. Loi de Zipf
2.3. Représentation documentaire
--- 2.3.1. Modèle vectoriel
--- 2.3.2. Pondération des termes
2.4. Index inversé
--- 2.4.1. Indexation dans les collections statiques
--- 2.4.2. Indexation dans les collections dynamiques
3. RECHERCHE D'INFORMATION
3.1. Modèles de recherche
--- 3.1.1. Modèles booléens
--- 3.1.2. Modèles vectoriels
--- 3.1.3. Modèles probabilistes
--- 3.1.4. Une approches axiomatique de la RI
3.2. Expansion de requêtes
--- 3.2.1. La méthode "boucle de rétro
pertinence"
--- 3.2.2. La méthode "boucle de rétropertinence en aveugle"
3.3. Mesures d'évaluation
--- 3.3.1. Evaluation de résultats non ordonnées
--- 3.3.2. Evaluation de résultats ordonnées
3.4. Exercices
4. RECHERCHE SUR LE WEB
4.1. Architecture de la Toile
4.2. Trois inventions à la base du Web
--- 4.2.1. Langage HTML
--- 42.2. Protocole de transfert hypertexte et adresses Web
4.3. Collecte et indexation des pages sur la Toile
--- 4.3.1. Robot d'indexation
--- 4.3.2. Index distribué
4.4. Nouvelles stratégies de recherche
--- 4.4.1. Modèle d'apprentissage automatique pour la RI
--- 4.4.2. PageRank
4.5. Exercices
5. CATEGORISATION DE DOCUMENTS
5.1. Formalisme
5.2. Sélection de variables
--- 5.2.1. Le seuillage sur la mesure Document Frequancy (df)
--- 5.2.2. L'information mutuelle ponctuelle (IMP)
--- 5.2.3. L'information mutuelle (IM)
--- 5.2.4. La mesure X²
5.3. Modèles génératifs
--- 5.3.1. Modèle multivariés de Bernoulli
--- 5.3.2. Modèle multinomial
5.4. Modèles discriminants
--- 5.4.1. Modèle logistique
--- 5.4.2. Séparateur à vaste marge
5.5. Mesures d'évaluation
5.6. Exercices
6. PARTITIONNEMENT DE DOCUMENTS
6.1. Définitions
6.2. Les étapes du partitionnement
6.3. Principaux algorithmes de partitionnement
--- 6.3.1. Partitionnement à plat: méthodes de réallocation
--- 6.3.2. Partitionnement hiérarchique
6.4. Evaluation
6.5. Applications à l'accès à l'information
6.6. Exercices
7. RECHERCHE DE THEMES LATENTS
7.1. Analyse sémantique latente
--- 7.1.1. Décomposition en valeurs singulières
--- 7.1.2. L'analyse sémantique latente pour la RI
--- 7.3. Limitations
7.2. Analyse sémantique latente probabiliste
--- 7.2.1. Remarques
7.3. Le modèle LDA
7.4. Exercices
8. CONSIDERATIONS PRATIQUES
8.1. Logiciels libres pour la recherche d'information
--- 8.1.1. dpSearch
--- 8.1.2. Lucene/SolR
--- 8.1.3. MG
--- 8.1.4. Terrier
--- 8.1.5. Zettair
8.2. Logiciels libres pour la catégorisation et le partitionnement
8.3. Le passage à l'échelle ou le Big Date
--- 8.3.1. Traitement parallèle et distribué
--- 8.3.2. Traitement de flux de données
BIBLIOGRAPHIE
Permalink : http://catalogue.iessid.be/index.php?lvl=notice_display&id=20531 Recherche d'information : applications, modèles et algorithmes [texte imprimé] / Massih-Reza Amini, Auteur ; Éric Gaussier, Auteur ; Stephen Robertson, Postfacier, auteur du colophon, etc. ; Grégoire Péan, Collaborateur . - Paris (61, bd Saint-Germain, 75240, France) : Editions Eyrolles, 2013 . - 1 vol. (233 p.) : ill. ; 24 cm. - (Algorithmes, ISSN 1625-113X) .
ISBN : 978-2-212-13532-9 : 39 €
La couverture porte en plus : "Fouille de données, décisionnel et big data"
Langues : Français (fre)
Catégories : Algorithmes
Bases de données
Données massives
Informatique
Recherche documentaire
Recherche documentaire automatisée
Recherche sur Internet
WebIndex. décimale : 004C Informatique documentaire - Recherche de l'information Résumé :
"Le premier ouvrage francophone sur les algorithmes qui sous-tendent les technologies de big data et les moteurs de recherche !
Depuis quelques années, de nouveaux modèles et algorithmes sont mis au point pour traiter des données de plus en plus volumineuses et diverses. Cet ouvrage présente les fondements scientifiques des tâches les plus répandues en recherche d'information (RI), tâches également liées au data mining, au décisionnel et plus généralement à l'exploitation de big data.
Il propose un exposé cohérent des algorithmes classiques développés dans ce domaine, abordable à des lecteurs qui cherchent à connaître le mécanisme des outils quotidiens d'Internet.
Le lecteur approfondira les concepts d'indexation, de compression, de recherche sur le Web, de classification et de catégorisation, et pourra prolonger cette étude avec les exercices corrigés proposés en fin de chapitre.
Ce livre s'adresse tant aux chercheurs et ingénieurs qui travaillent dans le domaine de l'accès à l'information et employés de PME qui utilisent en profondeur les outils du webmarketing, qu'aux étudiants de Licence, Master, doctorants ou en écoles d'ingénieurs, qui souhaitent un ouvrage de référence sur la recherche d'information." (4e de couverture)
Note de contenu :
PREFACE
LISTE DES ALGORITHMES
NOTATIONS
LISTE DES FIGURES
1. INTRODUCTION
1.1. Concepts étudiés dans ce livre
1.2. Organisation du livre
2. REPRESENTATION ET INDEXATION
2.1. Prétraitements linguistiques
--- 2.1.1. Segmentation
--- 2.1.2. Normalisation
--- 2.1.3. Filtrage par antidictionnaire
2.2. Les deux lois de base en recherche d'information
--- 2.2.1. Loi de Heaps
--- 2.2.2. Loi de Zipf
2.3. Représentation documentaire
--- 2.3.1. Modèle vectoriel
--- 2.3.2. Pondération des termes
2.4. Index inversé
--- 2.4.1. Indexation dans les collections statiques
--- 2.4.2. Indexation dans les collections dynamiques
3. RECHERCHE D'INFORMATION
3.1. Modèles de recherche
--- 3.1.1. Modèles booléens
--- 3.1.2. Modèles vectoriels
--- 3.1.3. Modèles probabilistes
--- 3.1.4. Une approches axiomatique de la RI
3.2. Expansion de requêtes
--- 3.2.1. La méthode "boucle de rétro
pertinence"
--- 3.2.2. La méthode "boucle de rétropertinence en aveugle"
3.3. Mesures d'évaluation
--- 3.3.1. Evaluation de résultats non ordonnées
--- 3.3.2. Evaluation de résultats ordonnées
3.4. Exercices
4. RECHERCHE SUR LE WEB
4.1. Architecture de la Toile
4.2. Trois inventions à la base du Web
--- 4.2.1. Langage HTML
--- 42.2. Protocole de transfert hypertexte et adresses Web
4.3. Collecte et indexation des pages sur la Toile
--- 4.3.1. Robot d'indexation
--- 4.3.2. Index distribué
4.4. Nouvelles stratégies de recherche
--- 4.4.1. Modèle d'apprentissage automatique pour la RI
--- 4.4.2. PageRank
4.5. Exercices
5. CATEGORISATION DE DOCUMENTS
5.1. Formalisme
5.2. Sélection de variables
--- 5.2.1. Le seuillage sur la mesure Document Frequancy (df)
--- 5.2.2. L'information mutuelle ponctuelle (IMP)
--- 5.2.3. L'information mutuelle (IM)
--- 5.2.4. La mesure X²
5.3. Modèles génératifs
--- 5.3.1. Modèle multivariés de Bernoulli
--- 5.3.2. Modèle multinomial
5.4. Modèles discriminants
--- 5.4.1. Modèle logistique
--- 5.4.2. Séparateur à vaste marge
5.5. Mesures d'évaluation
5.6. Exercices
6. PARTITIONNEMENT DE DOCUMENTS
6.1. Définitions
6.2. Les étapes du partitionnement
6.3. Principaux algorithmes de partitionnement
--- 6.3.1. Partitionnement à plat: méthodes de réallocation
--- 6.3.2. Partitionnement hiérarchique
6.4. Evaluation
6.5. Applications à l'accès à l'information
6.6. Exercices
7. RECHERCHE DE THEMES LATENTS
7.1. Analyse sémantique latente
--- 7.1.1. Décomposition en valeurs singulières
--- 7.1.2. L'analyse sémantique latente pour la RI
--- 7.3. Limitations
7.2. Analyse sémantique latente probabiliste
--- 7.2.1. Remarques
7.3. Le modèle LDA
7.4. Exercices
8. CONSIDERATIONS PRATIQUES
8.1. Logiciels libres pour la recherche d'information
--- 8.1.1. dpSearch
--- 8.1.2. Lucene/SolR
--- 8.1.3. MG
--- 8.1.4. Terrier
--- 8.1.5. Zettair
8.2. Logiciels libres pour la catégorisation et le partitionnement
8.3. Le passage à l'échelle ou le Big Date
--- 8.3.1. Traitement parallèle et distribué
--- 8.3.2. Traitement de flux de données
BIBLIOGRAPHIE
Permalink : http://catalogue.iessid.be/index.php?lvl=notice_display&id=20531 Réservation
Réserver ce document
Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité 0261893 004C AMI Livre Bibliothèque IESSID Nouveautés Disponible