Catégories
Ajouter le résultat dans votre panier Affiner la recherche Interroger des sources externes
Big, fast & opendata : décrire, décrypter et prédire le monde, l'avènement des données / Yannick Lejeune
Titre : Big, fast & opendata : décrire, décrypter et prédire le monde, l'avènement des données Type de document : texte imprimé Auteurs : Yannick Lejeune, Auteur Editeur : Limoges [France] : Fyp Année de publication : impr. 2014 Collection : Innovation Importance : 1 vol. (191 p.) Format : 21 cm ISBN/ISSN/EAN : 978-2-36405-121-8 Langues : Français (fre) Catégories : Bases de données ** Gestion
Données massivesIndex. décimale : 004C Informatique documentaire - Recherche de l'information Résumé :
"Le monde qui nous entoure est connecté et de cette connexion omniprésente naissent les données. Les data deviennent un acteur majeur pour la compréhension, l’anticipation et la résolution des grands problèmes économiques, politiques, sociaux, juridiques et scientifiques. Les données transforment également nos méthodes de travail, notre environnement culturel, la façon dont nous vivons au quotidien, allant même jusqu’à restructurer notre manière de penser.
Et à peine le big data occupe-t-il le devant de la scène technologique, que déjà surgit le phénomène fast data. Car au-delà du volume de données, ce qui devient décisif c’est la capacité de traiter à grande vitesse les données dans toute leur variété, de les transformer en connaissances en fournissant très rapidement la bonne information à la bonne personne au bon moment, voire de les utiliser pour prédire l’avenir. (...)
Cet ouvrage décrypte le nouvel écosystème de la data, la mutation des métiers actuels et ceux qui émergent. En cela, il prépare le lecteur à analyser, prédire et agir de manière adéquate dans tous les domaines transformés en profondeur par l’avènement des données : sécurité, marketing, santé, médecine préventive, transports, communication, logistique, jeu vidéo, enseignement, urbanisme, recherche scientifique, agriculture, environnement, etc." (4è de couv.)
Note de contenu :
PREFACE
INTRODUCTION
CHAPITRE 1 - L'HUMAIN ET SES DONNEES, LE "QUANTIFIED SELF"
1.1 La révolution des données
1.2. L'homme en data
1.3. Le soi quantifié
1.4. Les données pour améliorer la performance et plus encore
CHAPITRE 2 - L'INFORMATIQUE DES DONNEES ET LES MONDES NUMERIQUES
2.1. Enseigner les data
2.2. Traiter les données: quels outils et quelles solutions?
2.3. Le jeu vidéo et le digital entertainment
CHAPITRE 3 - SOCIETE ET GOUVERNANCE: LE CITOYEN ET LA CITE
3.1. Ouverture des connées et e-gouvernance
3.2. Cybersécurité et intelligence économique
3.3. La ville intelligente
3.4. Le cadre législatif et juridique
CHAPITRE 4 - LES ENTREPRISES ET LE BUSINESS DES DONNEES
4.1. L'écosystème digital
4.2. Valorisation et commercialisation des données
4.3. La marketing
4.4. Stratégie de l'entreprise et relation client
CHAPITRE 5 - LA SCIENCE A L'ERE DES MEFADONNEES
5.1. La recherche scientifique fondamentale
5.2. L'"open scienceé ou la "science ouverte"
CONCLUSION
Permalink : http://catalogue.iessid.be/index.php?lvl=notice_display&id=20708 Big, fast & opendata : décrire, décrypter et prédire le monde, l'avènement des données [texte imprimé] / Yannick Lejeune, Auteur . - Limoges (France) : Fyp, impr. 2014 . - 1 vol. (191 p.) ; 21 cm. - (Innovation) .
ISBN : 978-2-36405-121-8
Langues : Français (fre)
Catégories : Bases de données ** Gestion
Données massivesIndex. décimale : 004C Informatique documentaire - Recherche de l'information Résumé :
"Le monde qui nous entoure est connecté et de cette connexion omniprésente naissent les données. Les data deviennent un acteur majeur pour la compréhension, l’anticipation et la résolution des grands problèmes économiques, politiques, sociaux, juridiques et scientifiques. Les données transforment également nos méthodes de travail, notre environnement culturel, la façon dont nous vivons au quotidien, allant même jusqu’à restructurer notre manière de penser.
Et à peine le big data occupe-t-il le devant de la scène technologique, que déjà surgit le phénomène fast data. Car au-delà du volume de données, ce qui devient décisif c’est la capacité de traiter à grande vitesse les données dans toute leur variété, de les transformer en connaissances en fournissant très rapidement la bonne information à la bonne personne au bon moment, voire de les utiliser pour prédire l’avenir. (...)
Cet ouvrage décrypte le nouvel écosystème de la data, la mutation des métiers actuels et ceux qui émergent. En cela, il prépare le lecteur à analyser, prédire et agir de manière adéquate dans tous les domaines transformés en profondeur par l’avènement des données : sécurité, marketing, santé, médecine préventive, transports, communication, logistique, jeu vidéo, enseignement, urbanisme, recherche scientifique, agriculture, environnement, etc." (4è de couv.)
Note de contenu :
PREFACE
INTRODUCTION
CHAPITRE 1 - L'HUMAIN ET SES DONNEES, LE "QUANTIFIED SELF"
1.1 La révolution des données
1.2. L'homme en data
1.3. Le soi quantifié
1.4. Les données pour améliorer la performance et plus encore
CHAPITRE 2 - L'INFORMATIQUE DES DONNEES ET LES MONDES NUMERIQUES
2.1. Enseigner les data
2.2. Traiter les données: quels outils et quelles solutions?
2.3. Le jeu vidéo et le digital entertainment
CHAPITRE 3 - SOCIETE ET GOUVERNANCE: LE CITOYEN ET LA CITE
3.1. Ouverture des connées et e-gouvernance
3.2. Cybersécurité et intelligence économique
3.3. La ville intelligente
3.4. Le cadre législatif et juridique
CHAPITRE 4 - LES ENTREPRISES ET LE BUSINESS DES DONNEES
4.1. L'écosystème digital
4.2. Valorisation et commercialisation des données
4.3. La marketing
4.4. Stratégie de l'entreprise et relation client
CHAPITRE 5 - LA SCIENCE A L'ERE DES MEFADONNEES
5.1. La recherche scientifique fondamentale
5.2. L'"open scienceé ou la "science ouverte"
CONCLUSION
Permalink : http://catalogue.iessid.be/index.php?lvl=notice_display&id=20708 Réservation
Réserver ce document
Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité 0263875 004C LEJ B Livre Bibliothèque IESSID Livres Disponible MDM : enjeux et méthodes de la gestion des données / Franck Régnier-Pécastaing
Titre : MDM : enjeux et méthodes de la gestion des données Type de document : texte imprimé Auteurs : Franck Régnier-Pécastaing, Auteur ; Michel Gabassi, Auteur ; Jacques Finet, Auteur Editeur : Paris [France] : Dunod Année de publication : impr. 2011 Collection : Management des systèmes d'information Importance : 1 vol. (XVII-285 p.) Format : 25 cm ISBN/ISSN/EAN : 978-2-10-051910-1 Note générale : Bibliogr. p. [281]. Glossaire. Index Langues : Français (fre) Catégories : Bases de données ** Gestion
Systèmes d'information ** GestionIndex. décimale : 004C Informatique documentaire - Recherche de l'information Résumé :
"Cet ouvrage s'adresse à tous les responsables, tant côté maîtrise d'ouvrage que maîtrise d'œuvre, et à tous les dirigeants, urbanistes, chefs de projet...qui cherchent à améliorer la valeur de l'information détenue et utilisée par l'entreprise …" (4e de couv.)
Note de contenu :
AVANT-PROPOS
INTRODUCTION
-------------------------------------------
PREMIERE PARTIE - COMPRENDRE: LES CONCEPTS
-------------------------------------------
CHAPITRE 1 - La gestion des données de référence
1.1 Principes et notions élémentaires
- Caractéristiques des données de référence
- Typologie des données de référence
- La notion de famille de données
- Positionnement par rapport à d'autres notions
- Gestion des données de référence (GDR)
- Enjeux et besoins
- Résumé des enjeux et besoins, importance de la GDR
1.2 Exemples d'entreprises
- Un grand distributeur
- Un producteur
- Un fournisseur
1.3 Pourquoi mettre en œuvre une gestion des données de référence?
CHAPITRE 2 - La donnée et ses dimensions de valeurs
2.1 Données et valeur
2.2 Qualité des données
- Principaux concepts
- Les critères de la qualité des données
- Quels objectifs de qualité des données
- Amélioration de la qualité des données
2.3 Principales causes d'incohérence ou de non-qualité
2.4 Exemples de non-qualité ou d'incohérence
- Doublons
- Données incomplètes
- Données trop longues à générer
- Données incohérentes
- Autres exemples de problèmes fréquemment des données
CHAPITRE 3 - Données et processus
3.1 Processus
3.2 Processus métier et processus référentiels
3.3 Cycle de vie métier
3.4 Cycle de vie technique
3.5 Urbanisme, urbanisation et données
3.6 Urbanisme et données pratique
--------------------------------------------------------------
DEUXIEME PARTIE - METTRE EN OEUVRE: TECHNOLOGIES ET SOLUTIONS
--------------------------------------------------------------
CHAPITRE 4 - Typologies d'architectures
4.1 Fondement des architectures
4.2 Architecture et chaîne d'information
4.3 Les quatre types d'architecture pour la gestion de données de référence
4.4 Architecture de consolidation
4.5 Architecture de coopération
4.6 Architecture de centralisation
4.7 Architecture de répertoire virtuel
4.8 Tableau de synthèse entre architecture et cas d'utilisation
4.9 Conséquences pour les métiers
4.10 Synthèse des critères de choix d'une architecture
4.11 Couverture du référentiel
4.12 Les modes d'implémentation des référentiels
4.13 Chaînes référentiels
CHAPITRE 5 - Outillage d'une solution référentielle
5.1 Typologie des solutions
5.2 MDM (Master Data Management)
5.3 DQM (Data Quality Management)
- Zoom sur l'évaluation des sources de données
- Zoom sur la qualité et la migration des données
- Zoom sur l'amélioration de la qualité des données
- Positionnement DQM versus MDM
- Pourquoi de DQM ne peut-il pas remplacer le MDM?
5.4 EII (Entreprise Information Integration)
- Positionnement EII versus MDM
- Pourquoi un outil EII ne peut-il servir de référentiel?
5.5 Annuaires
- Positionnement annuaire versus MDM
- Pourquoi un annuaire ne peut-il pas servir de référentiel?
5.6 CRM (Customer Relationship Management)
- Positionnement CRM versus MDM
- Les limites d'un système CRM
5.7 PLM (Product Lifecycle Management)
- Positionnement PLM et MDM
- Les fonctions du PLM
5.8 Synthèse
5.9 Complément d'information sur l'EIM
CHAPITRE 6 - Architecture fonctionnelle du MDM
6.1 Fonctionnalités d'une solution de gestion de données de référence
- Acquisition de la donnée et processus
- Validation et qualité
- Fonctions de pilotage
- Modèles de données et métadonnées
- Fonctions de stockage et journalisation
- Fonction d'accès et de diffusion des données
- Administration et maintenance
6.2 Les catégories de solutions MDM
6.3 Socle référentiel
CHAPITRE 7 -Positionner le référentiel dans leSI
7.1 Briques applicatives
7.2 Projets classiques et leurs applications
- Amélioration de la performance des processus
- Interfaçage du SI avec les tiers (communication B2B)
- Reporting et analyse
7.3 Importance des échanges de données
- Point à point
- EAI (Entreprise Application Integration)
- ETL (Extraction Transformation Loading)
- Services et SOA
- MDM et échanges, apports et nécessités
7.4 Pour une insertion progressive du MDM dans les échanges du SI
CHAPITRE 8 - Guide de choix des architectures et solutions
8.1 Choix d'architecture
8.2 Choix de solutions
8.3 Mode d'implémentation et éligibilité des solutions MDM
8.4 Solutions mises en place par quelques entreprises
- Un grand distributeur
- Un producteur
- Un fournisseur
- Conclusion
8.5 Bonnes pratiques
- Métier et urbanisme
- Architecture
-----------------------------------------------------
TROISIEME PARTIE - PILOTER: METHODES ET ORGANISATION
-----------------------------------------------------
CHAPITRE 9 - Gouvernance des données de référence
9.1 Définition de la gouvernance des données
9.2 Modèle de déploiement de la gouvernance
9.3 Exemple de cadre synthétique de gouvernance
- Structure du cadre (objectifs et contraintes)
- Les leviers du cadre
9.4 Organisation
- Organisation de la gouvernance au niveau entreprise
- Rôles et acteurs
- Mise en œuvre des rôles en pratique
9.5 Règles et procédures
9.6 Outils de gouvernance
- Les outils de pilotage de la gouvernance
- Les outils technologiques relatifs à la gouvernance
- Les priorités dans la mise en œuvre
9.7 Exemples de mise en place de la gouvernance dans les entreprises
- Un grand distributeur
- Un producteur
CHAPITRE 10 - Etapes de déploiement d'un projet de gestion des données de référence
10.1 Principes généraux
10.2 Tâches spécifiques à la gestion des données
- Identifier et décrire les données de référence
- Identifier et décrire les processus référentiels
- Spécifier les méthodes et règles de gouvernance
- Définir les principes de migration des données, analyser et assainir les données existantes
- Définit mes règles de qualité
- Définir les contrats d'échange, de services
10. 3 Eléments de méthode
10.4 Charges de mis en œuvre
10.5 Charges de mise en œuvre
- Méthodes
- Organisation
CHAPITRE 11 - Points clés a retenir
11.1 Règles de base
11.2 Bonnes pratiques essentielles
11.3 Vision prospective et progressive
CONCLUSION
--------
ANNEXES
--------
Annexe A - Modélisation des données
A.1 Outils pour créer un modèle de données
A.2 Modélisation Merise
- Modèle conceptuel de données (MCD)
- Modèle logique de données (MLD)
- Modèle physique de données (MPD)
A.3 UML
- Notions UML
- Correspondance Merise UML
- Modélisation XML
A.4 La modélisation des flux de données
- Problématique
- Les besoins
- Rappels sur l'urbanisme
- Une méthodologie et des outils communs
ANNEX B - SOA, services et données
B.1 D2finition
B.2 Objectifs et enjeux de la SOA
B.3 Services
- Définition d'un service
- Accès aux services
- Services et services Web
B.4 SOA en pratique
B.5 SOA et intégrations de données
GLOSSAIRE
BIBLIOGRAPHIE
INDEX
Permalink : http://catalogue.iessid.be/index.php?lvl=notice_display&id=19308 MDM : enjeux et méthodes de la gestion des données [texte imprimé] / Franck Régnier-Pécastaing, Auteur ; Michel Gabassi, Auteur ; Jacques Finet, Auteur . - Paris (Rue Laromiguière, 5, 75005, France) : Dunod, impr. 2011 . - 1 vol. (XVII-285 p.) ; 25 cm. - (Management des systèmes d'information) .
ISBN : 978-2-10-051910-1
Bibliogr. p. [281]. Glossaire. Index
Langues : Français (fre)
Catégories : Bases de données ** Gestion
Systèmes d'information ** GestionIndex. décimale : 004C Informatique documentaire - Recherche de l'information Résumé :
"Cet ouvrage s'adresse à tous les responsables, tant côté maîtrise d'ouvrage que maîtrise d'œuvre, et à tous les dirigeants, urbanistes, chefs de projet...qui cherchent à améliorer la valeur de l'information détenue et utilisée par l'entreprise …" (4e de couv.)
Note de contenu :
AVANT-PROPOS
INTRODUCTION
-------------------------------------------
PREMIERE PARTIE - COMPRENDRE: LES CONCEPTS
-------------------------------------------
CHAPITRE 1 - La gestion des données de référence
1.1 Principes et notions élémentaires
- Caractéristiques des données de référence
- Typologie des données de référence
- La notion de famille de données
- Positionnement par rapport à d'autres notions
- Gestion des données de référence (GDR)
- Enjeux et besoins
- Résumé des enjeux et besoins, importance de la GDR
1.2 Exemples d'entreprises
- Un grand distributeur
- Un producteur
- Un fournisseur
1.3 Pourquoi mettre en œuvre une gestion des données de référence?
CHAPITRE 2 - La donnée et ses dimensions de valeurs
2.1 Données et valeur
2.2 Qualité des données
- Principaux concepts
- Les critères de la qualité des données
- Quels objectifs de qualité des données
- Amélioration de la qualité des données
2.3 Principales causes d'incohérence ou de non-qualité
2.4 Exemples de non-qualité ou d'incohérence
- Doublons
- Données incomplètes
- Données trop longues à générer
- Données incohérentes
- Autres exemples de problèmes fréquemment des données
CHAPITRE 3 - Données et processus
3.1 Processus
3.2 Processus métier et processus référentiels
3.3 Cycle de vie métier
3.4 Cycle de vie technique
3.5 Urbanisme, urbanisation et données
3.6 Urbanisme et données pratique
--------------------------------------------------------------
DEUXIEME PARTIE - METTRE EN OEUVRE: TECHNOLOGIES ET SOLUTIONS
--------------------------------------------------------------
CHAPITRE 4 - Typologies d'architectures
4.1 Fondement des architectures
4.2 Architecture et chaîne d'information
4.3 Les quatre types d'architecture pour la gestion de données de référence
4.4 Architecture de consolidation
4.5 Architecture de coopération
4.6 Architecture de centralisation
4.7 Architecture de répertoire virtuel
4.8 Tableau de synthèse entre architecture et cas d'utilisation
4.9 Conséquences pour les métiers
4.10 Synthèse des critères de choix d'une architecture
4.11 Couverture du référentiel
4.12 Les modes d'implémentation des référentiels
4.13 Chaînes référentiels
CHAPITRE 5 - Outillage d'une solution référentielle
5.1 Typologie des solutions
5.2 MDM (Master Data Management)
5.3 DQM (Data Quality Management)
- Zoom sur l'évaluation des sources de données
- Zoom sur la qualité et la migration des données
- Zoom sur l'amélioration de la qualité des données
- Positionnement DQM versus MDM
- Pourquoi de DQM ne peut-il pas remplacer le MDM?
5.4 EII (Entreprise Information Integration)
- Positionnement EII versus MDM
- Pourquoi un outil EII ne peut-il servir de référentiel?
5.5 Annuaires
- Positionnement annuaire versus MDM
- Pourquoi un annuaire ne peut-il pas servir de référentiel?
5.6 CRM (Customer Relationship Management)
- Positionnement CRM versus MDM
- Les limites d'un système CRM
5.7 PLM (Product Lifecycle Management)
- Positionnement PLM et MDM
- Les fonctions du PLM
5.8 Synthèse
5.9 Complément d'information sur l'EIM
CHAPITRE 6 - Architecture fonctionnelle du MDM
6.1 Fonctionnalités d'une solution de gestion de données de référence
- Acquisition de la donnée et processus
- Validation et qualité
- Fonctions de pilotage
- Modèles de données et métadonnées
- Fonctions de stockage et journalisation
- Fonction d'accès et de diffusion des données
- Administration et maintenance
6.2 Les catégories de solutions MDM
6.3 Socle référentiel
CHAPITRE 7 -Positionner le référentiel dans leSI
7.1 Briques applicatives
7.2 Projets classiques et leurs applications
- Amélioration de la performance des processus
- Interfaçage du SI avec les tiers (communication B2B)
- Reporting et analyse
7.3 Importance des échanges de données
- Point à point
- EAI (Entreprise Application Integration)
- ETL (Extraction Transformation Loading)
- Services et SOA
- MDM et échanges, apports et nécessités
7.4 Pour une insertion progressive du MDM dans les échanges du SI
CHAPITRE 8 - Guide de choix des architectures et solutions
8.1 Choix d'architecture
8.2 Choix de solutions
8.3 Mode d'implémentation et éligibilité des solutions MDM
8.4 Solutions mises en place par quelques entreprises
- Un grand distributeur
- Un producteur
- Un fournisseur
- Conclusion
8.5 Bonnes pratiques
- Métier et urbanisme
- Architecture
-----------------------------------------------------
TROISIEME PARTIE - PILOTER: METHODES ET ORGANISATION
-----------------------------------------------------
CHAPITRE 9 - Gouvernance des données de référence
9.1 Définition de la gouvernance des données
9.2 Modèle de déploiement de la gouvernance
9.3 Exemple de cadre synthétique de gouvernance
- Structure du cadre (objectifs et contraintes)
- Les leviers du cadre
9.4 Organisation
- Organisation de la gouvernance au niveau entreprise
- Rôles et acteurs
- Mise en œuvre des rôles en pratique
9.5 Règles et procédures
9.6 Outils de gouvernance
- Les outils de pilotage de la gouvernance
- Les outils technologiques relatifs à la gouvernance
- Les priorités dans la mise en œuvre
9.7 Exemples de mise en place de la gouvernance dans les entreprises
- Un grand distributeur
- Un producteur
CHAPITRE 10 - Etapes de déploiement d'un projet de gestion des données de référence
10.1 Principes généraux
10.2 Tâches spécifiques à la gestion des données
- Identifier et décrire les données de référence
- Identifier et décrire les processus référentiels
- Spécifier les méthodes et règles de gouvernance
- Définir les principes de migration des données, analyser et assainir les données existantes
- Définit mes règles de qualité
- Définir les contrats d'échange, de services
10. 3 Eléments de méthode
10.4 Charges de mis en œuvre
10.5 Charges de mise en œuvre
- Méthodes
- Organisation
CHAPITRE 11 - Points clés a retenir
11.1 Règles de base
11.2 Bonnes pratiques essentielles
11.3 Vision prospective et progressive
CONCLUSION
--------
ANNEXES
--------
Annexe A - Modélisation des données
A.1 Outils pour créer un modèle de données
A.2 Modélisation Merise
- Modèle conceptuel de données (MCD)
- Modèle logique de données (MLD)
- Modèle physique de données (MPD)
A.3 UML
- Notions UML
- Correspondance Merise UML
- Modélisation XML
A.4 La modélisation des flux de données
- Problématique
- Les besoins
- Rappels sur l'urbanisme
- Une méthodologie et des outils communs
ANNEX B - SOA, services et données
B.1 D2finition
B.2 Objectifs et enjeux de la SOA
B.3 Services
- Définition d'un service
- Accès aux services
- Services et services Web
B.4 SOA en pratique
B.5 SOA et intégrations de données
GLOSSAIRE
BIBLIOGRAPHIE
INDEX
Permalink : http://catalogue.iessid.be/index.php?lvl=notice_display&id=19308 Réservation
Réserver ce document
Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité 0244642 004C REG M Livre Bibliothèque IESSID Livres Disponible Using OpenRefine : The essential OpenRefine guide that takes you from data analysis and error fixing to linking your dataset to the Web / Ruben Verborgh
Titre : Using OpenRefine : The essential OpenRefine guide that takes you from data analysis and error fixing to linking your dataset to the Web Type de document : texte imprimé Auteurs : Ruben Verborgh, Auteur ; Max De Wilde, Auteur Editeur : Birmingham [Royaume-Uni] : Packt Publishing Limited Année de publication : cop. 2013 Importance : 1 vol. (95 p.) Présentation : ill. Format : 24 cm ISBN/ISSN/EAN : 978-1-78328-908-0 Note générale : Index Langues : Français (fre) Catégories : Bases de données ** Gestion
Bases de données sur le WebIndex. décimale : 004C Informatique documentaire - Recherche de l'information Résumé :
"Data is supposed to be the new gold, but how can you unlock the value in your data? Managing large datasets used to be a task for specialists, but you don't have to worry about inconsistencies or errors anymore. OpenRefine lets you clean, link, and publish your dataset in a breeze.
Using OpenRefine takes you on a practical tour of all the handy features of this well-known data transformation tool. It is a hands-on recipe book that teaches you data techniques by example. Starting from the basics, it gradually transforms you into an OpenRefine expert.
This book will teach you all the necessary skills to handle any large dataset and to turn it into high-quality data for the Web. After you learn how to analyze data and spot issues, we'll see how we can solve them to obtain a clean dataset. Messy and inconsistent data is recovered through advanced techniques such as automated clustering. We'll then show extract links from keyword and full-text fields using reconciliation and named-entity extraction.
Using OpenRefine is more than a manual: it's a guide stuffed with tips and tricks to get the best out of your data."(site d'éditeur)
Note de contenu :
CHAPTER 1. Diving Into OpenRefine
Introducing OpenRefine
Installing OpenRefine
Creating a new project
Exploring your data
Manipulating columns
Using the project history
Exporting a project
Going for more memory
Summary
CHAPTER 2. Analyzing and Fixing Data
Sorting data
Faceting data
Detecting duplicates
Applying a text filter
Using simple cell transformations
Removing matching rows
Summary
CHAPTER 3. Advanced Data Operations
Handling multi-valued cells
Alternating between rows and records mode
Clustering similar cells
Transforming cell values
Adding derived columns
Splitting data across columns
Transposing rows and columns
Summary
CHAPTER 4. Linking Datasets
Reconciling values with Freebase
Installing extensions
Adding a reconciliation service
Reconciling with Linked Data
Extracting named entities
Permalink : http://catalogue.iessid.be/index.php?lvl=notice_display&id=20784 Using OpenRefine : The essential OpenRefine guide that takes you from data analysis and error fixing to linking your dataset to the Web [texte imprimé] / Ruben Verborgh, Auteur ; Max De Wilde, Auteur . - Birmingham (Livery Place, 35 Livery Street, B3 2PB, Royaume-Uni) : Packt Publishing Limited, cop. 2013 . - 1 vol. (95 p.) : ill. ; 24 cm.
ISBN : 978-1-78328-908-0
Index
Langues : Français (fre)
Catégories : Bases de données ** Gestion
Bases de données sur le WebIndex. décimale : 004C Informatique documentaire - Recherche de l'information Résumé :
"Data is supposed to be the new gold, but how can you unlock the value in your data? Managing large datasets used to be a task for specialists, but you don't have to worry about inconsistencies or errors anymore. OpenRefine lets you clean, link, and publish your dataset in a breeze.
Using OpenRefine takes you on a practical tour of all the handy features of this well-known data transformation tool. It is a hands-on recipe book that teaches you data techniques by example. Starting from the basics, it gradually transforms you into an OpenRefine expert.
This book will teach you all the necessary skills to handle any large dataset and to turn it into high-quality data for the Web. After you learn how to analyze data and spot issues, we'll see how we can solve them to obtain a clean dataset. Messy and inconsistent data is recovered through advanced techniques such as automated clustering. We'll then show extract links from keyword and full-text fields using reconciliation and named-entity extraction.
Using OpenRefine is more than a manual: it's a guide stuffed with tips and tricks to get the best out of your data."(site d'éditeur)
Note de contenu :
CHAPTER 1. Diving Into OpenRefine
Introducing OpenRefine
Installing OpenRefine
Creating a new project
Exploring your data
Manipulating columns
Using the project history
Exporting a project
Going for more memory
Summary
CHAPTER 2. Analyzing and Fixing Data
Sorting data
Faceting data
Detecting duplicates
Applying a text filter
Using simple cell transformations
Removing matching rows
Summary
CHAPTER 3. Advanced Data Operations
Handling multi-valued cells
Alternating between rows and records mode
Clustering similar cells
Transforming cell values
Adding derived columns
Splitting data across columns
Transposing rows and columns
Summary
CHAPTER 4. Linking Datasets
Reconciling values with Freebase
Installing extensions
Adding a reconciliation service
Reconciling with Linked Data
Extracting named entities
Permalink : http://catalogue.iessid.be/index.php?lvl=notice_display&id=20784 Réservation
Réserver ce document
Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité 0291982 004C VER U Livre Bibliothèque IESSID Livres Disponible