Cet ouvrage s’adresse à tous ceux qui cherchent à tirer parti de l’énorme potentiel des « technologies Big Data », qu’ils soient data scientists, DSI, chefs de projets ou spécialistes métier.
Le Big Data s’est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l’exploitation de leurs données clients, fournisseurs, produits, processus, machines, etc.
Mais quelle solution technique choisir ? Quelles compétences métier développer au sein de la DSI ?
Ce livre est un guide pour comprendre les enjeux d’un projet Big Data, en appréhender les concepts sous-jacents (en particulier le Machine Learning) et acquérir les compétences nécessaires à la mise en place d’un data lab.
Il combine la présentation :
• de notions théoriques (traitement statistique des données, calcul distribué...) ;
• des outils les plus répandus (écosystème Hadoop, Storm...) ;
• d’exemples d’applications ;
• d’une organisation typique d’un projet de data science.
Les ajouts de cette troisième édition concernent principalement la vision d’architecture d’entreprise, nécessaire pour intégrer les innovations du Big Data au sein des organisations, et le Deep Learning pour le NLP (Natural Language Processing, qui est l’un des domaines de l’intelligence artificielle qui a le plus progressé récemment).
Le Big Data s’est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l’exploitation de leurs données clients, fournisseurs, produits, processus, machines, etc.
Mais quelle solution technique choisir ? Quelles compétences métier développer au sein de la DSI ?
Ce livre est un guide pour comprendre les enjeux d’un projet Big Data, en appréhender les concepts sous-jacents (en particulier le Machine Learning) et acquérir les compétences nécessaires à la mise en place d’un data lab.
Il combine la présentation :
• de notions théoriques (traitement statistique des données, calcul distribué...) ;
• des outils les plus répandus (écosystème Hadoop, Storm...) ;
• d’exemples d’applications ;
• d’une organisation typique d’un projet de data science.
Les ajouts de cette troisième édition concernent principalement la vision d’architecture d’entreprise, nécessaire pour intégrer les innovations du Big Data au sein des organisations, et le Deep Learning pour le NLP (Natural Language Processing, qui est l’un des domaines de l’intelligence artificielle qui a le plus progressé récemment).