• <Plus d'infos sur intel.fr
Masthead Light

Solutions d'analyses par graphe Intel®

Logiciels pour datacenters Intel®  |  Solutions d'analyse par graphe Intel®


Logiciel Intel® Graph Builder for Apache Hadoop* v2

Le logiciel Intel® Graph Builder for Apache Hadoop* v2 simplifie la création de modèles de données de graphes, ce qui permet aux spécialistes des données de se concentrer sur la résolution des problèmes d'activités, plutôt que sur le formatage des données. Des bibliothèques intégrées automatisent les flux de travail pour nettoyer et transformer les données, et créer des modèles de graphes avec traitement en parallèle et en haut débit grâce à Hadoop. Une fois créés, les modèles de graphes peuvent être exploités à l'aide d'une vaste gamme de bases de données de graphes, de moteurs d'analyse et d'outils de visualisation. En automatisant les flux de travail routiniers laborieux et en supprimant considérablement les difficultés des grappes d'ordinateurs pour élaborer des graphes à partir de big data, Graph Builder d'Intel aide les spécialistes des données à obtenir des informations plus rapidement, grâce à des outils d'analyses par graphes puissants.

Les bibliothèques Graph Builder d'Intel utilisent le célèbre environnement de création de procédure Apache Pig* pour simplifier le pipeline de préparation de données, depuis l'importation et le nettoyage des données en passant par la transformation des fonctions, jusqu'à l'élaboration de graphes. Les spécialistes des données utilisent habituellement les techniques de programmation MapReduce* pour traiter le big data. La programmation avec MapReduce* peut s'avérer compliquée pour les utilisateurs novices et longue pour les plus expérimentés. Avec Graph Builder d'Intel et l'environnement Pig, le processus s'avère plus simple que d'écrire une application Java* et créer des routines personnalisées. Ceci permet aux spécialistes des données d'exploiter plus aisément les données à l'échelle et de garantir qu'elles soient propres, correctement formatées et transformées dans les fonctions souhaitées avec toutes les connexions de graphe convenablement regroupées.

Graph Builder peut créer plusieurs types de graphes pour représenter une gamme de problèmes quotidiens, et notamment des graphes attribués, dans lesquels les sommets et les arêtes peuvent contenir des informations pertinentes supplémentaires. Le graphe final peut être utilisé par une vaste gamme d'outils d'analyse par graphes et de visualisation via le modèle Resource Description Format (RDF) largement pris en charge. Le logiciel Graph Builder d'Intel comprend également un connecteur qui met en parallèle le chargement du graphe de sortie dans la base de données de graphes open source Titan* d'Aurelius, ce qui accélère encore plus le pipeline de traitement du graphe à la dernière étape.

Évolutive, Titan peut fonctionner sur de multiples nœuds : le chargement en parallèle peut ainsi s'étendre à plusieurs nœuds de bases de données regroupées. Graph Builder d'Intel est un logiciel open source. Les utilisateurs peuvent donc élargir les possibilités de chargement massif dans les bases de données de graphe offertes.


Solutions élaborées avec le logiciel Intel® Graph Builder for Apache Hadoop v2

  Fonctionnalité

  Détails

  Composants Hadoop* 
  Obligatoire

  Basé sur Apache Hadoop 1.2.1 (MapReduce*, Pig*
  0.12.0, HBase 0.94.12)

  Programmation utilisateur
  Environnement

  Créations de procédure Apache Pig et/ou extensions UDF Java*
  dans Apache Pig

  Types d'analyse - format d'entrée

  Bibliothèques Pig pour XML, CSV, TSV, JSON
  (+ autre utilisateur défini)

  Type de graphes pris en charge

  Graphes orientés et non orientés ; graphe multirelationnels
  avec attributs de sommet et arête, et arêtes
  étiquetées

  Nettoyage des données

  Bibliothèques Pig pour :

  • Manipulation de chaînes
  • Vérifications de null
  • Manipulations de tableau
  • Opérateurs mathématiques courants

  Format de sortie

  Triplets RDF (sur HDFS), Liste d'arêtes (texte sur HDFS)

  Connecteur de base de données de graphes

  Base de données de graphes Titan Aurelius*



Volume, vitesse, variété et valeur

Intel travaille en étroite collaboration avec la communauté Open Source et les partenaires de l'écosystème pour garantir que la valeur et le potentiel du big data soient accessibles à tous. Avec de nouveaux outils logiciels, les entreprises et les initiatives de recherche pourront accéder aux capacités d'analyse de données et à l'efficacité opérationnelle auparavant seulement à la portée de grands fournisseurs de services.

L'engagement d'Intel pour le big data comprend :

  • L'offre de performances supérieures et d'améliorations pour les applications fonctionnant avec les processeurs Intel® Xeon® E5 et Intel® Xeon® E7
  • La collecte et l'intégration de données issues de multiples sources (structurées et non structurées) dans un système de fichier commun
  • Le travail conjoint de bases de données, outils logiciels et couches de la pile logicielle différentes. La diminution des barrières à l'adoption pour les organisations et les développeurs qui entrent sur le terrain du big data
  • L'accélération des temps de réponse, du débit pour l'analyse de graphe et de l'apprentissage automatique à grande échelle
  • L'établissement d'un Cloud, d'un réseau et d'un stockage pour les mémoires de big data

Logiciel Intel® Distribution for Apache Hadoop

Le logiciel Intel® Distribution for Apache Hadoop est la seule distribution haute technologie entièrement conçue pour permettre la plus vaste gamme d'analyses de données sur Apache Hadoop. Il est le premier à disposer de capacités de sécurité et de performances matériel accrues, et la seule plate-forme open source pour big data à bénéficier du soutien d'une entreprise listée au classement Fortune 100. Le code a été optimisé pour les dernières technologies de plateformes matérielles, avec notamment l'accélération cryptographique, le stockage SSD et un réseau 10GbE, qui permet des déploiements prenant en charge la confidentialité des données avec un chiffrement minime. Hadoop est également facile à déployer et à exploiter grâce à des capacités de gestion supplémentaires.
Plus d'infos >

Gestion et performances en temps réel pour le big data professionnel

Big data et analyse par graphe
L'application de l'analyse par graphe au big data avec Apache Hadoop* simplifie l'analyse des données et offre des informations approfondies.
Découvrez comment les outils d'analyse par graphe rentabilisent le big data >

Intel Graph Builder for Apache Hadoop* Software - Video

Logiciel Intel® Graph Builder for Apache Hadoop* v2
Le logiciel Intel® Graph Builder for Apache Hadoop* v2 automatise de nombreuses tâches de préparation des données et prépare rapidement les données pour des analyses pertinentes.
Découvrez comment Graph Builder d'Intel
                                                                                                              s'attaque au big data >

Comprendre le big data

Plus de contenus

Conversations