Alibaba Cloud : POLARDB*, base de données hébergée dans le Cloud

Le stockage défini par logiciel équipé d'unités de stockage SSD Intel® Optane™ pour centres de données améliore les performances et réduit la latence.

À travers le monde, de nombreuses entreprises s'appuient sur des systèmes de gestion des données relationnelles (RDBMS) Ces systèmes sont également indispensables dans le cadre des opérations de l'entreprise et de la transformation numérique.

Toutefois, il se peut qu'un RDBMS sur site nécessite d'importants investissements en termes d'infrastructure, de temps, de coûts et de personnel pour le moderniser, l'adapter à la croissance de l'entreprise et veiller à ce qu'il soit en mesure d'accompagner la transformation numérique. Le Cloud Computing, qui a évolué pour s'imposer dans les organisations de toutes tailles, est une solution parfaite à ces problématiques.

Les bases de données relationnelles sont largement disponibles sous forme de services hébergés dans le Cloud, plus connus sous le nom de solutions de base de données en tant que service (DBaaS, « database-as-a-service »). Cependant, un RDBMS dans le Cloud peut générer des problématiques qui lui sont propres et occasionner le besoin de solutions de bases de données relationnelles hébergées dans le Cloud pour accompagner la transformation numérique MySQL* et Oracle Database* sont les bases de données les plus couramment utilisées. Lorsqu'elles sont hébergées sur site ou gérées comme un service dans le Cloud, elles peuvent s'avérer difficiles à sécuriser, à gérer et à faire évoluer, mais aussi ne pas fournir les performances ou la qualité de service nécessaires.

Pour traiter ces problèmes et offrir un nouveau modèle de DBaaS aux entreprises, Alibaba Cloud a développé POLARDB*, base de données relationnelle novatrice hébergée dans le Cloud. POLARDB* est basée sur une architecture distribuée de stockage partagé, conçue pour utiliser les unités de stockage Intel® Optane™ Solid State Drives (SSDs) et Intel® 3D NAND SSDs.

Problèmes traditionnels des bases de données hébergées dans le Cloud
Dans un environnement de Cloud public, la croissance du nombre d'utilisateurs, des services et des volumes de données peut entraîner des problèmes de sauvegarde, de performances, de migration, de mises à niveau, de capacité de disque et de retards causés par le journal binaire. Plus le volume de données est important, plus le temps nécessaire à la mise à l'échelle, à la sauvegarde et à la migration des données augmente. La sauvegarde de téraoctets de données peut prendre des heures, voire des jours. Il est parfois nécessaire de mettre une base de données hors ligne ou de la redémarrer afin de procéder à la mise à niveau, la mise à l'échelle, la sauvegarde et la migration des données, ce qui peut avoir des répercussions sur l'entreprise, ses utilisateurs et son personnel informatique. La migration des données peut ralentir les performances des applications stratégiques. La continuité des opérations quotidiennes peut exiger de nombreuses ressources de processeurs, occasionnant ainsi d'éventuels retards et réduisant le rapport prix/performances si elles sont réparties sur des millions de transactions.

Les unités de stockage SSD Intel Optane se traduisent par une amélioration de 30 % du nombre de requêtes par seconde (QPS) pour une meilleure expérience client avec POLARDB1, une amélioration de 76 % de la latence au 95ᵉ centile grâce à POLARDB 1 et une capacité de 100 To dans chaque instance de la base de données POLARDB.

POLARDB redéfinit l'hébergement d'une base de données dans le Cloud
POLARDB innove sur le modèle DBaaS existant. Elle utilise un système scale-out défini par logiciel et intègre des unités de stockage SSD Intel Optane rapides à faible latence et des unités SSD Intel 3D NAND économiques à haute capacité. POLARDB est idéale pour les entreprises qui utilisent de grands volumes de données qui ne cessent de croître, ce qui nécessite non seulement une faible latence, un débit élevé et une haute qualité de service (QoS), mais également un bon rapport prix/performances.

Le paradigme de stockage de POLARDB, combiné à d'autres innovations, offre la performance et la disponibilité d'une base de données d'entreprise dans un modèle DBaaS. Alibaba Cloud a conçu POLARDB en se concentrant sur les coûts des solutions hébergées dans le Could pour les entreprises, les performances de traitement de transactions en ligne (OLTP), la continuité des activités commerciales, ainsi que la croissance de l'entreprise et la sécurité. Tous les équipements matériels et logiciels sont conçus pour fonctionner efficacement ensemble, notamment avec le matériel Intel sous-jacent, dans une conception Cloud native développée pour assurer une fiabilité et une disponibilité élevées. L'architecture offre des performances élevées pour environ un dixième des coûts d'une base de données relationnelle traditionnelle sur site2.

Son architecture permet à POLARDB de multiplier le débit des unités de stockage standard MySQL 5.6 et 5.7 par six lorsque MySQL est exécutée sur des SSD Peripheral Component Interconnect Express* (PCIe*) et NVM Express* (NVMe*). De plus, la capacité de POLARDB peut atteindre jusqu'à un million d'opérations d'entrée/sortie par seconde (IOPS) grâce à une latence de quelques millisecondes2. POLARDB peut également se mettre à l'échelle à la demande en moins de 10 minutes. Elle prend en charge une capacité pouvant atteindre 100 To par instance de base de données, contre 60 To pour des autres solutions similaires. La mise à l'échelle de la capacité de stockage et des clones peut être automatisée. En outre, POLARDB est 100 % rétroactive avec MySQL 5.6 et 5.7.

Les SSD Intel Optane optimisent les performances de stockage
Le stockage distribué de POLARDB avec des SSD Intel Optane et 3D NAND offre une excellente efficacité de stockage, une haute qualité de service (QoS), un débit élevé et des performances constantes. Les unités de stockage SSD Intel® équilibrent coûts et performances. Elles permettent à Alibaba Cloud d'éliminer les goulots d'étranglement de stockage des centres de données, de prendre en charge des ensembles de données plus grands et plus abordables, d'accélérer les applications, de réduire les coûts de transaction des charges de travail sensibles à la latence et d'améliorer le coût total de possession (TCO) de l'ensemble du centre de données pour POLARDB.

En combinant des SSD Intel Optane à grande vitesse et haute capacité et des SSD Intel 3D NAND à haut débit au niveau de la couche logicielle, POLARDB met en place une couche de stockage hybride qui peut offrir une faible latence uniforme, un débit élevé, une haute qualité de service et un rapport prix/performances global inférieur par rapport à l'utilisation seule d'unités de stockage SSD Intel 3D NAND pour la couche de stockage.

Avec les unités de stockage SSD Intel Optane et SSD 3D NAND, Alibaba Cloud a réalisé :

  • Amélioration de 30 % du nombre de requêtes par seconde (QPS) pour une meilleure expérience client avec POLARDB3
  • Amélioration de 76 % de la latence au 95ᵉ centile grâce à POLARDB3

Architecture de POLARDB
L'architecture POLARDB définie par logiciel utilise un stockage distribué, le kit de développement SPDK (Storage Performance Development Kit), un accès direct à la mémoire distante (RDMA) et d'autres innovations pour créer une base de données Cloud hautes performances évolutive. L'architecture de POLARDB sépare les pools de calcul et de stockage. Lorsque les ressources et la mémoire du processeur sont insuffisantes, l'expansion du pool de ressources informatiques se fait séparément de celle du pool de stockage, et, lorsque la capacité ou la mémoire IOPS est faible, le pool de ressources de stockage est indépendant de celui de calcul.

L'architecture du stockage distribué de POLARDB utilise trois répliques ou nœuds au lieu d'un stockage local. Une réplique sert à la lecture et l'écriture, les deux autres sont en lecture seule. Lorsqu'une nouvelle instance en lecture seule est nécessaire, aucune donnée ne doit être copiée. Quelle que soit l'ampleur du nouveau volume de données, l'instance peut être créée en cinq minutes seulement par rapport aux 70 heures nécessaires à l'ajout d'une instance pour une base de données traditionnelle de plus de 3 To de données3. L'instance principale et les instances en lecture seule partagent les mêmes ressources de stockage. Cela permet d'augmenter les performances de copie en lecture seule sans frais supplémentaires pour le stockage de nouvelles données. Les utilisateurs payent uniquement pour le processeur et la mémoire que les instances en lecture seule consomment. POLARDB utilise cette configuration de stockage distribué pour localiser les données et évoluer plus rapidement qu'une base de données traditionnelle.

Figure 1. Architecture Alibaba Cloud POLARDB* avec unités de stockage SSD Intel®.

Chaque nœud de stockage de POLARDB utilise une unité de stockage SSD Intel® Optane™ DC série P4800X pour accélérer la journalisation et l'indexation des données, et pour prendre en charge les unités de stockage SSD DC Intel série P4500 utilisées pour le stockage des données. Le SPDK écrit des données sur chaque interface NVMe des SSD Intel 3D NAND sans avoir à accéder à la mémoire synchronisée. Avant l'implémentation des SSD Intel Optane, la journalisation et les données étaient colocalisées sur des SSD Intel basées sur NVMe pour le centre de données, ce qui nécessitait un accès à la mémoire synchronisée. En contournant la mémoire synchronisée, POLARDB peut augmenter les performances et réduire la latence.

POLARDB se traduit par d'autres gains de performances grâce à :

  • L'utilisation du RDMA sur le protocole réseau Ethernet convergé (RoCE) pour diminuer la latence, réduire la charge du processeur et augmenter la bande passante
  • Le contournement du noyau Linux* grâce à une pile définie par logiciel qui permet à POLARDB de fonctionner en mode utilisateur et contribue à réduire les surcharges
  • La suppression du journal binaire qui réduit la durée des transactions et les ressources d'entrée/sortie (E/S) nécessaires

Accès à une base de données d'entreprise en tant que service
Avec le déploiement d'une DBaaS, l'équipe informatique d'une entreprise n'a plus à assurer la gestion des bases de données en interne, ni l'achat et la maintenance du matériel nécessaire à une base de données sur site. Elle peut alors se concentrer sur des innovations qui répondent aux besoins essentiels de l'entreprise afin de faciliter sa transformation numérique et d'améliorer ses perspectives concurrentielles. Là où les autres solutions DBaaS peuvent occasionner d'autres obstacles, POLARDB d'Alibaba Cloud a été conçue pour vous aider à les surmonter grâce à une solution DBaaS de qualité commerciale. POLARDB offre aux entreprises une solution à la demande qui peut les aider à maintenir un bon rapport prix/performances. Proposée sous la forme d'une base de données commerciale, elle aide les entreprises à gérer des volumes importants de données tout en permettant une faible latence, un débit élevé, une haute qualité de service (QoS) et une mise à l'échelle rapide.

Unités de stockage SSD Intel Optane et SSD Intel® 3D NAND pour POLARDB
POLARDB a été initialement développée pour répondre aux besoins de la centrale d'achat virtuelle d'Alibaba Cloud. Alibaba Cloud a initialement utilisé des unités de stockage SSD Intel Optane et Intel 3D NAND pour POLARDB pour répondre à un pic d'utilisation de la centrale d'achat. Alibaba Cloud a ensuite optimisé les performances, jusqu'à six fois supérieures pour MySQL par rapport à l'exécution de MySQL uniquement sur les unités de stockage SSD PCIe NVMe basées sur NAND.4.

Aujourd'hui, en utilisant l'unité de stockage SSD Intel Optane DC série P4800X dans le cadre de l'offre POLARDB, Alibaba Cloud utilise des unités de stockage SSD qui :

  • Sont les SSD pour centres de données les plus réactives disponibles avec la technologie Intel® Optane™5
  • Offrent jusqu'à 750 Go de capacité
  • Ont permis d'améliorer les performances de POLARDB

Ensemble, les SSD Intel 3D NAND et SSD Intel Optane offrent un stockage de données économique, tout en assurant une qualité et une fiabilité exceptionnelles, ainsi qu'une gestion et une maintenance avancées afin de minimiser les perturbations de POLARDB.

En travaillant en étroite collaboration avec des clients comme Alibaba Cloud dans le cadre du développement de bases de données innovantes, Intel contribue à améliorer l'expérience de base de données qu'offrent les entreprises à leurs clients dans le monde entier.

À propos d'Alibaba Cloud
Alibaba Cloud est la plus grande entreprise de commerce électronique de Chine ainsi qu'un fournisseur de services Cloud en croissance rapide. Alibaba Cloud offre une gamme de services Cloud adaptée aux entreprises en ligne dans le monde entier. La société gère et maintient également l'écosystème du commerce électronique pour sa société mère, le Groupe Alibaba.

Les activités mondiales d'Alibaba Cloud sont enregistrées et sises à Singapour. Elle possède également des bureaux à Dubaï, Francfort, Hong Kong, Londres, New York, Paris, San Mateo, Séoul, Singapour, Sydney et Tokyo.

Découvrez les produits et solutions associés

Processeurs Intel® Xeon® Scalable

Générez des données exploitables, comptez sur la sécurité assistée par matériel et mettez en place des prestations de services dynamiques avec les processeurs Intel® Xeon® Scalable.

En savoir plus

Unités de stockage SSD Intel® Optane™

La technologie Intel® Optane™ est la première grande percée en matière de mémoire et de stockage depuis 25 ans.

En savoir plus

Unités de stockage SSD Intel® série DC

Les unités de stockage SSD Intel® pour centres de données offrent des performances, une fiabilité et une endurance optimales.

En savoir plus

Avis et avertissements

Les fonctionnalités et avantages des technologies Intel® dépendent de la configuration du système et peuvent nécessiter du matériel et des logiciels compatibles et l'activation de certains services. Les performances varient d'une configuration à une autre. Aucun ordinateur ne saurait être totalement sécurisé. Consultez le constructeur ou le revendeur de votre ordinateur.vous pouvez consulter le site https://www.intel.fr pour en savoir plus. // Les logiciels et charges de travail utilisés dans les tests de performance ont peut-être été optimisés uniquement pour les microprocesseurs Intel®. Les tests de performance tels que SYSmark* et MobileMark* portent sur des configurations, composants, logiciels, opérations et fonctions spécifiques. Les résultats peuvent varier en fonction de ces facteurs. Pour l'évaluation d'un produit, il convient de consulter d'autres tests et d'autres sources d'information, notamment pour connaître le comportement de ce produit avec d'autres composants. Pour des informations plus complètes, visitez https://www.intel.fr/benchmarks. // Les résultats de performances s'appuient sur les tests réalisés aux dates indiquées dans les configurations et peuvent ne pas refléter toutes les mises à jour de sécurité disponibles. Pour obtenir plus de détails, veuillez lire les informations de configuration. Aucun produit ou composant ne saurait être totalement sécurisé. // Les scénarios de réduction de coûts décrits sont fournis à titre d'exemples montrant comment un produit de technologie Intel® donné, dans les circonstances et configurations spécifiées, peut affecter les coûts futurs et entraîner des économies de coûts. Les circonstances peuvent varier selon les cas. Intel ne garantit aucun coût ni réduction de coûts. // Intel ne maîtrise et ne vérifie pas les bancs d'essai cités ici ou sur les sites Web mentionnés en référence. Vous êtes invité à consulter vous-même ces sites Web et à vérifier l'exactitude des données. // Dans certains cas, les résultats ont été estimés ou simulés à l'aide d'une analyse, d'une simulation ou d'une modélisation d'architecture réalisée en interne par Intel et sont mentionnés à titre indicatif. Toute différence matérielle, logicielle ou de configuration du système peut avoir une incidence sur vos performances effectives.

Infos sur le produit et ses performances

1Tests réalisés par Alibaba Cloud sur deux processeurs à 2 sockets avec 32 cœurs chacun, 256 Go de DRAM et des contrôleurs d'interface réseau (NIC) doubles de 25 gigabits Ethernet (GbE). Un Alibaba Cloud Elastic Compute Service* (ECS*), un système POLARDB* (une base de données et trois répliques de PolarStore*). Banc d'essai : Amazon Aurora* (sysbench*), thread = 1, profondeur de file d'attente iodepth = 1, 100 % en écriture, base de données de 4 To, taille des blocs de requête = 16 Ko.
2Alibaba Cloud. « Capacité de 100 To et 6 x plus de performances grâce à Alibaba Cloud PolarDB. » Avril 2018. alibabacloud.com/blog/100tb-capacity-and-6x-performance-improvement-with-alibaba-cloud-polardb_578294.
3Tests réalisés par Alibaba Cloud sur deux processeurs à 2 sockets avec 32 cœurs chacun, 256 Go de DRAM et des contrôleurs d'interface réseau (NIC) doubles de 25 gigabits Ethernet (GbE). Un Alibaba Cloud Elastic Compute Service* (ECS*), un système POLARDB* (une base de données et trois répliques de PolarStore*). Banc d'essai : Amazon Aurora* (sysbench*), thread = 1, profondeur de file d'attente iodepth = 1, 100 % en écriture, base de données de 4 To, taille des blocs de requête = 16 Ko.
4Tests réalisés par Alibaba Cloud sur deux processeurs à 2 sockets avec 32 cœurs chacun, 256 Go de DRAM et des contrôleurs d'interface réseau (NIC) doubles de 25 gigabits Ethernet (GbE). Un Alibaba Cloud Elastic Compute Service* (ECS*), un système POLARDB* (une base de données et trois répliques de PolarStore*). Banc d'essai : Amazon Aurora* (sysbench*), thread = 1, profondeur de file d'attente iodepth = 1,100 % en écriture, base de données de 4 To, taille des blocs de requête = 16 Ko.
5Réactivité définie comme la latence moyenne de lecture mesurée à la profondeur de la file 1 lors d'une charge de travail d'écriture aléatoire de 4K. Mesures réalisées sous FIO 2.15*. Configuration courante : 2 x processeurs Intel® Xeon® E5-2699 v4 (2,20 GHz et 22 cœurs), CentOS 7.2*, noyau 3.10.0-327.el7.x86_64, RAM DDR de 396 Go à 2 133 MHz. Unités de stockage Intel® évaluées : unité de stockage SSD Intel® Optane™ DC série P4800X de 375 Go et unité de stockage SSD DC Intel® série DC P3700 de 1 600 Go. Disques Samsung* évalués : SSD Samsung PM1725a*, Samsung PM1725*, Samsung PM963*, Samsung PM953*. Disque Micron* évalué : SSD Micron 9100 PCIe NVMe*. Disque Toshiba* évalué : Toshiba ZD6300*. Test : profondeur de la file 1, lecture aléatoire, latence 4K, profondeur de la file 1, lecture/écriture aléatoire, latence de 4K 70 % de lecture, profondeur de la file 1, écriture aléatoire, latence 4K utilisant la FIO 2.15.