Indexez jusqu'à 2,49 fois plus de documents par seconde et raccourcissez les temps de recherche pour les charges de travail Elasticsearch avec les VM Microsoft Azure Ddsv5 dotées de processeurs Intel® Xeon® Scalable 3e génération.

Elasticsearch

  • Indexez jusqu'à 2,49 fois plus de documents par seconde avec les VM Microsoft Azure Ddsv5 dotées de processeurs Intel® Xeon® Scalable de 3e génération par rapport aux instances Dsv3.

  • Réduisez les temps de recherche de 69 % avec les VM Microsoft Azure Ddsv5 dotées de processeurs Intel® Xeon® Scalable de 3e génération par rapport aux instances Dsv3.

author-image

Par

Les machines virtuelles Ddsv5 ont accéléré l'indexation par rapport aux machines virtuelles Dsv3 et Ddsv4 équipées de la précédente génération de processeurs

Microsoft Azure Kubernetes Services (AKS) offre flexibilité et agilité aux organisations qui exécutent des charges de travail Elasticsearch sur des clusters Kubernetes dans le Cloud. Quel type de machine virtuelle offre le meilleur niveau de performances pour ces charges de travail ? Pour le savoir, nous avons comparé les performances Elasticsearch de trois types d'instances dans un environnement conteneurisé Kubernetes :

  • Machines virtuelles Microsoft Azure Ddsv5 équipées de processeurs Intel® Xeon® Scalable de 3ᵉ génération
  • Machines virtuelles Microsoft Azure Ddsv4 équipées de processeurs Intel® Xeon® Scalable de 2ᵉ génération
  • Machines virtuelles Microsoft Azure Ddsv3 équipées de processeurs Intel Xeon E5-2673 v4

Pour quantifier les performances d'Elasticsearch, nous avons utilisé l'outil de banc d'essai Rally 2.3.0, qui agit comme un générateur de charge. Il enregistre et stocke les métriques de télémétrie dans Elasticsearch pendant l'exécution des charges de travail de recherche afin de détecter les problèmes de performance pour les comparer entre les clusters. En utilisant deux ensembles de données de Rally, nyc_taxis (un ensemble de données d'analyse des transports) et http_logs (un ensemble de données de services Web), nous avons constaté que les VM Azure Ddsv5 équipées de processeurs Intel® Xeon® Scalable de 3e génération indexaient jusqu'à 2,49 fois plus de documents par seconde avec des temps de recherche jusqu'à 69 % plus courts par rapport à un cluster VM Azure Dsv3. En outre, les machines virtuelles Ddsv5 ont surpassé les machines virtuelles Ddsv4 jusqu'à 30 % en termes de débit d'indexation, avec des temps de recherche réduits de 29 %. Pour en savoir plus sur Rally et les charges de travail que nous avons utilisées, veuillez consulter ce qui suit.

Cela montre que sur plusieurs charges de travail Elasticsearch, sélectionner les VM Azure Ddsv5 utilisant la toute dernière technologie de processeur peut améliorer les performances d'Azure Kubernetes Services par rapport aux machines virtuelles reposant sur deux précédentes générations de processeurs. Grâce à une indexation plus rapide de leur contenu, les entreprises obtiennent les données dont elles ont besoin en moins de temps pour prendre des décisions métier essentielles.

Indexez vos données plus vite pour obtenir des informations plus rapidement avec les VM Azure Ddsv5

Alors que les entreprises utilisent Elasticsearch dans de nombreux cas de figure, y compris le contrôle de la performance des applications, les recherches d'applications et l'analyse métier, nous avons comparé le débit d'indexation pour une charge de travail d'analyse de transport et une charge de travail de services Web typique (voir la figure 1).

En utilisant le jeu de données nyc_taxis, qui stocke des données sur les courses de taxi à New York en 2015 et exécute des scénarios de recherche, les VM Ddsv4 équipées de processeurs Intel® Xeon® Scalable de 2e génération ont indexé 53 % de documents par seconde (docs/s) de plus que le cluster de VM Dsv3. Les machines virtuelles Azure Ddsv5 équipées de processeurs Intel® Xeon® Scalable de 3e génération ont encore amélioré les performances, offrant 91 % de docs/s de plus que les VM Dsv3.

Sur l'ensemble de données http_logs, qui utilise des données de journal de serveur HTTP et exécute des scénarios de recherche, les types de VM ont à nouveau montré une augmentation similaire des performances par rapport aux VM Dsv3. Les VM Azure Ddsv4 ont présenté un débit 92 % plus élevé, tandis que les VM Ddsv5 dotées de processeurs Intel® Xeon® Scalable de 3e génération ont affiché un débit 2,49 fois plus élevé, pour une indexation nettement plus rapide.

Figure 1. Le débit d'indexation relatif, exprimé en documents par seconde, que les clusters ont atteint en exécutant deux types d'ensembles de données provenant du banc d'essai de Rally pour évaluer les performances d'Elasticsearch. Plus les chiffres sont élevés, mieux c'est.

Réduire les temps de recherche avec les machines virtuelles Azure Ddsv5

Le banc d'essai Rally a également mesuré la latence de recherche lors de l'exécution de charges de travail Elasticsearch. En effet, profiter de temps de recherche plus courts signifie qu'il n'est pas nécessaire d'attendre aussi longtemps pour extraire des informations de ses données. La figure 2 compare la latence de recherche normalisée que les VM ont enregistrée pour les ensembles de données nyc_taxis et http_logs. Les VM Ddsv4 équipées de processeurs Intel® Xeon® Scalable de 2e génération ont réduit la latence de recherche de 33 % et 44 %, respectivement. Les dernières VM Ddsv5 équipées de processeurs Intel® Xeon® Scalable de 3e génération ont encore réduit les temps de latence, de 56 % et 69 % respectivement, par rapport aux VM Dsv3.

Figure 2. La latence de recherche relative, en millisecondes, que les clusters ont atteint en exécutant deux types d'ensembles de données du banc d'essai de Rally pour évaluer les performances d'Elasticsearch. Plus les chiffres sont bas, mieux c'est.

Conclusion

Quelle que soit votre utilisation d'Elasticsearch, l'indexation d'une plus grande quantité de contenu par seconde peut vous permettre d'obtenir des informations plus rapidement. Les tests montrent que le choix des VM Microsoft Azure Ddsv5 dotées de processeurs Intel® Xeon® Scalable de 3e génération pour exécuter Elasticsearch sur des clusters Kubernetes peut améliorer le débit d'indexation et les temps de recherche pour de multiples cas d'utilisation.

Si le type d'instance cloud que vous choisissez permet d'indexer plus de données en moins de temps pour une analyse plus rapide, cela peut également réduire le nombre d'instances que vous devez acheter et donc potentiellement améliorer vos coûts d'exploitation.

En savoir plus

Pour commencer à exécuter vos charges de travail Elasticsearch sur des VM Microsoft Azure Ddsv5, rendez-vous sur le site https://docs.microsoft.com/en-us/azure/virtual-machines/ddv5-ddsv5-series.

Pour en savoir plus sur Elastic, rendez-vous sur https://www.elastic.co/.

Pour utiliser l'outil de banc d'essai Rally, rendez-vous sur https://github.com/elastic/rally. Vous pouvez trouver les deux ensembles de données utilisés dans les tests sur https://github.com/elastic/rally-tracks/tree/master/http_logs et https://github.com/elastic/rally-tracks/tree/master/nyc_taxis.