PayPal relève les défis en matière de fraude

Le déploiement de l'informatique à l'échelle du pétaoctet avec les processeurs Intel® Xeon® Scalable de 2ᵉ génération permet une prise de décisions en temps réel.

En bref :

  • PayPal est le plus grand système de transfert d'argent, de facturation et de paiement en ligne du monde. Il possède les marques PayPal, Venmo, iZettle, Xoom, Braintree et Paydiant.

  • En adoptant de nouvelles technologies Intel® et la plateforme de données en temps réel d'Aerospike, PayPal a réduit le nombre de transactions frauduleuses manquées en améliorant le respect à l'accord de niveau de service (SLA), tout en ayant une empreinte informatique plus petite que son infrastructure précédente, ce qui permet alors une augmentation du nombre de données évaluées.

author-image

Synthèse

PayPal est le plus grand système de transfert d'argent, de facturation et de paiement en ligne du monde. Il possède les marques PayPal, Venmo, iZettle, Xoom, Braintree et Paydiant. En tirant parti de la technologie pour rendre les services financiers et le commerce plus pratiques, abordables et plus sûrs, la plateforme PayPal permet à plus de 325 millions de consommateurs et commerçants dans plus de marchés de rejoindre et se développer dans l'économie mondiale. Mais comme tout service bancaire, PayPal doit surmonter des défis en matière de fraude. En adoptant les nouvelles technologies Intel® et la plateforme de données en temps réel d'Aerospike, PayPal a divisé le nombre de transactions frauduleuses par 30 en améliorant le respect de l'accord de niveau de service (de 98,5 % précédemment à 99,95 %), tout en utilisant une empreinte informatique 8 fois plus petite que son infrastructure précédente (de 1 024 serveurs à seulement 120). Cela lui a permis de multiplier par 10 la quantité de données évaluées.1

Enjeux

La fraude représente pour PayPal entre 0,17 et 0,18 % de ses revenus.2 Bien que ce nombre est largement inférieur à la moyenne du secteur qui est de 1,86 %,2 il représente tout de même plus d'un milliard de dollars en pertes annuelles pour l'entreprise.

Pour identifier des modèles de fraude émergents en temps réel, PayPal a besoin de traiter et d'analyser plus de données plus rapidement. PayPal a cherché à construire rapidement une plateforme de prise de décision en temps réel qui serait extrêmement efficace tout en minimisant la friction des utilisateurs finaux. La plateforme a fusionné le big data avec le traitement de données en temps réel, comme l'inscription de clients, les paiements, les préférences de facturation et les données de profil.

La mise à l'échelle de la quantité de données traitées, cependant, a introduit certains défis. Cela comprend un grand index primaire, des centaines de pétabytes de données et l'exigence de doubler le taux de traitement de transaction en ligne (OLTP, online transaction processing) de 3,5 à 7 millions de transactions par seconde. PayPal a déterminé que les quantités massives de données qui étaient collectées ralentissaient la base de données existante. La base de données existante ne pouvait plus produire de résultats sans connaître une détérioration des performances. PayPal a besoin d'une stratégie informatique rentable qui permettrait à leur infrastructure d'évoluer horizontalement, tout en assurant que les performances et le temps de disponibilité ne soient pas affectés. En 2015, ils ont choisi Aerospike et son système de base de données NoSQL.

Solution

L'infrastructure de PayPal prend en charge plus de 4 000 instances de bases de données, 100 petabytes de données et 32 % d'augmentation de stockage de données chaque année. Cependant, à mesure que les volumes de données dans sa plateforme de prise de décision en matière de fraude augmentaient chaque année, la taille de l'index primaire grandissait également. Une fois que la capacité en mémoire d'un nœud était épuisée, il ne pouvait plus stocker de nouvelles données, même s'il restait de la capacité de stockage. La mise à l'échelle des nœuds supplémentaires impliquait des coûts importants, notamment les coûts matériels initiaux, le personnel pour gérer les nœuds et la consommation d'énergie accrue. Pour ne pas augmenter le nombre de nœuds de la base de données, PayPal cherchait continuellement à augmenter la densité par nœud.

La base de données d'Aerospike est conçue avec une architecture de mémoire hybride brevetée (Hybrid Memory Architecture™ ou HMA) qui offre une approche fondamentalement différente des bases de données traditionnelles. Pour offrir des performances prévisibles jusqu'à l'échelle du pétaoctet, Aerospike est conçu explicitement pour tirer parti des progrès matériels du stockage flash (SSD) et de la mémoire persistante au lieu de s'appuyer sur la DRAM. L'utilisation d'Aerospike a permis à PayPal de s'adapter à une densité de stockage plus élevée et au stockage SSD rapide, tout en stockant uniquement l'index primaire dans la mémoire pour un accès rapide aux données.

En 2019, PayPal a commencé à explorer les options de mémoire et de stockage de nouvelle génération pour augmenter leur densité de stockage globale et réduire leurs coûts en DRAM en utilisant Aerospike. Quand la mémoire persistante Intel® Optane™ (Intel® Optane™ PMem) a été lancée, Aerospike avait déjà optimisé son logiciel pour tirer parti des nouveaux modules de PMem. L'Intel Optane PMem offre une combinaison unique d'une capacite grande et abordable et de non-volatilité. Les processeurs Intel® Xeon® Scalable de 2ᵉ génération sont conçus pour tirer de l'Intel Optane PMem dans les serveurs.

La HMA d'Aerospike offre désormais l'option de stocker l'index primaire dans la PMem Intel Optane au lieu de la DRAM. Puisque la PMem Intel Optane est disponible en modules de 128, 256 et 512 Go à un coût plus faible par Go que la DRAM, PayPal a pu augmenter considérablement la capacité de la mémoire de chaque nœud. Avec plus d'espace pour l'index primaire, ils pouvaient alors construire des clusters plus petits avec des nœuds plus denses. Cela a considérablement réduit le besoin pour un développement horizontal, tout en maintenant les attentes de PayPal en matière de performance.

La persistence est un avantage supplémentaire que PayPal a obtenu en stockant l'indice primaire dans la PMem Intel Optane. Avec les index dans la DRAM, un redémarrage du système nécessitait l'analyse des données stockées pour reconstruire l'index, mais avec des index qui persistent après les redémarrages, le système entier peut maintenant être restauré et être remis en ligne en une fraction de seconde. Un redémarrage plus rapide des serveurs permet de respecter les exigences de PayPal en ce qui concerne un temps de fonctionnement élevé et une meilleure fiabilité.

Plus récemment, une collaboration pluriannuelle entre Intel et Aerospike a abouti à des optimisations supplémentaires, qui comprennent notamment la possibilité de stocker des données (pas seulement les indexes) dans la PMem Intel Optane.

Résultat

PayPal dispose maintenant d'un total de 200 serveurs Aerospike, y compris 200 serveurs haute densité avec des processeurs Intel Xeon Scalable de 2ᵉ génération et d'Intel Optane PMem. PayPal s'attend à une croissance continue, et en faisant évoluer son infrastructure avec ces nouvelles technologies, la société a réduit son TCO en réduisant la DRAM, tout en conservant un temps de réponse des applications rapide et une faible latence. Autres avantages :

  • 4 fois plus de stockage par nœud (de 3,2 à 12 To)1
  • 2 fois moins de serveurs1
  • 30 % de réduction des coûts par cluster1
  • Des délais de réindexation 12 fois moins long1

En se basant sur la taille initiale des données de fraude prévues par PayPal, qui représentaient 50 To en 2015 avec l'ancien système en mémoire, la HMA d'Aerospike, les processeurs et la PMem Intel Optane ont permis à PayPal d'accomplir les exploits suivants :

  • 30 fois moins de transactions frauduleuses manquées grâce à l'amélioration de l'adhésion au SLA de 98,5 % à 99,95 %3
  • Empreinte des serveurs réduite de 8 fois : de 1 024 serveurs à 1201
  • Coûts réduits de 3 fois : économies d'un coût de 9 millions de dollars en matériel projetés de 12,5 millions à 3,5 millions de dollars1
  • Amélioration du débit d'inférence de 5 fois : de 200 000 à 1 millions de transactions par seconde1

Comme les données annuelles de PayPal devraient augmenter de 32 %, Aerospike et Intel Optane PMem permettent à la solution de fraude PayPal d'évoluer à moindre coût. PayPal pourra alors continuer à respecter 99,95 % des SLA de calcul des fraudes. PayPal bénéficie également de temps de redémarrage des nœuds réduits, d'une meilleure cohérence des données et une meilleure performance en matière de requêtes, en plus de maintenir une disponibilité haute et cohérente 24h sur 24, 7 jours sur 7 (99,99 % de disponibilité).

La prévention des fraude est un secteur d'investissement important pour PayPal. La société a exploité avec succès la prise de décision en temps réel avec des modèles robustes de prévention de la fraude pendant plus de 10 ans. Cependant, les fraudeurs changent en permanence leur façon de faire et trouvent de nouvelles façons de profiter du système. Par conséquent, PayPal doit continuellement trouver des moyens d'améliorer la précision de la détection des fraudes et réduire le temps de détection. PayPal continue à travailler avec Aerospike et Intel pour faire progresser les approches permettant de détecter et d'arrêter la fraude pour un niveau de confiance plus élevé dans les décisions.

À propos d'Aerospike

La plateforme de données en temps réel Aerospike permet aux organisations d'agir instantanément sur des milliards de transactions, tout en réduisant l'empreinte des serveurs de 80 %. La plateforme multicloud Aerospike alimente des applications en temps réel avec des performances prévisibles en moins d'une milliseconde, de téraoctets aux pétaoctets de données avec une disponibilité « cinq-neuf », avec des données cohérentes et distribuées à travers le monde. Les applications conçues sur la plateforme de données en temps réels Aerospike luttent contre la fraude, fournissent des recommandations qui augmentent considérablement la taille du panier d'achats, permettent des paiements numériques internationaux et offrent des expériences utilisateur hyper-personnalisées à des dizaines de millions de clients. Des clients tels qu'Airtel, Experian, Nielsen, PayPal, Snap, Verizon Media et Wayfair font confiance à Aerospike pour le futur de leurs bases de données. En plus de son siège social à Mountain View, en Californie, la société possède également des bureaux à Londres, Bangalore et Tel Aviv.

Télécharger le PDF ›

Infos sur le produit et ses performances

1Tests effectués par Aerospike et PayPal en avril 2020. Stockage multiplié par quatre : 6,4 To/nœud avec la configuration de référence, 25,6 To/nœud (6,4 x 4 = 25,6) avec la nouvelle configuration avec la mémoire persistante Intel Optane. 2 fois moins de serveur : le cluster de référence avait 20 nœuds contenant 2 copies de chaque enregistrement, tandis que le nouveau cluster doté de la mémoire persistante Intel Optane a 10 nœuds qui contiennent 3 copies de chaque enregistrement. Cela permet un niveau plus élevé de tolérance aux pannes. 30 % de réduction des coûts/clusters : le cluster de reference de 20 nœuds coûte 1,3 millions de dollars, et chaque nœud coûte environ 65 000 dollars. Le nouveau cluster de 10 nœuds coûtant 0,9 millions de dollars, chaque nœud coûte environ 90 000 dollars (0,9 millions / 1,3 millions = 0,70, soit 30 % de réduction des coûts des clusters). Des délais de réindexation 12 fois moins long : de 59 minutes sur la configuration initiale à seulement 4 minutes sur la nouvelle configuration avec la mémoire persistante Intel Optane.
2Étude True Cost of Fraud 2019 par LexisNexis® Rick Solutions https://risk.lexisnexis.com/insights-resources/research/2019-true-cost-of-fraud-study-e-commerce-retail-edition.
3Tests effectués par Aerospkie et PayPal en avril 2020. Stockage multiplié par quatre : 6,4 To/nœud avec la configuration de référence, 25,6 To/nœud (6,4 x 4 = 25,6) avec la nouvelle configuration avec la mémoire persistante Intel Optane. 2 fois moins de serveur : le cluster de référence avait 20 nœuds contenant 2 copies de chaque enregistrement, tandis que le nouveau cluster doté de la mémoire persistante Intel Optane a 10 nœuds qui contiennent 3 copies de chaque enregistrement. Cela permet un niveau plus élevé de tolérance aux pannes. 30 % de réduction des coûts/clusters : le cluster de reference de 20 nœuds coûte 1,3 millions de dollars, et chaque nœud coûte environ 65 000 dollars. Le nouveau cluster de 10 nœuds coûtant 0,9 millions de dollars, chaque nœud coûte environ 90 000 dollars (0,9 millions / 1,3 millions = 0,70, soit 30 % de réduction des coûts des clusters). Des délais de réindexation 12 fois moins long : de 59 minutes sur la configuration initiale à seulement 4 minutes sur la nouvelle configuration avec la mémoire persistante Intel Optane.