À la croisée de ses deux expertises IT et logistique, Amazon développe une IA capable d’optimiser l’emballage des colis de son e-commerce pour réduire ses coûts et son empreinte environnementale. Au programme, du machine learning multimodal à partir de données texte et des images, déjà exploité en Amérique du Nord et en Europe. (Photo E.Delsol)
Toute la filière logistique est concernée par la question de l’emballage et surtout du suremballage, de son impact environnemental, de son coût et de son image auprès du consommateur. Mais s’il est bien un acteur du e-commerce pour qui la question est centrale, c’est Amazon. Il suffit d’un regard sur les poubelles dans nos rues qui débordent de cartons beiges au sourire noir pour s’en convaincre.
Et pour le Gafa, la question ne peut plus être laissée de côté. Selon son DG Dave Clark, Amazon deviendra en effet le plus important transporteur de colis dans le monde dès la fin de l’année, comme il l’a déclaré sur CNBC en novembre. Les chiffres parlent d’eux-mêmes. Aux États-Unis en 2020, d’après une étude Pitney Bowes, l’entreprise a pour la première fois livré davantage de paquets (4,2 milliards) que le numéro 3 du marché, Fedex. Et il devrait très bientôt voler la seconde place à UPS derrière l’historique US Postal Service, toujours selon le dirigeant d’Amazon.
Comme à son habitude, Amazon choisit le développement interne
Pour réduire son empreinte emballage avec un tel volume de livraisons, pas question de lésiner sur les moyens. Et le géant a tout simplement décidé d’en appeler à l’IA. Dans un article de son blog consacré à la recherche Amazon Science, il explique ainsi comment le machine learning associé au traitement du langage naturel (NLP, natural language processing) et à la computer vision va lui permettre de réduire efficacement ses déchets d’emballage.
La puissance de frappe logistique d’Amazon ne tient en effet pas que de la taille de ses entrepôts ou de l’efficacité de sa place de marché. Le Gafa est à la fois un géant du e-commerce et de l’IT. Et son modèle consiste à développer en interne, pour lui seul, des solutions informatiques qui résolvent les problèmes complexes liés à ses activités. Outre son tout puissant cloud AWS (un tiers du marché mondial selon Synergy Research), il a aussi sa propre robotique, ses propres solutions de préparation de commande, etc. Parce qu’il est à la fois ce géant de l’informatique et de la logistique, Amazon prend le sujet du suremballage à bras le corps avec du deep learning multimodal entrainé à la fois par des données textes, des images issues d’un traitement en computer vision et des commentaires analysés en NLP.
Le deep learning comme mécanique prédictive
Matthew Bales co-auteur de l’article de recherche sur le sujet s’occupe du machine learning au sein de l’équipe Customer packaging experience d’Amazon se souvient sur le blog qu’en 2017, la société ne disposait d’aucun mécanisme capable d’évaluer des centaines de millions de produits et d’identifier le type d’emballage optimal pour chacun.
« Or, il faut une mécanique automatique à la pointe qui s’adapte à la volée aux changements de circonstances. » Le chercheur explique que l’entreprise disposait bien de statistiques a posteriori sur l’efficacité des livraisons. « Mais, ce que nous voulions c’est prédire le comportement d’un produit avec un type d’emballage moins protecteur, plus léger et plus durable, continue-t-il dans l’article de blog. Et quand on décide de s’orienter vers le « prédictif » de cette façon, on a besoin de deep learning. »
Le traitement du langage naturel dans les avis clients
L’équipe de recherche a d’abord entrainé son modèle avec les données textuelles des produits mis publiquement en ligne sur le site de e-commerce : nom, description, prix, dimensions, etc. Le géant dispose de millions de data de ce type. Mais, puisqu’il s’agissait de savoir comment livrer de façon plus durable, les ingénieurs ont aussi exploité les commentaires des consommateurs sur le bon état ou non du colis à l’arrivée. Si celui-ci est endommagé, Amazon récupère l’information quasiment en temps réel soit via le dispositif de retour, soit dans les commentaires du consommateur. Il analyse alors les textes avec une autre forme d’IA, le NLP pour en « comprendre » le contenu. L’équipe a par exemple identifié des mots clés dans les avis, directement liés au produit, à son état et à celui de son emballage, comme « céramique », « épicerie », « mug », « enveloppe rembourrée » ou « boîte ».
Ensuite, il a fallu intégrer en grande quantité les informations précises sur la façon dont les vendeurs de la place de marché emballent effectivement leurs produits avant de les envoyer vers les entrepôts Amazon. La réponse se trouve dans une 3e forme d’IA, la computer vision, autrement dit une analyse d’image capable d’en reconnaitre le contenu. Pas question cette fois d’utiliser la photo publiée sur le site qui ne correspond pas forcément à la réalité. Mais, il se trouve qu’Amazon utilise déjà la computer vision pour identifier dans ses entrepôts les dimensions et les défauts éventuels des colis. Résultat, il dispose d’une importante base d’images des paquets effectivement livrés sur ses sites de préparation de commande et de la façon dont ils sont emballés.
L’analyse d’images appliquées directement aux colis
L’IA détecte la forme du colis, repère les trous dans le carton, identifie les sacs autour des produits ou la lumière qui traverse une bouteille en verre. Prasanth Meiyappan, chercheur en sciences appliquées chez Amazon précise qu’il est difficile en revanche « pour un humain de savoir comment le modèle en tire des décisions, car les caractéristiques que l’algorithme identifie et les poids qu’il affecte à chacune sont difficiles à voir. Pour autant, ces décisions sont empiriquement justes. » L’ajout de ces données visuelles aux données textuelles aurait amélioré l’efficacité du modèle de deep learning de près de 30%, et donc celle de la prise de décision quant au packaging à utiliser. Les emballages considérés comme efficaces par l’IA sont directement certifiés. Les autres passeront par une vérification humaine.
Les équipes d’Amazon se sont néanmoins heurtées à un autre problème. L’efficacité d’un modèle de machine learning repose en particulier sur l’équilibre en volume entre les données concernant les solutions qui marchent et celles concernant des solutions qui ne marchent pas. En l’occurrence, des packagings efficaces et d’autres qui ne le sont pas. Les bases Amazon contiennent à peine 1% de data sur les solutions inefficaces sur l’ensemble. Les ingénieurs n’ont par ailleurs trouvé que trop peu de bases externes contenant ce type de data. Après plusieurs expérimentations, l’équipe a finalement appliqué une méthode en deux phases qui entraine d’abord l’algorithme à partir des données minoritaires avant de travailler sur l’ensemble de la base.
Une réduction de 36% du poids des emballages
Amazon développe et expérimente cette IA en Amérique du Nord et en Europe depuis près de 6 ans. Elle lui aurait déjà permis de réduire le poids de ses emballages de 36% pour chaque livraison et aurait permis de supprimer l’équivalent de 2 milliards de boîtes d’expédition. Prochaine étape pour les ingénieurs Amazon : mieux intégrer dans son modèle les différentes langues des commentaires des clients et les organisations logistiques des différents pays.
Emmanuelle Delsol