IDEQ: an improved diffusion model for the TSP - SCOOL
Rapport Année : 2024

IDEQ: an improved diffusion model for the TSP

Résumé

We investigate diffusion models to solve the Traveling Salesman Problem. Building on the recent DIFUSCO and T2TCO approaches, we propose IDEQ (constrained Inverse Diffusion and EQuivalence class-based retraining of diffusion models for combinatorial optimization). IDEQ improves the quality of the solutions by leveraging the constrained structure of the state space of the TSP. Another key component of IDEQ consists in replacing the last stages of DIFUSCO curriculum learning by considering a uniform distribution over the Hamiltonian tours whose orbits by the 2-opt operator converge to the optimal solution as the training objective. Our experiments show that IDEQ improves the state of the art for such neural network based techniques on synthetic instances. More importantly, our experiments show that IDEQ performs very well on the instances of the TSPlib, a reference benchmark in the TSP community: it matches the performance of the best heuristics, LKH3, being even able to obtain better solutions than LKH3 on 2 instances of the TSPlib defined on 1577 and 3795 cities. IDEQ obtains 0.3% optimality gap on TSP instances made of 500 cities, and 0.5% on TSP instances with 1000 cities. This sets a new SOTA for neural based methods solving the TSP. Moreover, IDEQ exhibits a lower variance and better scales-up with the number of cities with regards to DIFUSCO and T2TCO.
Nous étudions l’utilisation de modèles de diffusion pour résoudre le problème du voyageur de commerce. En s’appuyant sur DIFUSCO et T2TCO récemment publiés, nous proposons IDEQ (constrained Inverse Diffusion and EQuivalence class-based retraining of diffusion models for combinatorial optimization). IDEQ améliore la qualité des solutions trouvées pour le TSP en tirant partie de la structure de l’espace de recherche du TSP et sur la redéfinition de l’objectif d’apprentissage qui remplace la solution optimale par une distribution uniforme sur les tours hamiltoniens dont l’orbite par 2-opt converge vers celle-ci. Nos expériences montrent que IDEQ obtient d’excellentes performances sur la bibliothèque de problème TSPlib, une référence pour la communauté étudiant le TSP: IDEQ atteint des performances proches de la meilleure heuristique (LHK3), parvenant à obtenir de meilleurs tours que LHK3 sur deux instances de la TSPlib de taille 1577 et 3795. IDEQ obtient un écart à l’optimalité de 0,3% sur des instances de 500 villes, et de 0,5% sur des instances de 1000 villes. Cela représente le nouvel état de l’art pour les méthodes neuronales pour la résolution du TSP. De plus, les tours construits par IDEQ ont une variance faible et IDEQ passe mieux à l’échelle lorsque le nombre de villes augmente que DIFUSCO et T2TCO
Fichier principal
Vignette du fichier
RR-9958.pdf (752.53 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-04778946 , version 1 (28-11-2024)

Licence

Domaine public

Identifiants

  • HAL Id : hal-04778946 , version 1

Citer

Mickael Basson, Philippe Preux. IDEQ: an improved diffusion model for the TSP. RR-9558, INRIA Lille - Nord Europe. 2024. ⟨hal-04778946⟩
26 Consultations
15 Téléchargements

Partager

More