这项工作通过调整适合常规TSP的最新方法,使用深入的加固学习(DRL)提出了使用优先限制(TSPPC)的解决方案。这些方法共有的是基于多头注意(MHA)层的图形模型的使用。解决拾取和交付问题(PDP)的一个想法是使用异质注意来嵌入每个节点可以扮演的不同可能的角色。在这项工作中,我们将这种异质注意的概念推广到TSPPC。此外,我们适应了最近的想法,以使注意力稀疏以获得更好的可扩展性。总体而言,我们通过对解决TSPPC的最新DRL方法的应用和评估为研究界做出了贡献。
translated by 谷歌翻译