Je pense que c'est beaucoup plus subtil que ce que laisse sous-entendre l'article, notamment par le fait que le réseau neuronal est constitué de "10 à 30 layers", c'est vraiment imprécis, et c'est typiquement ce qui permet de placer un tel algo entre un overfit et un foirage total (simple exemple : faire un réseau neuronal pour apprendre des XOR en série, et voir l'impact du nombre de couches).
Je ne serai pas étonné que toute la "puissance" de leur algorithme repose sur un autre algo qui calcule et calibre le nombre de couches.