En utilisant diff pour trouver les parties de nombreux fichiers qui sont les mêmes? (Bizzaro-diff, ou diff inverse)

https://stackoverflow.com/questions/522221

22-08-2019
|

Question

Bizzaro-Diff !!!

Y at-il une suite à faire une Bizzaro / inverse diff qui affiche uniquement les parties d'un groupe de fichiers qui sont les mêmes? (À savoir beaucoup plus que trois fichiers )

question Odd, je sais ... mais je convertir des pages statiques anciens de quelqu'un à quelque chose un peu plus facile à gérer .

La solution

Vous voulez un détecteur de clone. Il détecte des morceaux de code similaires à travers grands systèmes sources. Voir notre outil de ClonedR: http://www.semdesigns.com/Products/Clone/index .html

Autres conseils

Vous pouvez essayer la commande comm ( commune ). Cela ne vous comparer 2 fichiers à la fois, mais vous devriez être en mesure de le faire avec des scripts 3+ intelligent.

Vous pouvez essayer sim . Vous connaissez quelques années depuis que je l'ai utilisé, mais je me souviens qu'il soit très utile lors de la recherche des similitudes dans un fichier ou dans plusieurs fichiers différents.

Ceci est un problème classique .

Si je devais rapide et sale, je ferais probablement quelque chose comme un diff -U 1000000 (en supposant une version de diff qui le soutient), canalisé par sed pour obtenir juste les lignes en commun (et la bande les espaces de début). Il faudrait boucle à travers tous les fichiers, bien que.

Edit: J'ai oublié il y a aussi mise en œuvre Tcl qui serait un peu plus polyvalent , mais nécessiterait plus de codage. Vous pourrez peut-être trouver une implémentation pour langue de votre choix.

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow