Как найти два похожих файла?

Есть много файлов. У них разные названия, состоящие из нескольких слов.
Нужно найти пару файлов, в названиях которых есть одно и то же слово.
У правильных файлов слово повторяется всего два раза, если среди всех файлов это слово совпадает с тремя и больше файлами, то мимо.
Есть ли программа, или какой-то способ рассортировать файлы по количеству повторений слова среди всех названий файлов?
Пока нашёл промежуточный вариант: собрать все имена файлов в список, затем искать в тексте списка повторяющиеся слова и сортировать их по количеству повторений через частотный анализ текста.

Спасибо Виталию за рабочий скрипт, вопрос можно считать решённым.

4
35 комментариев