Скачайте Text Crawler (это бесплатно) и установите его. Запустите его после завершения установки. В поле «Имя файла / фильтр» введите «* .htm * .html * .php» или любые другие расширения файлов HTML, которые вы анализируете. В поле "Местоположение начала" перейдите в каталог, в котором находятся файлы. По умолчанию он также сканирует подкаталоги. Если вы не хотите использовать эту функцию, вы можете нажать "Опции" и отменить выбор "Сканировать подпапки". В поле Найти введите:
<a.*?href\s*=\s*["'](.*?)['"].*?>(.*?)</a>
Убедитесь, что рядом с надписью "Использовать регулярные выражения" установлен флажок. Затем нажмите "Найти". Он покажет вам все ссылки, сгруппированные по файлам, в которых они находятся. Вы также можете нажать "Извлечь", после чего появится окно со всеми ссылками со всех файлов. Так как вы заявили, что хотите ссылки, я понял, вы хотите, чтобы все
<a href="something.php">Something</a>
так что вы можете увидеть, куда указывает ссылка и каково описание. Если вам нужна только ссылка без целого тега, измените RegEx на
href=[\"\'](http:\/\/|\.\/|\/)?\w+(\.\w+)*(\/\w+(\.\w+)?)*(\/|\?\w*=\w*(&\w*=\w*)*)?[\"\']
который вернется
href="something.php"
Дайте мне знать, если это ответит на ваш вопрос. TextCrawler - отличное приложение, и, поскольку оно бесплатное, его стоит попробовать.