1

У меня есть строка, как показано ниже

https://website.com/BTAE/2015/BTAE назначение jan 15.pdf²0ÔË '\„QI„ “ÙP¾ ^ ŒŸZ ‡ @ Æ *] Ü. ^‚ vðƒ € Ù¾ »©š © Šñ' € é • ªÂIR # œÉgÉÛ ^ gMdÉ% 9¬e˜Hžôb¿'0 <î © ˜ô?lþzk… éÃÄórÈ; EW¦K³1… ²ì¶ZFžŠÒô * ÄÖ \ã] »'{ÂMçí¦DêiÁßÅÁ½:n„ q¹1ÙDRó = ± {{EDûEb @ N5tÍ ›, §ààká @ ¡;í®§ä ‡ ÕYÈ <¸ ^ WÐPÁ'4îÖƒÔ '… ÷ f · qhttps://webservices.ignou.ac.in/assignments/BTAE/2015/BTAE назначение jan 15.pdf https://website.com/BTAE/2015/base-005.pdf

Мне нужно получить URL-адреса всех файлов PDF, DOC из строки.

Я новичок в SHELL SCRIPT и много искал, но безуспешно.

1 ответ1

2

Вы можете сделать что-то вроде этого:

grep --only-matching -P "http.*?\.(pdf|doc)" myfile.pdf

Выход для вашего образца:

https://website.com/BTAE/2015/BTAE assignment jan 15.pdf
https://webservices.ignou.ac.in/assignments/BTAE/2015/BTAE assignment jan 15.pdf
https://website.com/BTAE/2015/base-005.pdf

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .