Привет у меня есть лист Excel, который был экспортирован непосредственно из базы данных. Это включает в себя различные строки, некоторые из которых являются HTML-тегами. Я хочу удалить все ссылки теги пример

(<a href="mylink" target="_blank">

но оставьте все остальные строки без изменений. Я пытался сделать это с поиском и заменой, но я не могу найти Regex, который будет делать это, а также работать в Excel. Я обыскивал сеть, но не смог найти решение этой проблемы.

Если я сделаю это

<a href*>

он удалит почти все содержимое электронной таблицы, поскольку он перейдет к последнему закрывающему тегу, который сможет найти. Есть ли способ повторить мой поиск, чтобы получить следующий закрывающий тег, а не последний?

1 ответ1

0

Самый простой, то есть единственный хороший способ, о котором я знаю, это использование Lynx, старого веб-браузера в текстовом режиме:
lynx --dump URL_or_HTML-file
- но тогда вам нужно найти способ запустить его в Windows (например, Cygwin или WSL).

Ох ... еще одна вещь: вы должны понять; то, что вы просите, по сути, веб-браузер во всей его красе.

Рысь такова, даже с присущим ей ограничением и недостатком.

Пример:

$ lynx --dump www.google.se

   Sök [1]Bilder [2]Maps [3]Play [4]YouTube [5]Nyheter [6]Gmail [7]Drive
   [8]Mer »
   [9]Webbhistorik | [10]Inställningar | [11]Logga in

   Google

     _______________________________________________________
   Sök på Google  Jag har tur    [12]Avancerad sökning
      [13]Språkverktyg

   Google på: [14]English

   [15]Annonsera med Google     [16]Företagslösningar     [17]+Google
   [18]Allt om Google     [19]Google.com

                    © 2019 - [20]Sekretess - [21]Villkor

References

   1. http://www.google.se/imghp?hl=sv&tab=wi
   2. http://maps.google.se/maps?hl=sv&tab=wl
   3. https://play.google.com/?hl=sv&tab=w8
   4. http://www.youtube.com/?gl=SE&tab=w1
   5. http://news.google.se/nwshp?hl=sv&tab=wn
   6. https://mail.google.com/mail/?tab=wm
   7. https://drive.google.com/?tab=wo
   8. https://www.google.se/intl/sv/about/products?tab=wh
   9. http://www.google.se/history/optout?hl=sv
  10. http://www.google.se/preferences?hl=sv
  11. https://accounts.google.com/ServiceLogin?hl=sv&passive=true&continue=http://www.google.se/
  12. http://www.google.se/advanced_search?hl=sv&authuser=0
  13. http://www.google.se/language_tools?hl=sv&authuser=0
  14. http://www.google.se/setprefs?sig=0_aqHPilDIYLLsVqHCw93WtOpJW0k=&hl=en&source=homepage&sa=X&ved=0ahUKEwifvrHulZHgAhXGjywKHVziBaIQ2ZgBCAQ
  15. http://www.google.se/intl/sv/ads/
  16. http://www.google.se/intl/sv/services/
  17. https://plus.google.com/103822168634868962761
  18. http://www.google.se/intl/sv/about.html
  19. http://www.google.se/setprefdomain?prefdom=US&sig=K_KnzY40g4UTDMelz-_ON-EEbQQGM=
  20. http://www.google.se/intl/sv/policies/privacy/
  21. http://www.google.se/intl/sv/policies/terms/

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .