Недавно я прочитал эту статью о том, как очистить профиль участников сообщества Inbound.org с помощью Excel. И вы можете посмотреть видео здесь, если вам так больше нравится.

Со времени выпуска этого учебного пособия структура входящего веб-сайта немного изменилась, как вы можете видеть на минуте 11:00 в видео. Если вы попытаетесь скопировать XPath значков социальных сетей, то это выглядит немного иначе, и из-за этого я не удалось извлечь эту информацию.

Вот что я получаю сейчас:

/html/body/div[3]/div/div/div[1]/div/div[2]/a[1]/i

Вот как я написал синтаксис в Excel:

=XPathOnUrl(A2,"//a[@class='twitter']","href")

А потом вот так:

=XPathOnUrl(A2,"//a[contains(@class,twitter)]/@href")

Хотя я пытался разными способами, ни один из них не показал мне ссылку на профиль участника в социальных сетях.

Я даже пытался изменить xpath несколькими способами, чтобы получить разные данные со страницы, но ни одна из них не была информацией из социальных сетей:

=XPathOnUrl(A2,"//*[contains(@class,member-banner-tagline)]/div[2]/div/div/div[1]/div/div[1]")

=XPathOnUrl(A2,"//*[contains(@class,member-banner-tagline)]/div[2]/div/div/div[1]/div/h1")

Я, честно говоря, не знаю, что попробовать, что-то не так, и я не могу понять это. Кто-нибудь имеет достаточно опыта с этим или может определить проблему здесь с моим синтаксисом?

большое спасибо

1 ответ1

0

По словам Firefox/Firebug, уникальный URL-адрес XPath для пользователей в Twitter:

/html/body/div[2]/div/div/div[1]/div/div[2]/a[1]

Что немного отличается от вашей первой попытки. NB: я исправил свою первую попытку, вы не хотите, чтобы /i в конце, или вы получаете внутренний элемент, а не <a> с URL-адресом на нем.

Но тогда ваша вторая попытка определенно найдет правильный HTML-элемент, содержащий URL, и он будет более надежным.

Ваша третья попытка не работает с XPathOnUrl, хотя она работает в Google Docs ImportXML, поскольку она не поддерживает синтаксис атрибута.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .