Я попытался ввести заголовок сообщения на этом веб-сайте: https://www.hortidaily.com/sector/553/greenhouse/
с помощью функции Google Sheets Importxml.
Все сообщения написаны в одном формате:
<a class="article" href="link1">
<img src="img1.jpg" align="default" border="0" class="indexdefault">
<h1>Titre1</h1>
<p>Texte1</p>
</a>
Функция ImportXML с Xpath =:
- // a [@class = 'article'] / @ href return link1: ok
- // a [@class = 'article'] [1] / img / @ src return img1: ok
- // a [@class = 'article'] [1] / h1 return #NA (импортированный контент пуст), хотя XPath работает в chrome XPath Helper ...
Хотя // h1 [1] возвращает заголовок первой статьи, проблема: я не понимаю, почему // a [@class = 'article'] [1] / h1 не работает, и я хочу быть уверен, что h1 Я получаю h1 под первым <a class="article" href="link1">
Я перепробовал почти все, что мог представить, не нашел проблемы. Мне нужна помощь !
заранее спасибо
h1
в 1-м a[@class ='article']
.//a[@class ='article'][1]/h1
возвращается #NA
.Если я правильно понимаю, как насчет этого ответа?
<div id="hoofdartikelen">
<a class="article" href="link1">
<img src="img1.jpg" align="default" border="0" class="indexdefault">
<h1>Titre1</h1>
<p>Texte1</p>
</a>
</div>
В моем исследовании, для приведенных выше данных HTML, кажется , что имя тега a
из <a class="article" href="link1">
является проблемой. Например, когда имя тега изменено на div
, это может подтвердить, что =IMPORTXML(A1,"//div[@class ='article'][1]/h1")
сработало.
Кроме того, похоже, что в приведенном выше HTML теги h1
и p
не являются дочерними элементами тега a
. Итак, работают следующие формулы.
=IMPORTXML(A1,"//div[@id='hoofdartikelen']/h1[1]")
=IMPORTXML(A1,"//div[@id='hoofdartikelen']/p[1]")
Но =IMPORTXML(A1,"//div[@id='hoofdartikelen']/img[1]/@src")
не работает. Это требуется =IMPORTXML(A1,"//div[@id='hoofdartikelen']/a[1]/img/@src")
. Похоже, что тег img
является дочерним элементом a
.
Из приведенных выше результатов в вашем случае я думаю, что следующие образцы xpath могут подойти.
//div[@id='hoofdartikelen']/h1[1]
//h1[1]
//a[@class ='article']/../h1[1]
Эта статья взята из Интернета, укажите источник при перепечатке.
Если есть какие-либо нарушения, пожалуйста, свяжитесь с[email protected] Удалить.
я говорю два предложения