IMPORTXML XPath_Query for Google Sheets

催化剂

我正在使用GoogleSheet的IMPORTXML功能来检索一年前的每个日历日期或可获得数据的最近一年的日期的数据。

这是数据示例(完整的数据源在这里):

 <entry>
    <id>http://data.treasury.gov/Feed.svc/DailyTreasuryYieldCurveRateData(6794)</id>
    <title type="text"></title>
    <updated>2018-02-06T22:05:38Z</updated>
    <author>
      <name />
    </author>
    <link rel="edit" title="DailyTreasuryYieldCurveRateDatum" href="DailyTreasuryYieldCurveRateData(6794)" />
    <category term="TreasuryDataWarehouseModel.DailyTreasuryYieldCurveRateDatum" scheme="http://schemas.microsoft.com/ado/2007/08/dataservices/scheme" />
    <content type="application/xml">
      <m:properties>
        <d:Id m:type="Edm.Int32">6794</d:Id>
        <d:NEW_DATE m:type="Edm.DateTime">2017-02-24T00:00:00</d:NEW_DATE>
        <d:BC_1MONTH m:type="Edm.Double">0.4</d:BC_1MONTH>
        <d:BC_3MONTH m:type="Edm.Double">0.52</d:BC_3MONTH>
        <d:BC_6MONTH m:type="Edm.Double">0.65</d:BC_6MONTH>
        <d:BC_1YEAR m:type="Edm.Double">0.8</d:BC_1YEAR>
        <d:BC_2YEAR m:type="Edm.Double">1.12</d:BC_2YEAR>
        <d:BC_3YEAR m:type="Edm.Double">1.38</d:BC_3YEAR>
        <d:BC_5YEAR m:type="Edm.Double">1.8</d:BC_5YEAR>
        <d:BC_7YEAR m:type="Edm.Double">2.12</d:BC_7YEAR>
        <d:BC_10YEAR m:type="Edm.Double">2.31</d:BC_10YEAR>
        <d:BC_20YEAR m:type="Edm.Double">2.69</d:BC_20YEAR>
        <d:BC_30YEAR m:type="Edm.Double">2.95</d:BC_30YEAR>
        <d:BC_30YEARDISPLAY m:type="Edm.Double">2.95</d:BC_30YEARDISPLAY>
      </m:properties>
    </content>
  </entry>
  <entry>
    <id>http://data.treasury.gov/Feed.svc/DailyTreasuryYieldCurveRateData(6795)</id>
    <title type="text"></title>
    <updated>2018-02-06T22:05:38Z</updated>
    <author>
      <name />
    </author>
    <link rel="edit" title="DailyTreasuryYieldCurveRateDatum" href="DailyTreasuryYieldCurveRateData(6795)" />
    <category term="TreasuryDataWarehouseModel.DailyTreasuryYieldCurveRateDatum" scheme="http://schemas.microsoft.com/ado/2007/08/dataservices/scheme" />
    <content type="application/xml">
      <m:properties>
        <d:Id m:type="Edm.Int32">6795</d:Id>
        <d:NEW_DATE m:type="Edm.DateTime">2017-02-27T00:00:00</d:NEW_DATE>
        <d:BC_1MONTH m:type="Edm.Double">0.44</d:BC_1MONTH>
        <d:BC_3MONTH m:type="Edm.Double">0.5</d:BC_3MONTH>
        <d:BC_6MONTH m:type="Edm.Double">0.68</d:BC_6MONTH>
        <d:BC_1YEAR m:type="Edm.Double">0.81</d:BC_1YEAR>
        <d:BC_2YEAR m:type="Edm.Double">1.2</d:BC_2YEAR>
        <d:BC_3YEAR m:type="Edm.Double">1.46</d:BC_3YEAR>
        <d:BC_5YEAR m:type="Edm.Double">1.87</d:BC_5YEAR>
        <d:BC_7YEAR m:type="Edm.Double">2.18</d:BC_7YEAR>
        <d:BC_10YEAR m:type="Edm.Double">2.36</d:BC_10YEAR>
        <d:BC_20YEAR m:type="Edm.Double">2.72</d:BC_20YEAR>
        <d:BC_30YEAR m:type="Edm.Double">2.98</d:BC_30YEAR>
        <d:BC_30YEARDISPLAY m:type="Edm.Double">2.98</d:BC_30YEARDISPLAY>
      </m:properties>
    </content>
  </entry>
  <entry>

这是我当前用于检索2017年2月27日数据的XPath查询:

//*[local-name() = 'NEW_DATE'][text() = '2017-02-27T00:00:00']/..

这是显示的结果:

6795    2017-02-27T00:00:00 0.44    0.5 0.68    0.81    1.2 1.46    1.87    2.18    2.36    2.72    2.98    2.98

有没有办法:

  1. 检索显示的所有数据,除了“ d:Id”元素(上面的“ 6795”)和
  2. 如果搜索没有数据的日期(例如,2017年2月25日将导致“#N / A”错误,因为查询将对丢失的日期不返回任何内容),查询将默认为下一个可用的远期日期(例如2017年2月27日)?

我避免使用IF函数以减少IMPORTXML呼叫次数。

催化剂

由于谷歌表(GS)似乎只有XPath 1.0中兼容(它的文档和产品论坛网页这里这里不确认或澄清版本(S)支持,因为这日),替代方法,如XPath 2.0中IF-THEN-ELSE陈述无法使用取而代之的是,可以使用GS本机功能过滤搜索到的源XML数据。

问题1

按照@Tanaike提出的解决方案,检索元素的所有子节点(保存一个)可以使用XPath“ not”命令来完成,即!,如下所述,应用于“ NEW_DATE”的父元素,而忽略子元素“ Id” 。TRANSPOSE用于以柱状形式显示它。(A1是包含问题中源XML URL的单元格。)

=TRANSPOSE(IMPORTXML(A1, "//*[local-name() = 'NEW_DATE'][text() = '2017-02-25T00:00:00']/../*[local-name()!='Id']"))

问题2

要搜索一年前的特定日期,并在该日期的数据丢失的情况下,要检索最接近的远期日期,需要嵌套的GS函数首先使用上述公式检索“ NEW_DATE”数据,然后使用SORT以及MATCH最接近的可用日期。INDEX然后,功能用于反向排序的元素以选择适当的日期。CONCATENATETEXTTODAY功能只是用来设置与XML数据兼容的格式与去年同期的日期。公式如下。

=TRANSPOSE(IMPORTXML(A1,CONCATENATE("//*[local-name() = 'NEW_DATE'][text() = '",INDEX(SORT(IMPORTXML(A1, "//*[local-name() = 'NEW_DATE']"),1,FALSE),MATCH(CONCATENATE(TEXT(TODAY()-365,"YYYY-MM-DD"),"T00:00:00"),SORT(IMPORTXML(A1, "//*[local-name() = 'NEW_DATE']"),1,FALSE),-1)),"']/../*[local-name()! = 'Id']")))

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

Google Sheets Importxml 不导入纯文本

Coinmarketcap.com 上的 Google Sheets ImportXML

Google Sheets ImportXml() 从表中提取数据

Web Scraping Google-Sheets ImportXML - xpath - URL 中的特定數字

Google表格中的importxml xpath

Xpath查询帮助Google ImportXML

Google Sheets importXML 不适用于 youtube URL

Google Sheets ImportXML 返回“未找到 URL 上的资源”错误

使用 Google Sheets 上的 ImportXML 函数获取网页的发布日期

Google Sheets 和 ImportXML - 缩小结果范围

包含包含的IMPORTXML Xpath(Google表格)

Google表格和XPath中的IMPORTXML

Google表格中的ImportXML XPath URL

Google表格ImportXML XPath返回#N / A

用于Google importXML函数的XPath查询

Google Sheets - 使用多個 IMPORTXML 請求構建動態數組

Google Spreadsheets ImportXML / XPath-图像损坏的输出

XPath,用于在Google表格中使用ImportXML的<address>标记

Google表格importxml中XPath中的多个索引

请协助解决Google表格ImportXML函数的XPath问题

使用Google表格进行网页抓取。Importxml函数xpath校正

在Google Spreadsheet中将ImportXML与XPath结合使用的Phantom <span>元素

Google XPATH importxml可以找到“ show”,但找不到“ showcount”或“ count”

Google电子表格ImportXML的简单Xpath

Google电子表格中的Xpath或Importxml

Google表格上的IMPORTxml

Google表格IMPORTXML查询

使用 ImportXML 从 goodreads.com 将书名导入 Google Sheets 有时会出现“导入内部错误”

importXML中的Xpath命令