从基于Web的源将XML数据导入Google表格中

马特

我正在尝试构建一个Google表格,以从通过AWS S3托管的IRS Form 990存储库中提取信息。

这是XML文件:XML中的示例990表单

我正在执行的查询旨在从XML源中提取Schedule I部分下的公司名称。公司名称包装在BusinessNameLine1Txt标签中。

利用IMPORTXMLGoogle表格的内置功能,我构建了以下内容:

=IMPORTXML("https://s3.amazonaws.com/irs-form-990/201702299349300445_public.xml", "//Return/ReturnData/IRS990ScheduleI/RecipientTable/RecipientBusinessName/BusinessNameLine1Txt")

当我使用上面看到的参数执行函数时,我收到一条错误消息,指出导入的内容为空。我的XPATH查询不正确,还是与数据中的一些古怪行为有关?

Tanaike

这个修改怎么样?

=IMPORTXML(A1, "//*[local-name()='BusinessNameLine1Txt']")
  • https://s3.amazonaws.com/irs-form-990/201702299349300445_public.xml 放在“ A1”中。

结果:

在此处输入图片说明

参考:

如果我误解了您的问题,请告诉我。我想修改它。

编辑:

=IMPORTXML(A1, "//*[local-name()='IRS990ScheduleI']//*[local-name()='BusinessNameLine1Txt']")

结果:

在此处输入图片说明

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章