试图从网页中抓取 html,但没有为 Document.getClass 获取正确的类名/层次结构

止痛药

我正在尝试<a> some text </a>从网页中获取 3 个链接的文本,并且正在使用 Swift 方法,该方法使用 javascript 来获取 class/id/html 元素来抓取它。除了,我没有从 html 中获得正确的类或 id。

我尝试使用document.getElementsByClassName/Id所有类/id 并将其调用为我需要的类,但出现错误:

'document.getElementByClass('col-sm-12 col-md-9')', 'document.getElementByClass' is undefined

我不知道为什么。有人可以指出我解决这个问题的正确方向或指出我的错误吗?

func webView(_ webView: WKWebView, didFinish navigation: WKNavigation!) {

//I'm calling all the classes and ids
    webView.evaluateJavaScript("document.getElementByClass('col-sm-12 col-md-9').document.getElementById('content-top').getElementsByClassName('item hero-container item-container item-content tag-links')") {(result, error) in
        guard error == nil else {
            print(error!)
            return
        }

        print(String(describing: result))
    }
}
杰卡龙

没有getElementByClassDOM 函数。最接近的匹配将是getElementsByClassName(注意sName),但这将接受单个类,并返回一个数组。

你可能想document.querySelectorAll改用它,你可以直接给它一个完整的 CSS 选择器(所以你需要在类.和 ids 前加上前缀,并且#在同一个元素上没有为类留下空间:

document.querySelectorAll('.tag-links a')

如果页面中有一个带有 class 的元素,应该就足够tag-links了。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何从我试图在字符串中抓取的网页中获取 html?

bootstrap类没有为我的容器中的所有行加载

“没有为约束准备视图层次结构...”

为什么在Java 7中没有为ARM改装StAX类

没有为数据类中的参数“信息”传递值

从 HTML 中获取特定字符串以进行网页抓取

C没有为结构数组正确分配内存?

没有为UIAccessibilityElement获取正确的坐标

无法通过 python 网页抓取从 HTML 文件中提取 #document

哈姆雷特html没有为我的家庭路线处理程序正确注册<head>或<title>标签

DOMDocument saveHTML 没有为“IMG”、“INPUT”返回正确的 HTML 标准

网页抓取没有类或 ID 的表格

使用 rvest 抓取网页分页。分页路径没有出现在结构中

无法在已实现的方法中序列化结构,因为“没有为 `Self` 实现特性 `serde::Serialize`”

Entity Framework Core 3.1 没有为 SQLite 表中的实体属性生成正确的数据类型

HTML 类的网页抓取问题

Doxygen,图形类层次结构中没有任何显示

如何在 getClass().getResource() 中给出文件的正确路径

Intellij没有为Powershell选择正确的执行策略

ReactCSSTransitionGroup没有为转换转换正确设置动画

ggplot 没有为图表类别设置正确的颜色

列没有为移动视图正确调整大小

没有为Drupal正确配置目标目录

收到错误没有为类RCTRawText定义ViewManager

clojure:没有为类找到协议方法的实现

没有为“功能”类定义“监听”方法吗?

没有为类型类定义方法

即使添加了子视图,也没有为约束准备视图层次结构

“视图层次结构没有为约束准备”错误Swift 3