分类同一网页的不同版本

用户名

有一个网页在加载时会随机使用表格/控件/谷歌广告。但是,该集合是封闭的-根据我的测试,至少存在三种可能的变体,其中两种非常普遍,而第三种非常罕见。

我希望能够根据每个变体对该网页进行分类。我尝试分析每个变体的html源,但是根据Python字符串等于和Python difflib,所有变体的html都完全相同。似乎没有任何信息指定将Google广告或控件放置在何处。

例如,考虑具有两个框的图片,一个红色框(称为框A)和一个蓝色框(称为框B)。盒子本身永远不会改变位置,但是占据它们位置的东西却会改变。

现在考虑两种可能的变体,每次加载/打开网页时都选择其中一种。

变体1:假设有50%的时间,google广告位于框A(红色框),因此网站控件位于框B(蓝色框)。

变体2:假设也有50%的时间,google广告位于框B(蓝色框),因此网站控件位于框A(红色框)。

因此,如果我加载网页,如何根据其变化对其进行分类?

杰森

如果每次的HTML绝对相同,则可能是在客户端使用javascript进行了变体。

答案取决于您所说的“分类”。如果您只想知道在页面的任何给定负载下小部件的位置,您可能必须使用Selenium之类的东西,实际上可以在浏览器中打开页面并运行javascript,而不仅仅是获取HTML源代码。然后,您将需要使用Selenium评估一些可检测窗口小部件位置的JavaScript。seleniumpython有一个非常简单易用模块。考虑将其连接到PhantomJS,因此您不必打开浏览器窗口。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

是什么导致同一网页的文本在不同分辨率的屏幕上以不同的方式显示?

量角器无法在同一网页中标识不同div中的定位器

如何在同一网页上使用多个具有不同图像的自举超大子?

在同一网页中生成2个DOM树

如何将screenrotation固定到同一网页

从 AJAX 调用接收数据后在同一网页上显示接收到的数据

在同一网页上出现2个分页错误

ASP.NET MVC 运行同一网页的多个实例

如何在同一网页上打印帖子数据?

有没有一种方法可以链接我的菜单按钮,以便可以滚动到同一网页上的不同部分?

在Google Chrome中另存为PDF时,为什么同一网页具有不同的字体大小?

如何使用mod_rewrite使用get变量重定向到同一网页?

同一网页上的两个jQuery对话框出现问题

html-如何在原始内容顶部的图层中打开同一网页中的图像

在同一网页上使用多个audio.js播放列表播放器?

如何在同一网页中两次使用相同的JavaScript小部件?

如何在JMeter中使用断言确认在同一网页上两次显示的文本

如何在同一网页上添加第二个幻灯片

如何在同一网页上的HTML表中显示数据库中的php结果(在一个脚本中)

有没有办法可以在同一网页内获得2个完全隔离的javascript上下文?

将指向同一服务器的不同域重定向到同一网站的不同版本

WordPress:同一网址中有多个分类法

获取同一网络中网页的源代码

是否可以为同一网格中的不同块声明不同的共享内存?

比较同一网站的两个版本

使用jQuery $ .post()方法获取另一网页的一部分

硒与美丽的汤返回不同的LEN()在同一网站刮(亚马逊)值

反应路由器 同一网址中的不同组件

两条通过不同接口到达同一网络的路由