Extraia o texto do site usando Selenium e Python

acampamento

Quero extrair todo o texto de uma página da web específica.

Em JavaScript, o código se parece com este:

var webPage = require('webpage');
var page = webPage.create();

page.open('http://phantomjs.org', function (status) {
    console.log('Stripped down page text:\n' + page.plainText);
    phantom.exit();
});

Como posso executar page.plainText em Python?

Obrigado.

Davide Patti

Se você quiser fazer isso com o Selenium, você deve selecionar o elemento "superior" e depois chamar para getText().

Por exemplo, em Python:

driver = webdriver.PhantomJS(executable_path='pathTo/phantomjs')
driver.get('https://en.wikipedia.org/wiki/Selenium_(software)')
el = driver.find_element_by_tag_name('body')
print(el.text)
driver.close()

Este artigo é coletado da Internet.

Se houver alguma infração, entre em [email protected] Delete.

editar em
0

deixe-me dizer algumas palavras

0comentários
loginDepois de participar da revisão

Artigos relacionados

Extraia o texto na classe div usando Selenium e Python

Copie o texto do site usando Selenium para python

Como extrair o texto do HTML usando Selenium e Python

Extraia o conteúdo iFrame usando Selenium e BeautifulSoup

Selenium - Java - Extraia texto do site sem alteração na estrutura

Extraia o remetente do e-mail original do corpo do texto usando Regex em R

Python: extraia o texto do site que não está no HTML bruto

Extraia o nome de usuário e o email do arquivo de texto usando o powershell

Extraia o texto da página da web usando Selenium em Python

Extraia o URL do arquivo de texto e analise usando o Powershell

Extraia o texto do epub em Python

Como clicar em um botão no texto do link usando Selenium e Python

Como extrair o texto dentro do elemento usando Selenium WebDriver e Python?

Como extrair o texto 5 do nó de texto dentro do nó div pai usando Selenium e Python

Extraia texto (palavras) E endereço IP do texto

Extraia o texto do arquivo pdf usando o pdfplumber

Extraia palavras do texto usando dplyr e stringr

Extraia o hiperlink do site usando VBA enfrentando erros

Clique no botão por texto usando Python e Selenium

Como extrair o texto dos webelements usando Selenium e Python

Como clicar no elemento com texto como LOGIN de acordo com o site através do Selenium e Python?

Extraia o URL do link Angular JS usando Selenium WebDriver w Python

Raspar uma tabela de um site usando python e tentar obter o hiperlink de conteúdo com texto

Extraia uma parte do valor do texto da resposta e armazene-o em uma variável usando junit / reassured?

Extraia o texto da imagem usando MSER em Opencv python

Obtenha texto do site usando python

Pesquise um site usando o Excel vba com dados do Excel e extraia o estado ativo no fluxograma do resultado da pesquisa e mapeie-o em coluna

Como obter texto de uma seção de um site usando Selenium em Python 3

Como imprimir todo o texto do elemento anexado a um contador em linhas separadas usando Selenium e Python

TOP lista

  1. 1

    R Shiny: use HTML em funções (como textInput, checkboxGroupInput)

  2. 2

    O Chromium e o Firefox exibem as cores de maneira diferente e não sei qual deles está fazendo certo

  3. 3

    Como assinar digitalmente um documento PDF com assinatura e texto visíveis usando Java

  4. 4

    R Folheto. Dados de pontos de grupo em células para resumir muitos pontos de dados

  5. 5

    Gerenciar recurso shake de Windows Aero com barra de título personalizado

  6. 6

    Como obter dados API adequados para o aplicativo angular?

  7. 7

    UITextView não está exibindo texto longo

  8. 8

    Por que meus intervalos de confiança de 95% da minha regressão multivariada estão sendo plotados como uma linha de loess?

  9. 9

    Acessando relatório de campanhas na AdMob usando a API do Adsense

  10. 10

    Usando o plug-in Platform.js do Google

  11. 11

    Como posso modificar esse algoritmo de linha de visada para aceitar raios que passam pelos cantos?

  12. 12

    Dependência circular de diálogo personalizado

  13. 13

    Coloque uma caixa de texto HTML em uma imagem em uma posição fixa para site para desktop e celular

  14. 14

    iOS: como adicionar sombra projetada e sombra de traço no UIView?

  15. 15

    Como usar a caixa de diálogo de seleção de nomes com VBA para enviar e-mail para mais de um destinatário?

  16. 16

    Tabela CSS: barra de rolagem para a primeira coluna e largura automática para a coluna restante

  17. 17

    How to create dynamic navigation menu select from database using Codeigniter?

  18. 18

    Converter valores de linha SQL em colunas

  19. 19

    ChartJS, várias linhas no rótulo do gráfico de barras

  20. 20

    用@StyleableRes注释的getStyledAttributes。禁止警告

  21. 21

    não é possível adicionar dependência para com.google.android.gms.tasks.OnSuccessListener

quentelabel

Arquivo