Парсинг на Python

Рави

Я хотел получить подпись, нет. лайков и комментариев к последним 10 изображениям конкретного пользователя. Используя приведенный ниже код, я просто могу получить последний.

Код:

from selenium import webdriver
from bs4 import BeautifulSoup
import json, time, re
phantomjs_path = r'C:\Users\ravi.janjwadia\Desktop\phantomjs-2.1.1-windows\bin\phantomjs.exe'
browser = webdriver.PhantomJS(phantomjs_path)
user = "barackobama"     
browser.get('https://instagram.com/' + user)
time.sleep(0.5)
soup = BeautifulSoup(browser.page_source, 'html.parser')
script_tag = soup.find('script',text=re.compile('window\._sharedData'))
shared_data = script_tag.string.partition('=')[-1].strip(' ;')
result = json.loads(shared_data)
print(result['entry_data']['ProfilePage'][0]['user']['media']['nodes'][0]['caption'])

Результат: ПОСЛЕДНИЙ ЗВОНОК: Войдите, чтобы получить шанс встретиться с президентом Обамой этим летом до крайнего срока, установленного сегодня вечером. → Ссылка в профиле.

Муносфера

В приведенном ниже коде вы получаете только первый узел (то есть первое изображение).

print(result['entry_data']['ProfilePage'][0]['user']['media']['nodes'][0]['caption'])

Чтобы получить информацию о последних 10 изображениях пользователя, попробуйте это.

recent_ten_nodes = result['entry_data']['ProfilePage'][0]['user']['media']['nodes'][:10]

Чтобы напечатать только подписи, количество лайков и комментариев.

for node in recent_ten_nodes:
    print node['caption']
    print node['likes']['count']
    print node['comments']['count'] 

Для сохранения этих значений вам решать, как их хранить.

Эта статья взята из Интернета, укажите источник при перепечатке.

Если есть какие-либо нарушения, пожалуйста, свяжитесь с[email protected] Удалить.

Отредактировано в
0

я говорю два предложения

0обзор
Войти в системуУчаствуйте в комментариях

Статьи по теме

Случайный лес на панельных данных с использованием Python

фигура Python, свойства которой принадлежат дочернему классу

Python находит максимальное количество строк времени

выбрать переменную через ввод (python)

Python заменяет слова, разделенные запятыми, в списке на значение словаря, если оно существует в ключе словаря

получение размера примитивных типов данных в Python

python: заменить элементы в списке условными

Могу ли я гарантировать, что метод базового класса python всегда вызывается

python сортировка отрицательных и / или десятичных буквенно-цифровых строк

вырезание диаграммы Вороного в Python

аннотации функций в Python

Лучшая практика для расширения списка (эффективности) в Python

Итератор python: почему это работает?

Можно ли сопоставить словарь с операциями с объектами в Python

Python Как инициализировать объект чтения в определении класса

Подушка Python неправильно генерирует изображение

Python: сортировка словаря списков

как запустить файл Python в другом каталоге

Python - отправка электронной почты с проблемой кодировки (апостроф)

Список строк разделения Python с использованием условного оператора for

Использование функции применения Python для добавления столбцов в фрейм данных?

Запуск процесса от имени другого пользователя из Python * и * печати кода завершения

Пропустить значение в функции диапазона в Python

Как установить пакет разработчика Python?

Удаление управляющих символов из строки в Python

Как создать индекс в замыкании вокруг функции синтаксического анализа в Python

Построить строку данных против целочисленного Python

Собирает ли Python мусор переменные, на которые больше не ссылаются, пока они находятся в области видимости функции?

Python: почему переменная может существовать сама по себе?

Python: выберите ключ, значения из словаря, соответствующие данному списку

TOP список

  1. 1

    Распределение Рэлея Curve_fit на Python

  2. 2

    How to click an array of links in puppeteer?

  3. 3

    (fields.E300) Поле определяет связь с моделью, которая либо не установлена, либо является абстрактной.

  4. 4

    Modbus Python Schneider PM5300

  5. 5

    Elasticsearch - Нечеткий поиск не дает предложения

  6. 6

    Как добавить Swagger в веб-API с поддержкой OData, работающий на ASP.NET Core 3.1

  7. 7

    TypeError: store.getState não é uma função. (Em 'store.getState ()', 'store.getState' é indefinido, como posso resolver esse problema?

  8. 8

    Перебирайте несколько столбцов в фрейме данных Panda и находите уникальные значения подсчета

  9. 9

    Проблемы со сборкой Python Image Registration Toolkit

  10. 10

    В типе Observable <unknown> отсутствуют следующие свойства из типа Promise <any>.

  11. 11

    Vue js CLI 2 импортирует и использует плагин javascript

  12. 12

    Автозаполнение с Java, Redis, Elastic Search, Монго

  13. 13

    Текущая ветка не настроена для извлечения В конфигурации не найдено значение для ключа branch.master.merge

  14. 14

    SQL Вычтите две строки друг от друга в одном столбце, чтобы получить результат

  15. 15

    How to normalize different curves drawn with geom = "step" when using stat_summary

  16. 16

    Merging legends in plotly subplot

  17. 17

    ViewPager2 мигает / перезагружается при смахивании

  18. 18

    Vue 2 / Vue CLI 3: создание асинхронных однофайловых компонентов

  19. 19

    как я могу удалить vue cli 2?

  20. 20

    Ошибка «LINK: фатальная ошибка LNK1123: сбой при преобразовании в COFF: файл недействителен или поврежден» после установки Visual Studio 2012 Release Preview

  21. 21

    Single legend for Plotly subplot for line plots created from two data frames in R

популярныйтег

файл