🧑💻Парсинг сайтов с помощью Python и Selenium
Посмотрев этот плейлист, вы научитесь менее, чем за полчаса, парсить веб-страницы любой сложности. Для этого вы будете использовать достаточно популярный и продвинутый инструмент, Selenium. Его плюс заключается не только в обширном функционале и возможности работать с веб-страницей интерактивно, но и в понятной и простой документации.
1. Информация о курсе
[0:56]
2. Установка Selenium и разбор основных функций
[5:02]
3. Работа с объектами на странице, заполнение форм
[7:46]
4. Юзер-агенты, работа в фоне и обход распознавания Selenium
[6:20]
5. Работа с прокси
[2:29]
6. Работа с cookies
[2:28]
7. Заключение и небольшой бонус
[1:16]
#python
# The standard string repr for dicts is hard to read:
»> my_mapping = {'a': 23, 'b': 42, 'c': 0xc0ffee}
»> my_mapping
{'b': 42, 'c': 12648430. 'a': 23} # 😞
# The "#json" module can do a much better job:
»> import json
»> print(json.dumps(my_mapping, indent=4, sort_keys=True))
{
"a": 23,
"b": 42,
"c": 12648430
}
# Note this only works with dicts containing
# primitive types (check out the "pprint" module):
»> json.dumps({all: 'yup'})
TypeError: keys must be a string
История(12м) как в Альфа-Банке сокращали размер JSON файла, который передается на устройство для работы SDUI. Решением стала шаблонизация для отказа от одинаковых блоков UI с разными данными
#оптимизация#json
¿Que puede hacer este bot?
@apimaniaBot
Con éste bot puedes crear PDF a partir de páginas web, convertir texto a imágenes, convertir tablas HTML a json y mucho más
Idioma: español
(Visto en @botsgram_cu)
#pdf#web#texto#imágenes#hrml#json