scrapy_parser_pep — это Scrapy-парсер, предназначенный для сбора информации с официального сайта PEP (Python Enhancement Proposals): https://peps.python.org/.
Парсер собирает данные о каждом PEP-документе:
- номер PEP;
- название;
- актуальный статус (например, Active, Final, Rejected и др.).
После запуска паук pep выполняет следующие действия:
- Получает список всех PEP-документов со стартовой страницы.
- Переходит на каждую страницу PEP и извлекает актуальный статус.
- Сохраняет собранную информацию в два
.csv-файла в папкуresults/:pep_<дата>_<время>.csv— таблица всех PEP с номером, названием и статусом.status_summary_<дата>_<время>.csv— сводка по количеству документов в каждом статусе.
Создать виртуальное окружение и установить зависимости:
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txtЗапустить парсинг:
scrapy crawl pep- Python 3.9+
- Scrapy
- csv
Андрей Удалов — студент Яндекс Практикума по направлению Python Backend Developer. GitHub: mysunismine