这是indexloc提供的服务,不要输入任何密码
Skip to content

mysunismine/pep_parser

Repository files navigation

scrapy_parser_pep

Описание проекта

scrapy_parser_pep — это Scrapy-парсер, предназначенный для сбора информации с официального сайта PEP (Python Enhancement Proposals): https://peps.python.org/.

Парсер собирает данные о каждом PEP-документе:

  • номер PEP;
  • название;
  • актуальный статус (например, Active, Final, Rejected и др.).

Что делает парсер

После запуска паук pep выполняет следующие действия:

  1. Получает список всех PEP-документов со стартовой страницы.
  2. Переходит на каждую страницу PEP и извлекает актуальный статус.
  3. Сохраняет собранную информацию в два .csv-файла в папку results/:
    • pep_<дата>_<время>.csv — таблица всех PEP с номером, названием и статусом.
    • status_summary_<дата>_<время>.csv — сводка по количеству документов в каждом статусе.

Пример запуска

Создать виртуальное окружение и установить зависимости:

python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt

Запустить парсинг:

scrapy crawl pep

Технологии

  • Python 3.9+
  • Scrapy
  • csv

Об авторе

Андрей Удалов — студент Яндекс Практикума по направлению Python Backend Developer. GitHub: mysunismine

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages