scrapy_parser_pep

Описание проекта

scrapy_parser_pep — это Scrapy-парсер, предназначенный для сбора информации с официального сайта PEP (Python Enhancement Proposals): https://peps.python.org/.

Парсер собирает данные о каждом PEP-документе:

номер PEP;
название;
актуальный статус (например, Active, Final, Rejected и др.).

Что делает парсер

После запуска паук pep выполняет следующие действия:

Получает список всех PEP-документов со стартовой страницы.
Переходит на каждую страницу PEP и извлекает актуальный статус.
Сохраняет собранную информацию в два .csv-файла в папку results/:
- pep_<дата>_<время>.csv — таблица всех PEP с номером, названием и статусом.
- status_summary_<дата>_<время>.csv — сводка по количеству документов в каждом статусе.

Пример запуска

Создать виртуальное окружение и установить зависимости:

python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt

Запустить парсинг:

scrapy crawl pep

Технологии

Python 3.9+
Scrapy
csv

Об авторе

Андрей Удалов — студент Яндекс Практикума по направлению Python Backend Developer. GitHub: mysunismine

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
.github/workflows		.github/workflows
pep_parse		pep_parse
results		results
tests		tests
.flake8		.flake8
.gitignore		.gitignore
README.md		README.md
pytest.ini		pytest.ini
requirements.txt		requirements.txt
scrapy.cfg		scrapy.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

scrapy_parser_pep

Описание проекта

Что делает парсер

Пример запуска

Технологии

Об авторе

About

Uh oh!

Releases

Packages

Languages

mysunismine/pep_parser

Folders and files

Latest commit

History

Repository files navigation

scrapy_parser_pep

Описание проекта

Что делает парсер

Пример запуска

Технологии

Об авторе

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages