Пишу код, который читает город. Разрабатываю решения для извлечения, нормализации и анализа открытых данных: от градостроительных планов до судебных решений. Публиковался в «Деловом Петербурге» и на Хабре.
📍 Санкт-Петербург (гибрид / удалённо)
📬 @alfablen | 📧 alfablend@gmail.com
🔗 GitHub | Хабр | Публикации в «ДП»
rostral.io — инженерный MVP-проект на Python с GPT4All API, модульной архитектурой и полноценной документацией.
Цель: создание системы для семантической обработки документов и автоматизированной аналитики.
🔗 Репозиторий | Статья на Хабре | Спецификация
- CLI-интерфейс, с модульной логикой пайплайнов
- Нормализация PDF/HTML-документов и извлечение метаданных
- Интеграция GPT4All — чат с документами, вопросы к фрагментам
- Архитектурная спецификация: фолбэки, маршруты, зоны ответственности
- Документация в Markdown, roadmap по RAG и Telegram-интерфейсу
- Система ориентирована на прикладную обработку документов — от жилищного мониторинга до теханализа
- Открытый код, прозрачная логика, потенциальная масштабируемость для мультиагентных систем
Система автоматического мониторинга градостроительной документации Петербурга
→ Репозиторий vkpmonbot
Что делает:
- Следит за разрешениями на строительство, градпланами, согласованиями и экспертизами
- Парсит HTML/PDF, извлекает текст и изображения
- Отображает результаты на карте OpenStreetMap
- Отправляет уведомления через Telegram-бота
- Обеспечивает веб-интерфейс и поддержку подписок по типу документа
Технологии: Python, Flask, BeautifulSoup, PyPDF2, OCRmyPDF, SQLite, rosreestr2coord, telebot, cron, threading
Анализ проектной активности в охраняемом центре: сопоставление градпланов (ГПЗУ) и зданий (памятники, средовые).
→ Код | Статья
Что делает:
- Загружает объекты культурного наследия и участки с ГПЗУ
- Производит spatial join (пересечение зданий с участками)
- Визуализирует интерактивную карту и собирает статистику
- Даёт вывод: ~17% охраняемых зданий попали под проектирование
Технологии: Pandas, GeoPandas, shapely, folium, rosreestr2coord, WFS/WKT, spatial join
Что внутри:
- Чёткое техническое задание на нормализацию и определение поясов
- Примеры данных, каскадная логика, фолбэки, DQ-требования
- Формат: Markdown + JSON, готово к реализации
📁 Репозиторий: tz-detection-spec
🔄 changedetection.io
: добавление переменных в POST-запросы
→ Issue #2502 | Merged in #2740
Инициировал поддержку Jinja2-переменных в теле POST-запросов.
📌 Использовалось для мониторинга сайта Госстройнадзора СПб, где требовалась передача текущей даты в запросах для получения актуальной информации.
🧯 Отключения ГВС: выгрузка графиков с сайтов Теплосети и ТЭК
→ Статья | Код
🎬 Кино в Петербурге: где и что снимают
→ Читать
🛣️ Трасса М–7: какие дома попадут под снос
→ Читать
🏬 Магазины с алкоголем в жилом фонде
→ Читать
🧽 Трекинг коммунальной техники (WebSocket)
→ Читать
📄 20 000 HTML-отчётов по капремонту
→ Хабр
📎 Полный список из 17+ кейсов со ссылками
alfablend.github.io
: визуализации, карты
Компонент | Технологии |
---|---|
Backend | Flask, SQLite, cron, threading, logging |
Парсинг и OCR | BeautifulSoup4, PyPDF2, OCRmyPDF, Regex |
AI/LLM | GPT4All (saiga_yandexgpt_8b.gguf) |
Обработка данных | Pandas, Geopandas, osmnx, Pyrosm |
Визуализация | Folium, matplotlib, rosreestr2coord |
Интеграции | Telegram Bot API, Kontur.Focus, DaData, API КГА |
🛰️ Мониторинг сайтов | changedetection.io (инициировал поддержку Jinja2-переменных в POST — issue) |
Инфраструктура | Docker, REST, cron, WebSocket |
Используется, например, для мониторинга сайта Госстройнадзора СПб, где обновления зависят от параметров текущей даты в теле запроса.
Хочу развиваться как Python backend или Data Engineer: API, интеграции, обработка текстов и пространственных данных, визуализация, автоматизация. Уверенно работаю с неструктурированными источниками и превращаю данные в результат — будь то Telegram-бот, карта или CSV. Открыт к интересным задачам и развитию в команде.
📬 @alfablen | 📧 alfablend@gmail.com