+
Skip to content
View SalimM21's full-sized avatar
🏠
Working from home
🏠
Working from home

Block or report SalimM21

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
SalimM21/README.md

Greetings ✨, I'm Salim MAJIDE

Typing SVG

🙋‍♂ About Me

Data Enthusiast
As a Data Engineer, I create robust and scalable data architectures, optimize queries, and ensure data integrity across large-scale systems. My expertise includes relational & NoSQL databases, real-time data pipelines with Apache Kafka, Big Data processing with Spark, and automated deployments in Kubernetes. I’ve developed intelligent solutions such as an email filtering system for secure communications and DiabetoWeb, a medical decision-support tool for diabetes risk assessment, while delivering efficient solutions for business intelligence and predictive analytics.

🔭 Currently Working On

  • ⚡ Optimized ETL pipeline with Apache Spark for real-time IoT analytics
  • 📑 NLP model to classify legal documents

🌱 Learning

  • 🔹 MLOps with MLflow and Kubeflow
  • 🔹 BigQuery query optimization

👯 Collaborating On

  • 📊 Open-source data visualization projects
  • 🧠 LLM model benchmarks

🤔 Seeking Help With

  • 🚀 Advanced orchestration with Apache Airflow
  • 📦 Feature store implementation

💬 Ask Me About

  • 🧹 Data cleaning with Pandas
  • 📐 Best practices in data modeling

📂 Projects Portfolio

🚀 Here are some of my database projects:

Project Description Tech Stack
DiabetoWeb Web app sécurisée pour aider les médecins à évaluer le risque de diabète, combinant gestion de données et ML Python Django Pandas ML JWT Swagger Docker Streamlit
Filtrage-Emails Système intelligent de détection de spam/malware Python Scikit-learn NumPy GridSearchCV Pandas
Sentiment Analysis API API REST et page web pour analyse de sentiments via Hugging Face Python FastAPI HuggingFace Docker Gradio
Big Data Apps Deployment in Kubernetes Automatisation du déploiement d’applications Big Data dans Kubernetes Kubernetes Docker Terraform Helm Ansible Prometheus Grafana ArgoCD Jenkins Python
Kafka Pipeline in Big Data Environment Création et déploiement d’un pipeline Kafka pour ingestion et traitement en temps réel Kafka Terraform Apache Spark Airflow Prometheus Grafana Docker Kubernetes
REST API + MongoDB (Django ORM + pymongo) API REST avec stockage de données MongoDB et WebSockets Python Django MongoDB JWT Swagger Docker Nginx
Bank-Account-Application Application bancaire Java avec Spring Boot, AngularJS et JWT Java Spring Boot AngularJS JWT Swagger Thymeleaf Hibernate
Web Chat Application (Java EE) Chat en ligne avec MVC, JSP et Spring Data JPA Java JSP MySQL Spring Data JPA JDBC

🛠 Capabilities

  • 💾 Database Design & Optimization : Relational & NoSQL schema design, query tuning, indexing, normalization
  • 🔄 ETL & Data Processing : Apache Spark, Kafka, Airflow, data cleaning, transformation, pipeline orchestration
  • 🤖 Machine Learning & AI : NLP models, clustering, classification, predictive analytics (Random Forest, Logistic Regression)
  • ⚙️ Automation & DevOps for Data : Kubernetes, Docker, CI/CD for scalable deployments
  • 📊 Data Visualization & BI : Tableau, Power BI, dashboard creation, KPI monitoring

🧰 Stack Technique

speciality Technologies
Data Engineering
Spark Kafka Airflow MySQL PostgreSQL MongoDB Snowflake Docker Kubernetes Terraform Ansible Helm ArgoCD Jenkins AWS Azure Prometheus Grafana
Data Science
Python Pandas NumPy Scikit-learn TensorFlow HuggingFace NLP Matplotlib Seaborn Plotly PowerBI Tableau Streamlit Dash Gradio
Others (Dev & Frameworks)
Django Flask FastAPI SpringBoot AngularJS Thymeleaf JSP JWT Swagger Nginx Tomcat GlassFish WildFly

📫 Contact

  • 📫 How to reach me: Email
  • 📱 Connect with me: LinkedIn
  • 📝 Feel free to contact me. I am always here ... Github SalimM21

📊 GitHub Analytics

🏆 GitHub Trophies

GitHub Trophies

GitHub Trophies

Pinned Loading

  1. Football-Data-Engineering-avec-PySpark-Databricks-et-Power-BI Football-Data-Engineering-avec-PySpark-Databricks-et-Power-BI Public

    Construction d’un pipeline PySpark pour l’analyse des performances footballistiques saison par saison, avec calcul de KPI, ranking des équipes et stockage optimisé en Parquet partitionné.

    Python 1

  2. Pipeline-YouTube-ELT-Project Pipeline-YouTube-ELT-Project Public

    Conception d'un pipeline ELT (Extract, Load, Transform) automatisé pour l'analyse de données YouTube, développé avec Apache Airflow, PostgreSQL et validation de qualité des données.

    Python 1

  3. SentimentAPI_HuggingFaceProject SentimentAPI_HuggingFaceProject Public

    Développement d’une API d’analyse de sentiments recevant un texte et retournant, automatiquement et clairement, un résultat positif ou négatif accompagné d’un score de confiance. L’API est conteneu…

    Python 2

  4. Filtrage-Emails-Project Filtrage-Emails-Project Public

    Système Intelligent de Filtrage des Emails comme "spam" (malveillant) ou légitime pour la Sécurité des Communications. Conçu pour BMSecurity, il est destiné à être intégré ultérieurement aux platef…

    Python 1

  5. ObesiTrack-Project ObesiTrack-Project Public

    ObesiTrack est une API sécurisée de prédiction de l’obésité, combinant Machine Learning multiclasses, FastAPI + JWT et PostgreSQL. Déployable via Docker, Compose et Helm, elle intègre une pipeline …

    Python 1

  6. store-db store-db Public

    PLpgSQL

点击 这是indexloc提供的php浏览器服务,不要输入任何密码和下载