Salim-Majide SalimM21

Greetings ✨, I'm Salim MAJIDE

🙋‍♂ About Me

Data Enthusiast
As a Data Engineer, I create robust and scalable data architectures, optimize queries, and ensure data integrity across large-scale systems. My expertise includes relational & NoSQL databases, real-time data pipelines with Apache Kafka, Big Data processing with Spark, and automated deployments in Kubernetes. I’ve developed intelligent solutions such as an email filtering system for secure communications and DiabetoWeb, a medical decision-support tool for diabetes risk assessment, while delivering efficient solutions for business intelligence and predictive analytics.

🔭 Currently Working On

⚡ Optimized ETL pipeline with Apache Spark for real-time IoT analytics
📑 NLP model to classify legal documents

🌱 Learning

🔹 MLOps with MLflow and Kubeflow
🔹 BigQuery query optimization

👯 Collaborating On

📊 Open-source data visualization projects
🧠 LLM model benchmarks

🤔 Seeking Help With

🚀 Advanced orchestration with Apache Airflow
📦 Feature store implementation

💬 Ask Me About

🧹 Data cleaning with Pandas
📐 Best practices in data modeling

📂 Projects Portfolio

🚀 Here are some of my database projects:

Project	Description	Tech Stack
DiabetoWeb	Web app sécurisée pour aider les médecins à évaluer le risque de diabète, combinant gestion de données et ML
Filtrage-Emails	Système intelligent de détection de spam/malware
Sentiment Analysis API	API REST et page web pour analyse de sentiments via Hugging Face
Big Data Apps Deployment in Kubernetes	Automatisation du déploiement d’applications Big Data dans Kubernetes
Kafka Pipeline in Big Data Environment	Création et déploiement d’un pipeline Kafka pour ingestion et traitement en temps réel
REST API + MongoDB (Django ORM + pymongo)	API REST avec stockage de données MongoDB et WebSockets
Bank-Account-Application	Application bancaire Java avec Spring Boot, AngularJS et JWT
Web Chat Application (Java EE)	Chat en ligne avec MVC, JSP et Spring Data JPA

🛠 Capabilities

💾 Database Design & Optimization : Relational & NoSQL schema design, query tuning, indexing, normalization
🔄 ETL & Data Processing : Apache Spark, Kafka, Airflow, data cleaning, transformation, pipeline orchestration
🤖 Machine Learning & AI : NLP models, clustering, classification, predictive analytics (Random Forest, Logistic Regression)
⚙️ Automation & DevOps for Data : Kubernetes, Docker, CI/CD for scalable deployments
📊 Data Visualization & BI : Tableau, Power BI, dashboard creation, KPI monitoring