This job offer is not available in your country.

Site Reliability Engineer - AWS / Azure Cloud Services

DeqodeMumbai

30+ days ago

Job description

Profile : Site Reliability Engineer (SRE)

Experience Required : 6+ Years

Locations : Mumbai, Gurgaon, Chennai

Work Arrangement : Hybrid

Key Responsibilities :

Design and implement scalable, resilient cloud-native infrastructure across AWS / Azure / GCP platforms
Own the SRE function including availability, latency, performance monitoring, emergency response, and capacity planning
Collaborate with engineering and product teams to improve system reliability, speed, and performance
Set up, maintain, and improve CI / CD pipelines using industry-standard tools
Perform load and stress testing, analyze performance bottlenecks, and provide remediation strategies
Manage incident response and conduct post-incident reviews
Implement Infrastructure as Code using Terraform
Monitor system performance and implement proactive measures for system optimization

Mandatory Technical Skills :

Cloud Architecture : Hands-on experience with AWS / Azure / GCP platforms

Terraform : Infrastructure as Code implementation and management

Performance Testing : Proficiency with JMeter, Gatling, k6, or Locust

Load Balancing : Experience with ALB, NLB, Azure Load Balancer, GCP Load Balancer

CI / CD Pipelines : Jenkins, GitHub Actions, Azure DevOps, or GCP Build

Additional Required Skills :

Cloud certifications (AWS / Azure / GCP Solution Architect preferred)

SRE expertise in availability, performance monitoring, and capacity planning

Monitoring tools : CloudWatch, Prometheus, Grafana

Container technologies : Docker, Kubernetes, ECS / AKS / GKE

Scripting & automation : Python, Bash

Database operations : MySQL, PostgreSQL, NoSQL databases

Strong incident management and troubleshooting capabilities

Analytical problem-solving mindset

(ref : hirist.tech)

Site Reliability Engineer • Mumbai