Kalau kamu pikir pekerjaan ini hanya sebatas duduk manis di depan layar, ngoding pakai Python atau Go, dan otomatisasi script, eits, tunggu dulu! Itu baru setengah ceritanya. Hard skill memang penting, tapi di dunia SRE (Site Reliability Engineering), ada tiga pilar skill yang wajib banget kamu kuasai.
Tiga pilar ini adalah kunci sukses para SRE handal di perusahaan-perusahaan besar dunia. Tanpa kombinasi ketiganya, tool secanggih apapun buatanmu bisa jadi cuma “pajangan” yang kurang efektif.
Yuk, kita bedah tuntas apa saja Tiga Skill Wajib itu, dan kenapa ketiganya mutlak kamu butuhkan untuk jadi SRE Tooling Developer yang Handal dan Dicari Perusahaan!
baca juga:Jangan Cuma Hafal AWS! Bongkar Trik Jitu Lolos Wawancara Cloud Security Architect
Skill Wajib #1: Jago Ngoding untuk Otomasi (The Engine)
Ini adalah hard skill mendasar yang membedakan SRE Tooling Developer dari SRE biasa. Tugasmu adalah membuat alat! Alat itu wujudnya adalah kode program yang berfungsi untuk menghilangkan toil (pekerjaan manual, repetitif, dan membosankan).
Fokus Utama: Solusi, Bukan Sekadar Sintaks
Seorang Developer membuat fitur, seorang SRE Tooling Developer membuat sistem yang membuat Developer dan Operations lebih efisien. Jadi, fokus coding-mu harus berorientasi pada:
A. Bahasa Program Powerfull
- Python: Mutlak wajib. Bahasa scripting paling fleksibel untuk otomasi, integrasi API, dan mengolah data log atau metrik.
- Go (Golang): Wajib dipelajari. Banyak tool inti SRE (seperti Kubernetes dan Prometheus) dibuat pakai Go karena performanya cepat dan efisien untuk system programming skala besar.
- Shell Scripting (Bash): Ini adalah senjata harian untuk administrasi Linux dan membuat wrapper script sederhana di lingkungan server.
B. Infrastruktur sebagai Kode (IaC)
Kamu akan menulis kode untuk membuat infrastruktur. Jangan lagi klik-klik di console AWS/GCP!
- Terraform: Kuasai ini untuk mengelola server, database, network, dan semua sumber daya cloud hanya dengan menulis code deklaratif. Ini adalah pondasi tooling modern.
- Ansible: Digunakan untuk mengelola konfigurasi di dalam server (Configuration Management). Tool buatanmu harus bisa memanggil Ansible agar semua server punya konfigurasi yang seragam.
Intinya, Skill #1 ini adalah mesin penggerakmu. Kamu harus pede bahwa kode buatanmu stabil, aman, dan bisa menyelesaikan pekerjaan secara otomatis.
Skill Wajib #2: Pola Pikir Analitis & Pemecahan Masalah (The Detective)
Sistem down adalah mimpi buruk, tapi bagi SRE, itu adalah panggilan tugas. Skill ini bukan lagi soal teknis murni, tapi lebih ke cara kamu berpikir, yaitu menjadi detektif data yang handal.
Fokus Utama: Root Cause Analysis (RCA)
Saat terjadi insiden, semua orang panik. Tugasmu adalah tetap tenang dan melakukan Root Cause Analysis (RCA). Kamu nggak cuma restart server agar cepat up, tapi kamu harus tahu: “Kenapa server ini crash? Apa akar masalahnya?”
A. Mahir di Dunia Observability
- Monitoring dan Alerting (Prometheus & Grafana): Kamu harus tahu cara membaca metrik (CPU, Memory, Latency, Error Rate) dan mengatur alert yang “pintar” agar kamu tahu masalah sebelum pengguna teriak.
- Logging (ELK/Splunk): Kuasai cara mengolah log dari ribuan server secara terpusat untuk mencari jejak kegagalan. Ini butuh mata jeli dan kemampuan query data yang baik.
- Tracing: Pahami bagaimana melihat alur permintaan (request) melintasi banyak microservices.
B. Mengelola Insiden dengan Cerdas
- Sistematis: Saat insiden terjadi, ikuti prosedur: Detection $\rightarrow$ Isolation $\rightarrow$ Diagnosis $\rightarrow$ Recovery. Jangan panik dan jangan coba-coba perbaikan tanpa analisis.
- Post-Mortem Tanpa Menyalahkan (Blameless): Setelah insiden selesai, kamu harus memimpin post-mortem (analisis pasca-insiden). Tujuannya bukan mencari siapa yang salah, tapi mencari tahu apa yang salah di sistem/proses dan bagaimana cara membuat tool untuk mencegahnya terulang. Pola pikir ini adalah esensi SRE!
Skill #2 ini mengubahmu dari sekadar programmer menjadi Engineer yang benar-benar memahami keandalan sistem.
Skill Wajib #3: Komunikasi & Kolaborasi (The Bridge Builder)
Ini adalah soft skill yang sering diremehkan, padahal inilah yang menentukan apakah kamu akan sukses sebagai SRE Tooling Developer atau tidak. SRE Tooling Developer adalah jembatan antara tim yang punya kepentingan berbeda:
- Tim Developer: Ingin merilis fitur baru secepatnya.
- Tim Operations: Ingin sistem stabil dan tidak ada perubahan yang berisiko.
Tugasmu adalah membuat tool yang memuaskan keduanya!
Fokus Utama: Menyatukan Dunia Dev dan Ops
A. Komunikasi Efektif dan Empati
- Menerjemahkan Bahasa: Kamu harus bisa menjelaskan laporan monitoring yang penuh grafik dan angka teknis kepada Product Manager atau VP Engineering yang non-teknis, dengan bahasa yang sederhana dan fokus pada dampak bisnis (Business Impact).
- Mendengarkan Kebutuhan: Dengarkan keluhan (pain points) dari tim Developer tentang proses deployment mereka yang rumit. Dengan empati, kamu bisa merancang tool yang benar-benar mereka butuhkan, bukan cuma tool yang kamu anggap keren.
B. Kerjasama Tim Lintas Fungsi
- Code Review yang Membangun: Tool yang kamu buat akan di-review oleh tim lain. Kamu harus bisa memberikan dan menerima feedback dengan terbuka dan profesional.
- Negosiator Error Budget: Kamu adalah orang yang berhak “menarik rem” jika tim Developer terlalu cepat merilis fitur yang berisiko, melanggar Error Budget (jatah kegagalan) yang sudah disepakati. Kemampuan negosiasi dan argumentasi yang berbasis data sangat dibutuhkan di sini.
Skill #3 ini adalah lem yang merekatkan semua hard skill teknis menjadi solusi bisnis yang efektif. Tanpa ini, tool terbaik di dunia pun bisa ditolak karena proses integrasinya rumit atau komunikasinya buruk.
baca juga:Ketua Aptisi Soroti Sistem Pendidikan Tinggi, Singgung Peran Nasrullah Yusuf di Rakornas Aptikom
Penutup: Kombinasi Tiga Skill = SRE Handal
Untuk menjadi SRE Tooling Developer yang Handal, kamu tidak bisa hanya menguasai salah satunya.
- Kalau hanya jago coding (Skill #1) tapi minim problem solving (Skill #2), kamu akan membuat tool yang rumit, tidak menyelesaikan akar masalah, dan mungkin malah menimbulkan bug baru.
- Kalau hanya jago problem solving (Skill #2) tapi minim komunikasi (Skill #3), post-mortem-mu akan bagus, tapi tidak ada tim yang mau mendengarkan atau mengimplementasikan tool pencegahannya.
- Kalau hanya jago komunikasi (Skill #3) tapi coding-nya lemah (Skill #1), kamu hanya akan jadi manajer tanpa kontribusi kode nyata.
Kunci suksesnya adalah menyeimbangkan dan menyempurnakan ketiga pilar ini. Mulai dari sekarang, jangan hanya fokus pada sintaks program. Tapi fokuslah pada menciptakan solusi otomasi, menganalisis masalah sampai ke akar, dan mengkomunikasikan hasilnya dengan efektif agar semua orang di timmu bisa bekerja lebih baik.
penulis: Wilda Juliansyah