Video: Take the Lead Jenn Tejada & Stacey Cunningham (November 2024)
PagerDuty adalah layanan respons insiden dan peringatan yang bekerja dengan hampir semua layanan pemantauan. Layanan ini dapat dikonfigurasi untuk mengirimkan peringatan melalui panggilan telepon, email, teks, atau melalui aplikasi iOS dan Android, lengkap dengan konfirmasi pengiriman dan perutean ulang otomatis. Dasbor menunjukkan insiden dan status waspada di semua alat pemantauan Anda. Konfigurasi penjadwalan dan eskalasi peringatan canggih menjaga seluruh tim Anda dalam lingkaran. Analisis lanjutan PagerDuty membantu mengidentifikasi hotspot dan tren kinerja tim.
Saya telah terlibat dengan solusi respons kejadian selama lebih dari 20 tahun dan saya dapat dengan aman mengatakan bahwa PagerDuty menemukan keseimbangan yang besar antara kemudahan penggunaan dan kekuasaan. Saya akui, saya jatuh cinta dengan PagerDuty.
Instalasi
Mendaftar sangat mudah dan hanya perlu alamat email dan kata sandi saya. Saya kemudian diminta untuk mengirimkan peringatan tes melalui SMS, telepon, dan email. Dalam 10 detik saya menerima ketiga peringatan. Lansiran SMS PagerDuty mendesak saya untuk mengunduh aplikasi seluler, sementara panggilan telepon mengatakan, "Hai, ini peringatan uji PagerDuty. Tambahkan nomor ini ke telepon Anda untuk memastikan Anda selalu menerima peringatan." Rasanya meyakinkan bahwa sistem siaga bekerja.
Langkah selanjutnya adalah menghubungkan alat pemantauan saya. Ini dapat dilakukan hanya dengan memilih alat pilihan saya dari kotak drop down dari program yang didukung termasuk HP SiteScope, New Relic APM, CopperEgg, atau salah satu dari 50 atau lebih yang terdaftar. Saya memilih CopperEgg karena saya sudah menyiapkan akun untuk meninjau layanan. Saya juga bisa memilih untuk mengirim email ke PagerDuty untuk memicu peringatan atau terhubung langsung ke API REST PagerDuty. Ketika saya mengklik untuk menambahkan CopperEgg saya diarahkan ke halaman web dengan informasi tambahan tentang integrasi. Selanjutnya, saya perlu membuat dan menambahkan kunci API PagerDuty ke CopperEgg. Saya kemudian mengatur eskalasi insiden sehingga jika saya tidak merespons dari peringatan pertama dalam waktu 10 menit dan responden sekunder akan diemail.
Bekerja dengan PagerDuty
Masuk ke PagerDuty, saya dikejutkan oleh betapa mudahnya tampilan antarmuka. Antarmuka PagerDuty menyediakan semua opsi navigasi di bagian atas halaman: dasbor, insiden, konfigurasi, analitik, dan bantuan. Dasbor terbuka secara default dan termasuk daftar insiden terbuka saya dan insiden terbuka di seluruh perusahaan, ditambah semua aktivitas insiden selama tujuh hari terakhir. Layar insiden sangat mirip dengan dasbor tetapi mencakup lebih banyak opsi untuk bekerja dengan insiden.
Daging asli untuk PagerDuty berada di dalam menu konfigurasi, yang mencakup opsi untuk jadwal, layanan, kebijakan eskalasi, pengguna, dan tim. Langkah pertama dalam bekerja dengan PagerDuty adalah menciptakan pengguna yang akan diberi tahu saat terjadi insiden. Pengguna ditugaskan ke salah satu dari empat peran mulai dari yang terbatas, pengguna yang hanya dapat memicu, mengakui, dan menyelesaikan insiden, hingga pemilik akun yang memiliki kemampuan untuk mengelola apa pun dalam sistem PagerDuty. Setiap pengguna mendapat aturan pemberitahuan yang ditetapkan; mereka dapat diberitahu tentang insiden baru atau yang berubah dan ketika periode on-call mereka dimulai melalui email, panggilan telepon, atau SMS. Sangat mungkin bahwa organisasi besar ingin menugaskan pengguna ke tim sehingga jadwal, pemberitahuan, dan kebijakan eskalasi dapat dikelola dengan lebih mudah. Misalnya, organisasi dapat memiliki tim yang mendapat pemberitahuan untuk insiden server dan tim lain yang mendapat pemberitahuan untuk insiden keamanan.
Di PagerDuty, seperti halnya sistem respons kejadian apa pun, iblis ada dalam perinciannya. Konsep keseluruhannya adalah untuk memberi tahu mereka yang perlu tahu pada waktu yang tepat dan kemudian membangun cadangan sehingga tidak ada yang masuk. Untuk melakukan ini, Anda harus memperhatikan dengan cermat jadwal dan kebijakan pemberitahuan, khususnya kebijakan eskalasi. PagerDuty melakukan pekerjaan yang fantastis untuk membuat detail mudah dikonfigurasikan dan dikelola dan ini terutama karena GUI yang kuat namun mudah dipahami. Mengatur jadwal panggilan diperlukan sedikit lebih dari memilih pengguna, memilih jenis rotasi (harian, mingguan, atau kustom), dan memilih waktu dan tanggal mulai. Jadwal panggilan dapat berlapis satu sama lain sehingga Anda dapat melihat di mana mereka tumpang tindih, dan kalender muncul di halaman manajemen jadwal yang jelas menunjukkan jadwal panggilan dan tumpang tindih. Kebijakan eskalasi juga sangat mudah untuk dikonfigurasi dan dikelola karena GUI langsung.
Tes pertama saya tentang PagerDuty melibatkan secara manual membuka sebuah insiden, yang merupakan fitur hebat untuk menguji bagaimana pemberitahuan dan kebijakan eskalasi dikonfigurasikan. Dalam lima detik, saya menerima pemberitahuan insiden melalui panggilan telepon, SMS, dan email. Panggilan telepon membacakan kepada saya layanan yang menyebabkan lansiran dan beberapa informasi dasar tentang lansiran, ditambah memberi saya opsi untuk merespons seperti "tekan 4 untuk mengakui, 6 untuk menyelesaikan, atau tekan 8 untuk meningkat." Saya menekan 4 untuk mengakui dan, mengikuti kebijakan pemberitahuan saya, saya diberitahu kembali dalam setengah jam bahwa kondisi peringatan masih ada (satu-satunya cara untuk menghentikan pemberitahuan adalah dengan menyelesaikan atau meningkatkannya). Pemberitahuan yang saya terima melalui email dan SMS serupa, dengan peringatan email juga berisi tautan ke situs PagerDuty sehingga saya bisa melihat informasi lebih lanjut. PagerDuty tampil mengagumkan selama pengujian saya, dengan patuh memberi tahu saya secara tepat waktu tentang insiden, mengikuti kebijakan eskalasi saya, dan memberi tahu saya kembali ketika saya lalai menandai suatu masalah yang telah diselesaikan.
Bantuan PagerDuty sangat bagus. Setiap halaman di portal menyertakan setidaknya satu tautan ke bantuan konteks sensitif. Ada juga bagian memulai yang mendalam yang mencakup segala sesuatu mulai dari topik dasar seperti cara mengatur dan menanggapi pemberitahuan ke topik lebih lanjut seperti membuat jadwal panggilan dan membuat kebijakan eskalasi. Bantuan online juga mencakup informasi terperinci tentang pengintegrasian PagerDuty dengan alat pemantauan lain, sumber daya pengembang, dan formulir untuk mengirimkan permintaan dukungan teknis.
Laporan PagerDuty sangat mudah dan mudah dipahami. Laporan dapat ditampilkan di seluruh sistem, atau difilter pada kebijakan layanan, tim, atau eskalasi. Metrik ringkasan juga disediakan yang menunjukkan waktu rata-rata untuk mengakui, waktu rata-rata untuk menyelesaikan, jumlah insiden yang meningkat, dan banyak lagi. Informasi ini sangat membantu secara operasional, tetapi manajer mungkin akan menginginkan kedalaman yang lebih besar untuk keperluan perencanaan dan analisis, dalam hal ini mereka ingin mengeluarkan data ini dari PagerDuty. Jika Anda berlangganan suatu rencana Perusahaan maka dimungkinkan untuk mengekspor laporan. PagerDuty merekomendasikan Anda untuk menanyakan insiden melalui API mereka alih-alih mengekspor laporan.