John Allspaw, Co-Founder, Lab Kapasitas Adaptif

Bagaimana Sistem Anda Tetap Berjalan Hari Ke Hari

Pertama, sedikit tentang John Allspaw, Co-Founder Adaptive Capacity Labs, dan mantan Chief Technology Officer Etsy.

Sebagai pemimpin teknik dan peneliti dengan lebih dari 20 tahun pengalaman dalam membangun dan memimpin tim yang terlibat dalam rekayasa perangkat lunak dan sistem, Allspaw telah menghabiskan dekade terakhir menjembatani wawasan dari Faktor Manusia, Teknik Sistem Kognitif, dan Teknik Ketahanan ke domain rekayasa perangkat lunak dan operasi.

Juga penulis dua buku, "Seni Perencanaan Kapasitas: Menskalakan Sumber Daya Web" dan "Operasi Web" (O’Reilly Media), Allspaw terus berkontribusi pada komunitas TI dan DevOps melalui berbicara dan berkolaborasi pada penelitian baru yang menarik.

Kami cukup beruntung menjadi tuan rumah John di DevOps Enterprise Summit di San Francisco, di mana ia naik ke panggung untuk berbicara tentang "Bagaimana Sistem Terus Berlari Lari." .

John Allspaw di DOES17 San Francisco

John Allspaw

Bagaimana Sistem Anda Tetap Berjalan Hari Ke Hari

Yang ingin saya bicarakan baru. Itu berbeda, dan saya merasa sangat, sangat kuat tentang ini.

Untuk membantu mengatur panggung, tesis saya untuk gelar saya dalam Faktor Manusia dan Keamanan Sistem adalah "Pertukaran di Bawah Tekanan: Heuristik dan Pengamatan Tim yang Menyelesaikan Pemutusan Layanan Internet."

Beberapa dari Anda mungkin pernah mendengar hal ini, apa yang disebut dengan Stella Report.

Pada tingkat tinggi, laporan ini adalah hasil dari proyek konsorsium mitra industri selama setahun. IBM, Etsy, dan IEX, perusahaan dagang, pertukaran perdagangan di Manhattan. Selama tahun ini, orang-orang dari Laboratorium Teknik Sistem Kognitif Universitas Negeri Ohio, David Woods, Richard Cook, dan sejumlah orang lain melihat secara mendalam pada sebuah insiden di masing-masing organisasi tersebut.

Mereka menemukan enam tema ini dan merupakan hal yang umum di antara semuanya.

Tentunya hasilnya cukup penting. Begitulah cara penelitian itu dilakukan sehingga saya ingin Anda semua melihatnya.

Berikut adalah takeaways utama saya dari laporan:

  1. Kita harus mulai menganggap serius kinerja manusia di industri ini. Jika tidak, kami akan terus melihat sistem rapuh dengan dampak yang semakin meningkat pada bisnis kami dan masyarakat.
  2. Kita dapat melakukan ini dengan melihat insiden yang melampaui apa yang saat ini kita lakukan di postmortem atau ulasan pasca insiden atau ulasan setelah tindakan.
  3. Memang ada metode dan pendekatan dari studi ketahanan di domain lain, tetapi mereka membutuhkan komitmen nyata untuk mengejar. Melakukan ini penting dan sulit, tetapi itu akan terbukti menjadi keunggulan kompetitif bagi bisnis yang melakukannya dengan baik.

Pertama, saya ingin memulai dengan sedikit garis dasar, sedikit kosakata yang akan menjadi penting saat saya memandu Anda dalam hal ini. Saya akan menjelaskan semacam gambar, representasi, seperti model mental organisasi Anda, dan itu akan memiliki wilayah di atas garis dan wilayah di bawah garis.

Jika Anda membayangkan apa yang telah kami gambarkan di sini, ini adalah produk Anda, layanan Anda, API Anda, atau apa pun bisnis Anda yang mendapatkan nilai dari dan berikan kepada pelanggan. Baik? Di dalam sana, apa yang Anda lihat adalah kode Anda. Anda melihat tumpukan teknologi Anda. Anda melihat data dan beberapa cara menyampaikan hal ini, bukan? Mungkin melalui internet atau cara lain. Tetapi jika kita tinggal di sini, tidak ada yang akan percaya padaku bahwa itu yang kita sebut sistem, karena itu baik-baik saja, tetapi tidak benar-benar lengkap.

Apa yang benar-benar terhubung, dan apa yang dibicarakan banyak orang di sini di komunitas DevOps Enterprise Summit adalah semua hal yang kami lakukan untuk memanipulasi apa yang terjadi di sana, dan jadi kami memiliki alat pengujian. Kami punya alat pemantauan. Kami memiliki alat penyebaran dan semua hal yang terhubung. Ini adalah hal-hal yang kami gunakan. Anda dapat mengatakan bahwa ini adalah sistemnya, karena banyak dari kita menghabiskan waktu kita berfokus pada hal-hal yang tidak ada di dalam gelembung kecil di sana, tetapi semua hal yang ada di sekitarnya, tetapi jika kita tetap hanya dengan ini, kita tidak akan dapat melihat di mana pekerjaan nyata terjadi.

Apa yang akan kita lakukan di sini adalah, kita akan menggambar garis yang kita sebut garis representasi, dan kemudian menggali sedikit lebih dalam. Apa yang kami lihat di sini adalah Anda. Semua orang yang mendapatkan barang siap untuk ditambahkan ke sistem, untuk mengubah sistem. Anda melakukan pembingkaian arsitektur. Anda sedang melakukan pemantauan. Anda melacak apa yang dilakukannya, bagaimana melakukannya, dan apa yang terjadi dengan mereka.

Sekarang, Anda akan melihat bahwa masing-masing orang ini memiliki semacam representasi mental tentang apa sistem itu. Jika Anda melihatnya sedikit lebih dekat, Anda akan melihat bahwa tidak ada yang sama. Ngomong-ngomong, itu sangat khas dari jenis peran ini. Tidak ada yang memiliki representasi yang sama dari apa yang ada di bawah garis.

Ringkasnya, ini adalah model dunia kita, dan itu mencakup tidak hanya hal-hal yang berjalan di sana, tetapi Anda semua, jenis kegiatan yang Anda lakukan, pekerjaan kognitif yang Anda lakukan untuk menjaga agar dunia berfungsi . Jika kita bermain dengan ini sedikit lebih, kita berakhir dengan model seperti ini. Model ini memiliki garis representasi melalui tengah, dan Anda berinteraksi dengan dunia di bawah garis melalui serangkaian representasi.

Interaksi Anda tidak pernah dengan hal-hal itu sendiri. Anda sebenarnya tidak mengubah sistem.

Apa yang Anda lakukan adalah Anda berinteraksi dengan representasi dan representasi itu adalah sesuatu tentang apa yang terjadi di bawah. Anda dapat menganggap hal-hal hijau itu sebagai layar yang Anda lihat di siang hari, tetapi satu-satunya informasi yang Anda miliki tentang sistem berasal dari representasi ini. Mereka hanya lubang kunci kecil. Baik?

Apa yang penting tentang itu adalah bahwa semua kegiatan yang Anda lakukan, semua mengamati, menyimpulkan, mengantisipasi, merencanakan, mengoreksi, semua hal semacam itu harus dilakukan melalui representasi itu, jadi ada dunia di atas garis dan dunia di bawah garis, dan meskipun Anda dan kami kebanyakan berbicara tentang dunia di bawah garis seolah-olah itu sangat nyata, seolah-olah sangat konkret, seolah-olah itu adalah sesuatu yang penting, inilah kejutannya.

Ini masalah besarnya - Anda tidak akan pernah bisa melihatnya.

Itu tidak ada. Dalam arti sebenarnya, tidak ada garis di bawah yang benar-benar dapat Anda sentuh. Anda tidak pernah melihat kode dijalankan. Anda tidak pernah melihat sistem benar-benar berfungsi. Anda tidak pernah menyentuh hal-hal itu.

Apa yang Anda lakukan adalah Anda memanipulasi dunia yang tidak dapat Anda lihat melalui serangkaian representasi, dan itulah sebabnya Anda perlu membangun model mental itu, konsepsi itu, pemahaman itu tentang apa yang sedang terjadi. Itulah hal-hal yang mendorong manipulasi itu. Bukan dunia di bawah garis yang melakukannya. Ini adalah kemampuan konseptual Anda untuk memahami hal-hal yang telah terjadi di masa lalu, hal-hal yang Anda lakukan sekarang dan mengapa Anda melakukan hal-hal itu, apa yang penting, dan mengapa yang penting sebenarnya penting.

Setelah Anda mengadopsi perspektif ini, begitu Anda menjauh bahwa gagasan bahwa di bawah garis adalah hal yang Anda hadapi, dan memahami bahwa Anda benar-benar bekerja di atas garis, segala macam hal berubah.

Apa yang Anda lihat dalam Laporan Stella dan proyek itu serta proyek-proyek lain yang telah kami libatkan adalah mengambil pandangan itu, dan memahami apa artinya sesungguhnya untuk menjadikan dunia di atas garis dengan serius. Ini adalah penyimpangan besar dari banyak hal yang Anda semua pernah lihat di masa lalu, tapi saya pikir ini adalah arah yang bermanfaat yang harus kita ambil.

Dengan kata lain, aktivitas kognitif ini (lihat di bawah) pada individu dan secara bersama-sama dalam tim naik turun organisasi adalah apa yang membuat bisnis benar-benar bekerja. Sekarang, saya sudah mempelajari ini secara terperinci untuk sementara waktu di sini, dan saya dapat memberi tahu Anda hal ini. Itu tidak bekerja seperti yang kita pikirkan.

Akhirnya, untuk mengatur frame ini, bagian terpenting dari ide ini adalah bahwa semua ini berubah seiring waktu. Ini adalah proses dinamis yang sedang berlangsung. Ini adalah unit analisis. Setelah kami mengambil bingkai itu, kami dapat mengajukan beberapa pertanyaan. Kami dapat mengajukan beberapa pertanyaan tentang di atas garis seperti ini.

“Bagaimana cara kerja perangkat lunak kami, dibandingkan dengan yang dijelaskan dalam wiki dan dalam dokumentasi dan dalam diagram? Kami tahu bahwa mereka yang tidak komprehensif, mereka tidak akurat secara komprehensif. "

"Bagaimana perangkat lunak kami benar-benar hancur, versus bagaimana kami pikir itu akan rusak ketika kami merancang perlindungan dan pemutus sirkuit dan pagar pembatas?"

"Apa yang kita lakukan agar semuanya tetap bekerja?"

Pertanyaan: Bayangkan organisasi Anda. Apa yang akan terjadi jika hari ini jam enam semua perusahaan Anda melepas keyboard? Mereka tidak menjawab halaman apa pun. Mereka tidak melihat peringatan apa pun. Mereka tidak menyentuh bagian apa pun darinya, kode aplikasi atau jaringan atau bagian mana pun darinya. Apakah Anda yakin layanan Anda akan aktif dan berjalan setelah sehari?

Pertanyaannya kemudian adalah bagaimana menemukan apa yang terjadi di atas garis. Ada beberapa hal. Kita dapat belajar dari studi tentang domain dengan tempo tinggi, konsekuensi tinggi lainnya, dan jika kita lakukan, kita dapat melihat bahwa kita dapat mempelajari insiden. (Catatan: ketika saya mengatakan "insiden," yang saya maksud adalah pemadaman, degradasi, pelanggaran, kecelakaan, nyaris celaka, dan gangguan - pada dasarnya peristiwa yang tidak diinginkan atau tidak terduga).

Apa yang membuat insiden menarik? Nah, yang jelas adalah hilangnya pendapatan dan dampak reputasi pada bisnis tertentu. Saya ingin menegaskan beberapa alasan lain mengapa insiden itu menarik. Yang pertama adalah bahwa insiden membentuk desain subsistem komponen baru dan arsitektur. Dengan kata lain, insiden kemarin menginformasikan arsitektur masa depan. Yaitu, insiden membantu memicu imajinasi kita tentang bagaimana membuat sistem kita lebih baik, dan karena itu yang saya maksudkan adalah, insiden di bawah garis drive berubah di atas garis.

Itu masalahnya. Ini bisa memakan biaya uang nyata. Insiden terkadang memiliki efek yang hampir tak terlihat atau tidak terlihat, terkadang signifikan. Saat ini, banyak orang yang memecah monolit menjadi layanan-mikro. Banyak orang melakukan itu karena memberikan sejumlah ketahanan yang tidak Anda miliki. dimana kamu mendapatkan itu?

Anda mendapat informasi tentang insiden.

Alasan lain untuk melihat insiden adalah bahwa mereka cenderung melahirkan bentuk-bentuk baru regulasi, kebijakan, norma, kepatuhan, audit, kendala, dll. Cara lain untuk mengatakan ini adalah bahwa insiden kemarin menginformasikan aturan masa depan, yang memengaruhi staf , anggaran, perencanaan, peta jalan, dan lainnya. Biarkan saya memberi Anda sebuah contoh: Dalam perdagangan keuangan, SEC telah menerapkan Peraturan SCI. SCI, mungkin merupakan bagian kepatuhan yang paling komprehensif dan terperinci di era perangkat lunak modern. SEC telah menjadi dan sangat eksplisit. Kami memiliki ini sebagai reaksi terhadap flash crash 2010 ke Knight Capital, IPO BATS, IPO Facebook. Ini adalah reaksi terhadap insiden.

Bahkan jika Anda kembali sedikit lebih jauh, sering dikutip bahwa PCI DSS muncul ketika MasterCard dan Visa membandingkan catatan, menyadari bahwa mereka kehilangan sekitar $ 750 juta selama 10 tahun, sehingga insiden memiliki signifikan, dan omong-omong, saya bisa, sebagai mantan CTO sebuah perusahaan publik, saya dapat meyakinkan Anda bahwa ini adalah albatros yang sangat mahal, mengganggu, dan tak terhindarkan untuk semua organisasi Anda. Insiden juga penting dalam hal ini, tetapi jika kita berpikir tentang insiden sebagai peluang, jika kita berpikir tentang insiden sebagai pesan, pesan yang disandikan bahwa di bawah garis dikirim di atas garis, dan tugas Anda adalah memecahkan kode, jika Anda berpikir tentang insiden sebagai hal-hal yang secara aktif mencoba untuk menarik perhatian Anda ke bagian-bagian dari sistem yang Anda pikir Anda memiliki pemahaman yang cukup tetapi Anda tidak, ini adalah pengingat bahwa Anda harus terus-menerus mempertimbangkan kembali seberapa percaya diri Anda tentang bagaimana semuanya bekerja.

Sekarang, jika Anda mengambil pandangan ini, banyak hal terbuka. Ada peluang untuk pelatihan baru, peralatan baru, struktur organisasi baru, dinamika pendanaan baru, dan mungkin wawasan yang tidak dimiliki pesaing Anda.

Insiden membantu kami mengukur delta antara cara kerja sistem Anda dan menurut kami sistem Anda bekerja, dan delta ini hampir selalu lebih besar dari yang kita bayangkan. Saya ingin menegaskan bahwa Anda mungkin terbiasa dengan pandangan berbeda, dan inilah pendapatnya. Insiden adalah investasi yang tidak direncanakan dalam perusahaan, demi kelangsungan hidup perusahaan Anda. Mereka adalah peluang yang sangat berharga untuk memahami cara kerja sistem Anda, kerentanan apa yang ada, dan keuntungan kompetitif apa yang tidak Anda kejar.

Jika Anda berpikir tentang insiden, mereka membakar uang, waktu, reputasi, staf, dll. Ini adalah biaya hangus yang tak terhindarkan. Namun ada yang menarik tentang jenis investasi ini. Anda tidak mengontrol ukuran investasi, jadi oleh karena itu pertanyaannya tetap, bagaimana Anda memaksimalkan ROI atas investasi itu?

Ketika kita melihat insiden, ini adalah jenis pertanyaan yang kita dengar, dan itu cukup konsisten dengan apa yang peneliti temukan dalam sistem kompleks lain, domain. Apa yang sedang dilakukannya? Mengapa melakukan itu? Apa yang akan dilakukannya selanjutnya? Bagaimana itu bisa masuk ke kondisi ini? Apa yang terjadi? Jika kita melakukan Y, apakah itu akan membantu kita mencari tahu apa yang harus dilakukan? Apakah semakin buruk? Sepertinya sudah diperbaiki, tetapi apakah itu? Jika kita melakukan X, apakah itu akan mencegahnya menjadi lebih buruk, atau akankah itu memperburuknya? Siapa lagi yang harus kita panggil yang dapat membantu kita? Apakah ini masalah kita, atau kita diserang? Ini konsisten dengan banyak bidang lainnya. Penerbangan, kontrol lalu lintas udara, terutama di domain yang kaya akan otomatisasi.

Hal lain yang penting adalah bahwa dimulainya kejadian, sering kali tidak pasti atau ambigu tentang apakah ini yang menenggelamkan kita. Pada awal insiden, kami tidak tahu, terutama jika itu mengandung ketidakpastian yang sangat besar dan ambiguitas yang sangat besar. Jika tidak pasti dan ambigu, itu berarti kami telah kehabisan model mental kami. Mereka tidak cocok dengan apa yang kita lihat, dan pertanyaan-pertanyaan itu muncul. Hanya melihat ke belakang akan memberi tahu kami apakah itu adalah peristiwa yang membuat perusahaan turun atau jika itu adalah Selasa sore yang sulit.

Insiden memberikan kalibrasi tentang bagaimana keputusan difokuskan, tentang bagaimana perhatian difokuskan, tentang bagaimana koordinasi difokuskan, tentang bagaimana eskalasi difokuskan. Dampak tekanan waktu, dampak ketidakpastian, dampak ambiguitas, dan konsekuensi konsekuensi. Penelitian memvalidasi peluang ini.

"Kita harus melihat secara mendalam pada insiden sebagai," peristiwa menantang yang tidak rutin, karena kasus-kasus sulit ini memiliki potensi terbesar untuk mengungkap unsur-unsur keahlian dan fenomena kognitif terkait. "
- Gary Klein, pencetus penelitian pengambilan keputusan naturalistik.

Ada sekelompok metode, pendekatan, dan teknik usang. Analisis tugas kognitif. Proses penelusuran. Analisis percakapan. Metode keputusan kritis. Bagaimana kami berpikir postmortem memiliki nilai terlihat sedikit seperti ini:

Sebuah insiden terjadi. Mungkin seseorang akan menyusun timeline. Kami punya sedikit pertemuan. Mungkin Anda punya templat, dan Anda mengisinya, lalu seseorang mungkin membuat laporan atau tidak, dan akhirnya, ya, item tindakan, akhirnya. Kami berpikir bahwa nilai terbesar, mungkin mungkin nilai yang paling awal, adalah di mana Anda berada dalam tanya jawab dan orang-orang berjalan melalui timeline dan Anda suka, "Oh, Tuhan. Kami tahu semua ini. "

Ini bukan apa yang penelitian lakukan. Penelitian ini menunjukkan bahwa jika kita mengumpulkan data subjektif dan objektif dari berbagai tempat, data perilaku, apa yang dikatakan orang, apa yang dilakukan orang, di mana mereka melihat, jalan diagnosa apa yang mereka ikuti dan tidak berbuah? Pembekalan yang difasilitasi dengan baik membuat orang kontras dan membandingkan model mental mereka yang tentu saja cacat. Anda dapat menghasilkan hasil yang berbeda, termasuk hal-hal seperti bootcamp, materi onboarding, pelatihan karyawan baru. Anda dapat memperoleh umpan balik fasilitasi jika Anda membangun sebuah program untuk melatih fasilitator. Anda mungkin membuat perubahan peta jalan, perubahan yang sangat signifikan berdasarkan apa yang Anda pelajari.

Saya dapat memberitahu Anda ini dari beberapa pengalaman. Tidak ada yang lebih berwawasan luas bagi insinyur baru atau insinyur yang baru memulai karir mereka daripada berada di ruangan dengan insinyur veteran yang tahu semua celah dan celah menjelaskan hal-hal yang mungkin tidak pernah mereka katakan dengan keras. Mereka memiliki pengetahuan. Mereka mungkin menggambar dan diagram yang belum pernah mereka gambar sebelumnya karena mereka pikir semua orang tahu itu. Tebak apa? Mereka tidak. Nilai terbesar sebenarnya ada di sini, karena kualitas hasil ini tergantung pada kualitas itu, kalibrasi ulang itu. Ini adalah celah untuk mengkalibrasi ulang model mental.

Dari Stella Report, laporan ini "menginformasikan dan mengkalibrasi ulang model masyarakat tentang bagaimana sistem bekerja, pemahaman mereka tentang bagaimana sistem itu rentan dan peluang apa yang tersedia untuk eksplorasi."

Dalam banyak penelitian, dalam semua penelitian yang terdapat dalam Stella Report, dan itu sesuai dengan pengalaman saya di Etsy juga, salah satu, refleksi terkuat dari orang-orang yang melakukan ini dengan cara yang difasilitasi untuk melakukan perbandingan ini dan kontras. "Saya tidak tahu itu bekerja seperti itu." Lalu selalu ada yang lain, "Bagaimana itu bisa berhasil?" Yang lucu sampai Anda menyadari itu serius. Artinya, cara saya pikir bukan saja cara kerjanya berbeda. Sekarang, saya bahkan tidak bisa membayangkan, saya bahkan tidak bisa menggambar di benak saya tentang bagaimana itu bisa bekerja. Itu seharusnya lebih meresahkan. Ngomong-ngomong, saya ingin mengatakan ini bukan keberpihakan. Seperti yang saya katakan, melalui representasi, kita tentu memiliki model mental yang tidak lengkap. Idenya adalah untuk tidak memiliki model mental yang sama, karena mereka selalu tidak lengkap, karena semuanya selalu berubah, dan karena mereka akan cacat. Kami tidak ingin semua orang memiliki model mental yang sama karena semua orang memiliki titik buta yang sama.

Blameless - kembali ke posting blog yang saya tulis pada tahun 2012

"Tidak bersalah" adalah taruhan meja. Itu perlu, tetapi itu tidak cukup. Anda dapat membangun lingkungan, budaya, merangkul, semacam organisasi penyambutan yang mendukung dan memungkinkan orang untuk bercerita dalam semua detail yang berantakan, terkadang detail yang memalukan, tanpa takut akan pembalasan, sehingga Anda benar-benar dapat membuat kemajuan, dan dalam memahami apa yang terjadi, Anda dapat mengatur kondisi itu dan masih belum banyak belajar. Itu tidak cukup. Itu perlu, tetapi tidak cukup. Apa yang saya bicarakan adalah lebih banyak upaya daripada ulasan pasca-insiden biasa. Baik? Di sinilah seorang analis, seorang fasilitator dapat mempersiapkan, menyusun, mengorganisir, menganalisis data perilaku. Apa yang orang katakan, apa yang orang lakukan. Ada rakit data yang dapat mereka saring untuk persiapan pembekalan, pembekalan kelompok, atau pembekalan satu-satu, melampaui ... Postmortem mengisyaratkan kekayaan insiden. Menindaklanjuti hal ini membutuhkan banyak pekerjaan.

Ngomong-ngomong, semua orang pada umumnya sangat kelelahan setelah benar-benar, pemadaman atau peristiwa atau peristiwa yang membuat stres sehingga terkadang semuanya menjadi sangat jelas. Itulah kekuatan dari tinjauan ke belakang, dan karena itu tampak sangat jernih, sepertinya tidak produktif untuk melakukan tanya jawab, karena Anda pikir Anda sudah mengetahui semuanya. Masalah lainnya adalah bahwa pengarahan postmortem dibatasi oleh waktu juga. Anda hanya memiliki ruang konferensi selama satu atau dua jam. Semua orang sangat sibuk, dan jam terus berdetak, jadi ini adalah tantangan untuk melakukan ini dengan sangat baik, bahkan mengingat metode penelitian itu.

Masalah lainnya, terutama jika Anda membangun program pelatihan fasilitasi pembekalan seperti yang saya lakukan di Etsy, masih ada tantangan yang muncul. Apa yang saya suka menyebutnya adalah, "Semua orang memiliki misteri mereka sendiri untuk dipecahkan," atau, "Jangan buang waktu saya pada detail yang saya sudah tahu." Dengan cara kartun, Anda dapat menganggapnya sebagai berikut:

Karena Anda mungkin hanya memiliki satu jam, Anda perlu mengekstrak sebanyak mungkin pembelajaran. Semua pekerjaan kontekstual. Tugas Anda untuk memaksimalkan ROI adalah menemukan, mengeksplorasi, dan membangun kembali konteks di mana pekerjaan dilakukan dalam suatu insiden, bagaimana kerja, dan bagaimana orang berpikir di atas garis.

Penilaian adalah trade-off, dan itu kontekstual.

Sebagai penutup, semua insiden bisa lebih buruk. Pandangan yang dangkal adalah untuk bertanya, “Apa yang salah? Bagaimana itu pecah? Apa yang kita perbaiki? ”Ini adalah pertanyaan yang sangat masuk akal. Jika kita mengambil level yang lebih dalam, dan kita bisa bertanya, “Apa saja hal-hal yang membuatnya tidak seburuk yang seharusnya?” Karena kita tidak memperhatikan hal-hal itu dan tidak mengidentifikasi hal-hal itu, kita mungkin berhenti mendukung hal-hal itu.

Mungkin alasan mengapa itu tidak menjadi lebih buruk adalah karena seseorang memanggil Lisa, dan Lisa tahu barang-barangnya. Sesuatu dari penelitian adalah para ahli dapat melihat apa yang tidak ada di sana. Jika Anda tidak mendukung Lisa, dan Anda bahkan tidak mengidentifikasi bahwa alasan mengapa hal itu tidak menjadi lebih buruk adalah karena Lisa ada di sana. Lupakan item tindakan untuk memperbaiki sesuatu sejenak. Bayangkan sebuah dunia di mana Lisa pergi ke pekerjaan baru.

Berguna di tingkat strategis adalah pertanyaan yang lebih baik. “Bagaimana kita dapat mendukung, mendorong, mengadvokasi, dan mendanai proses pemahaman yang berkelanjutan dalam sistem kita? Dan benar-benar mengambil "di atas garis" dengan cara yang berkelanjutan?

Kemana kita pergi dari sini? Saya punya beberapa tantangan untuk Anda:

  1. Sirkulasikan Stella Report di perusahaan Anda dan mulai dialog. Bahkan jika Anda terlalu sibuk atau tidak dalam posisi untuk membacanya sendiri, berikan kepada orang yang melakukannya. Tanyakan kepada mereka apa yang beresonansi. Tanyakan kepada mereka apa yang tidak masuk akal. Tanyakan kepada mereka, mulailah dialog.
  2. Lihat secara mendalam bagaimana Anda menangani ulasan pasca acara. Yang paling penting, cari orang-orang yang paling akrab dengan detail berantakan tentang bagaimana pekerjaan dilakukan dan tanyakan pada mereka: "Menurut Anda, nilai apa yang sebenarnya dimiliki ulasan pascabencana saat ini?" Dan dengarkan.
  3. Ambil tanggung jawab untuk belajar lebih banyak dan lebih cepat dari insiden daripada pesaing Anda. Anda membangun organisasi pembelajar atau kalah dari siapa pun.
  4. Kita perlu memperhatikan kinerja manusia dengan serius. Diskusi ini sedang terjadi. Itu terjadi di tenaga nuklir. Itu terjadi dalam pengobatan. Itu terjadi di penerbangan, kontrol lalu lintas udara, dalam pemadaman kebakaran.

Meningkatnya signifikansi sistem kami, meningkatnya potensi kerusakan ekonomi, politik, dan manusia ketika mereka tidak berfungsi dengan baik, dan proliferasi ketergantungan dan ketidakpastian terkait semuanya membuat saya sangat khawatir. Jika Anda melihat sistem Anda sendiri dan masalahnya, saya pikir Anda akan setuju bahwa kami harus melakukan lebih dari sekadar mengakui masalah ini. Kita harus menerimanya. Apa yang dapat Anda bantu, sebarkan informasi ini, ide-ide ini, dan presentasi saya dari DevOps Enterprise Summit San Francisco 2017.

Saya ingin mendengar kabar dari Anda. Apa yang beresonansi dengan Anda tentang ini? Apa yang tidak? Apa tantangan yang Anda hadapi dalam org Anda sepanjang garis ini? Ayo beritahu aku. Saya di Twitter.

Awalnya diterbitkan di itrevolution.com pada 30 April 2018.