Keandalan dan Ketersediaan

Keandalan dan Ketersediaan

Pekik Argo Dahono

Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung

1. Pendahuluan

Istilah keandalan (reliability) dan ketersediaan (availability) dikenal di dunia teknik sejak tahun 1950-an dan biasanya dihubungkan dengan konsep laju kegagalan. Sekarang, pemahamannya meluas dan satu paket dengan konsep kwalitas, daya tahan, dan kadang fungsi suatu produk. Di industri sekarang sering sekali terdengar kebutuhan akan ketersediaan 0,99999 (lima buah angka 9 di belakang koma). Sebenarnya ketersediaan hanyalah salah satu komponen dari keandalan.

Tulisan ini akan mencoba menjelaskan arti ketersediaan 99,999 persen dan apa implikasinya. Tulisan ini juga menjelaskan bahwa ketersediaan 99,999 persen sebenarnya tidak banyak berarti jika tidak dilengkapi dengan informasi penting lainnya. Beberapa contoh untuk memperbaiki keandalan suatu sistem juga dibahas.

2. Terminologi

Ketersediaan adalah rata-rata jangka panjang rasio antara jangka waktu suatu produk atau sistem bisa menjalankan fungsinya terhadap jangka waktu totalnya. Sebagai contoh jika suatu peralatan hanya berhenti bekerja selama satu jam setiap tahunnya maka peralatan tersebut mempunyai ketersediaan (8759/8760) atau 0,999886 (99,9886 persen).

Ketersediaan 99,999 persen artinya dalam satu tahun hanya padam 5,3 menit (315 detik) per tahunnya. Konsep ketersediaan tidak membedakan antara padam sekali selama 5,3 menit dalam setahun, atau dalam setahun padam 315 kali selama satu detik, atau dalam 20 tahun padam selama 1,77 jam. Akan tetapi jelas bahwa walaupun ketersediaannya sama, pengaruhnya pada konsumen akan berbeda.

Laju kegagalan (λ) menyatakan jumlah kegagalan dalam suatu interval waktu tertentu, biasanya dinyatakan dengan jumlah kegagalan per satuan waktu. Sedangkan MTBF (Mean Time Between Failure) adalah waktu rata-rata di antara dua kegagalan. Dalam banyak analisis, laju kegagalan biasanya dinyatakan tetap (tidak berubah terhadap waktu). Untuk peralatan elektronik, asumsi ini biasanya cukup memadai dan bisa diterima. Jika laju kegagalan dianggap tetap maka

(1) MTBF=\frac{1}{\lambda}

Peralatan elektronik biasanya mempunyai laju kegagalan yang relatif tetap. Peralatan mekanik, karena ada keausan, laju kegagalannya biasanya naik dengan berjalannya waktu. MTTR (Mean Time To Repair) adalah waktu rata-rata yang diperlukan untuk memperbaiki suatu kegagalan. Dalam praktek, kadang-kadang perhitungan MTTR tidak hanya mencakup waktu yang diperlukan untuk memperbaiki peralatan tetapi juga waktu yang diperlukan untuk persiapan, memanggil ahlinya, mendatangkan barang, dan sebagainya.

Berdasarkan definisi MTBF dan MTTR maka ketersediaan atau availability bisa dituliskan sebagai

(2) A=\frac{MTBF}{MTBF+MTTR}

Keandalan atau reliability (R) menyatakan peluang bahwa suatu produk atau sistem bisa menjalankan fungsinya selama suatu periode waktu tertentu. Jelas bahwa keandalan merupakan fungsi waktu. Semakin panjang periode waktunya maka semakin rendah peluang suksesnya. Secara umum, keandalan bisa dituliskan sebagai

(3) R(t)=e^{-\lambda t}

Dari sini jelas bahwa ada lima faktor yang penting dalam membicarakan keandalan, yaitu: MTBF, MTTR, ketersediaan, keandalan, dan waktu. Lima faktor ini saling berhubungan. Yang tidak jelas di sini adalah apa pengaruh waktu pada ketersediaan. Secara umum, ketersediaan tidak dipengaruhi waktu. Akan tetapi jelas bahwa keandalan dipengaruhi oleh waktu. Tabel 1 memperlihatkan apa pengaruh waktu pada keandalan. Walaupun tiga kasus yang dibahas mempunyai ketersediaan yang sama, keandalan tiga kasus tersebut jelas berbeda. Sistem yang gagal 315 kali dalam setahun mempunyai keandalan sama dengan nol setelah satu tahun. Sistem yang gagal sekali dalam setahun mempunyai keandalan 36,78% dalam setahun. Sedangkan sistem yang gagal sekali dalam dua puluh tahun mempunyai keandalan 95,12% setelah satu tahun. Keandalan sistem turun menjadi 36,78% setelah umurnya sama dengan nilai MTBF-nya. Dengan kata lain, informasi ketersediaan saja tidaklah cukup untuk menilai bagus tidaknya suatu sistem.

Konsep lain yang sering salah dalam belajar keandalan adalah MTBF. Jika suatu alat atau produk mempunyai MTBF = 876.000 jam sering sekali dianggap mempunyai umur minimum 876.000 jam (100 tahun) sebelum rusak. Dalam praktek, bisa jadi alat tersebut hanya mempunyai umur 15 tahun. Dengan kata lain, sebenarnya hubungan antara MTBF dan umur sering tidak terlalu jelas.

Tabel 1. Analisis ketersediaan dan keandalan
Ketersediaan
Kegagalan per tahun
Laju kegagalan (gagal/jam)
MTBF (jam)
MTBF (tahun)
Keandalan (satu tahun)
0,99999
315
3,60E-02
27,81
0,0032
0%
0,99999
1
1,14E-04
8.759
1.0
36,78%
0,99999
0,05
5,71E-06
175.200
20
95,12%

3. Diagram Keandalan

Sistem tenaga listrik biasanya disusun atas hubungan seri paralel beberapa komponen atau peralatan listrik. Untuk melakukan analisis keandalan sistem semacam ini, mula-mula kita tuliskan lebih dahulu keandalan masing-masing komponen dan disusun menurut hubungan aktual antar komponen. Diagram semacam ini disebut diagram keandalan.

Untuk dua komponen dengan laju kegagalan masing-masing λ1 dan λ2, jika dihubungkan secara seri maka keandalannya bisa dihitung sebagai

(4) R(t)=R_{1}(t)\times R_{2}(t)=e^{-(\lambda_1+\lambda_2)t}

Jika dihubungkan secara paralel maka keandalannya dihitung sebagai

(5) R(t)=R_{1}(t)+R_{2}(t)-R_{1}(t)\times R_{2}(t)=e^{-\lambda_1 t}+e^{-\lambda_2 t}-e^{-(\lambda_1+\lambda_2)t}

Banyak sistem tenaga listrik terdiri atas banyak komponen yang dihubungkan seri paralel. Analisis menjadi lebih sulit jika komponennya bisa diperbaiki. Kadang-kadang, sistem terdiri atas beberapa komponen yang hubungannya tidak bisa dikategorikan sebagai hubungan seri atau paralel (misal diesel genset yang berada dalam posisi stand-by). Untuk kasus semacam ini, kadang-kadang lebih mudah jika analisis dilakukan dengan bantuan komputer dan dilakukan suatu simulasi Monte Carlo. Dalam simulasi ini, semua kemungkinan bisa diuji untuk melihat pengaruhnya pada sistem.

4. Analisis Keandalan

Beberapa faktor penting harus diperhatikan dalam melakukan analisis keandalan. Faktor penting pertama dalam melakukan analisis keandalan adalah mendefinisikan kegagalan. Apa yang dimaksud dengan gagal. Mesin mati dan menyebabkan pesawat jatuh pasti semua setuju untuk disebut gagal. Akan tetapi jika pesawatnya tidak jatuh, apakah masih disebut gagal? Jika listrik PLN mati dan diesel generator perlu waktu 30 detik untuk menggantikannya, apakah ini kegagalan? Gagal atau tidaknya sangat ditentukan oleh beban yang dipasok. Jika bebannya adalah lemari pendingin (freezer) yang dipakai dalam suatu pabrik pengolahan ikan maka pemadaman 30 detik jelas bukan merupakan kegagalan. Akan tetapi jika bebannya adalah pusat data dengan banyak komputer, pemadaman 30 detik jelas merupakan kegagalan. Jadi dalam melakukan analisis keandalan, langkah pertama adalah mendefinisikan apa yang dimaksud dengan kegagalan.

Sebagai contoh sistem kelistrikan yang melibatkan diesel genset diperlihatkan di Gambar 1. Kita melakukan analisis sistem ini jika memasok pabrik pengolahan ikan, dengan beban utama freezer, dan jika memasok pusat data dengan beban utama komputer. Untuk pusat data, diasumsikan kegagalan sumber listrik utama adalah dua kali setahun. Karena pemadaman sumber merupakan penyebab utama kegagalan, nilai MTTR hanya ditentukan oleh waktu yang diperlukan untuk mengoperasikan automatic transfer switch (ATS) dan starting diesel generator.

Gambar 1. Sistem kelistrikan

Untuk pabrik pengolahan ikan, pemadaman sumber utama tidak bisa dianggap kegagalan karena pemutusan beberapa detik atau beberapa menit untuk mengoperasikan ATS dan starting diesel generator tidak akan menyebabkan gagalnya pendinginan yang dihasilkan freezer. Oleh sebab itu, jika sampai terjadi kegagalan, pasti permasalahannya ada pada kerusakan jaringan listrik dan peralatannya sehingga MTTR yang diperlukan bisa kita asumsikan sekitar 2 jam.

Tabel 2 memperlihatkan hasil analisis yang didapat. Kedua kasus menghasilkan availability yang sangat tinggi dan mempunyai nilai yang hampir sama. Akan tetapi, keandalan kedua sistem sangat berbeda. Keandalan sistem yang memasok pusat data mempunyai nilai yang jauh lebih rendah dibanding yang memasok pabrik pengolahan ikan.

Untuk memperbaiki keandalan pusat data, kita bisa menambahkan UPS seperti terlihat di Gambar 2. UPS cocok untuk mengatasi pemadaman jangka pendek. UPS biasanya dipilih sedemikian rupa sehingga baterenya mampu memasok beban selama waktu sekitar 30 menit. Dengan menambahkan UPS, bisa kita lihat di Tabel 3 bahwa keandalan sistem kelistrikan yang memasok pusat data naik secara signifikan.

Selain dipengaruhi oleh MTBF dan MTTR dan juga oleh jumlah komponen, keandalan suatu sistem kelistrikan juga dipengaruhi oleh jumlah beban yang dipasok. Untuk menunjukkan pengaruh jumlah komponen dan jumlah beban, kita tambahkan suatu trafo dan panel distribusi ke model pabrik pengolahan ikan. Selain itu, kita analisis juga apa pengaruhnya jika jumlah freezernya ada 10. Untuk pusat data, kita tambahkan panel distribution unit (PDU) dengan beban satu komputer dan 10 komputer. Kita asumsikan bahwa kegagalan satu freezer atau satu komputer dianggap sebagai kegagalan sistem. Tabel 4 memperlihatkan hasil analisisnya. Jelas bahwa ketersediaan dan keandalan menurun dengan naiknya jumlah beban.

Faktor lain yang berpengaruh pada keandalan adalah waktu. Tabel 5 memperlihatkan analisis keandalan suatu sistem ketenagalistrikan jika periode waktunya berbeda. Jelas bahwa semakin panjang periode waktunya maka semakin rendah keandalan sistemnya. Itulah sebabnya menyatakan keandalan tanpa keterangan waktu menjadi tidak ada maknanya.

Walaupun keandalan dari pusat data yang dilengkapi UPS sudah cukup tinggi, dalam banyak kasus keandalannya masih dianggap kurang tinggi. Untuk mencoba memperbaikinya, kita harus menghilangkan titik tunggal penyebab kegagalan (single point of failure). Titik tunggal penyebab kegagalan adalah adalah sembarang komponen atau bagian dari sistem, dari sumber sampai beban, yang mana jika mengalami kegagalan akan menyebabkan gagalnya sistem. Keandalan sistem ditentukan oleh keandalan titik tersebut. Untuk sistem di Gambar 2, ada banyak titik tunggal penyebab kegagalan. Memang, penambahan UPS menyebabkan sumber bukan lagi merupakan titik tunggal penyebab kegagalan. Akan tetapi, masih ada ATS, busbar input, busbar output, dan panel distribution unit (PDU) yang semuanya adalah titik tunggal penyebab kegagalan.

Tabel 2. Ketersediaan dan keandalan sistem kelistrikan.
Penjelasan sistem
MTBF (jam)
MTTR (jam)
Ketersediaan
Keandalan
(satu tahun)
Pengolahan ikan
134.072
2,08
0,9999845
93,88%
Pusat data
4.408,6
0,08
0,9999822
14,12%

Gambar 2. Sistem kelistrikan dengan UPS

Tabel 3. Ketersedian dan keandalan pabrik dan pusat data.
Penjelasan sistem
MTBF (jam)
MTTR (jam)
Ketersediaan
Keandalan
(satu tahun)
Pabrik pengolahan ikan tanpa UPS
134.072
2,08
0,9999845
93,88%
Pusat data dengan UPS
115.900
1,55
0,9999867
94,59%
Tabel 4. Pengaruh jumlah komponen dan beban pada keandalan dan ketersediaan.
Penjelasan sistem
MTBF (jam)
MTTR (jam)
Ketersediaan
Keandalan
(satu tahun)
Pabrik ikan dengan satu freezer
86.529
4,68
0,9999443
90,62%
Pabrik ikan dengan 10 freezer
43.551
6,40
0,9998543
82,90%
Pusat data dengan satu komputer
94.740
2,36
0,9999756
93,09%
Pusat data dengan sepuluh komputer
72.805
2,36
0,9999678
90,63%
Tabel 5. Pengaruh waktu pada keandalan.
Penjelasan
Keandalan
(satu tahun)
Keandalan
(lima tahun)
Keandalan
(sepuluh tahun)
Pabrik ikan dengan satu freezer
90,62%
60,27%
36,17%
Pabrik ikan dengan sepuluh freezer
82,90%
36,72%
13,70%
Pusat data dengan satu komputer
93,09%
68,43%
45,91%
Pusat data dengan sepuluh komputer
90,63%
59,39%
35,33%

Bagaimana meminimumkan titik tunggal penyebab kegagalan? Solusinya adalah dengan menambahkan redundansi. Gambar 3 memperlihatkan bagaimana redundansi bisa mengurangi titik tunggal penyebab kegagalan. Untuk membuat ATS bukan lagi single point of failure, kita menambahkan ATS kedua dan juga busbar input kedua. UPS dan saklar statik juga kita gandakan. Busbar output juga kita gandakan. Keluaran UPS memasok beban melalui automatic static transfer switch (ASTS). Sekarang, hanya ASTS dan PDU, serta bebannya sendiri yang merupakan single point of failure. Tabel 6 memperlihatkan hasil analisis keandalan dua macam sistem ketenagalistrikan untuk memasok pusat data. Jelas bahwa redundansi akan meningkatkan ketersediaan dan keandalan sistem.

Gambar 3. Sistem redundan

Tabel 6. Analisis ketersediaan dan keandalan pusat data.
Penjelasan
MTBF (jam)
MTTR (jam)
Ketersediaan
Keandalan (satu tahun)
Keandalan (lima tahun)
Keandalan (sepuluh tahun)
Pusat data dengan satu UPS
72.805
2,36
0,9999678
90,63%
59,39%
35,33%
Pusat data dengan UPS redundan
160.617
2,36
0,9999726
94,70%
76,55%
57,48%

Apakah mungkin menghilangkan semua titik tunggal penyebab kegagalan? Jawabannya adalah mungkin. Solusinya adalah dengan menggunakan beban yang dilengkapi catu daya ganda atau dual cord. Dengan catu daya ganda, kita tidak lagi memerlukan ASTS tetapi memerlukan dua PDU. Kedua PDU memasok beban melalui catu daya gandanya. Jelas pada kondisi ini, satu-satunya single point of failure tinggal bebannya itu sendiri.

Jelas bahwa semakin tinggi keandalan yang diinginkan maka semakin tinggi pula biaya yang harus dikeluarkan. Untuk melakukan justifikasi biaya yang harus keluar biasanya dilakukan analisis resiko jika terjadi kegagalan. Resiko kerugian finansial yang terjadi bisa dihitung sebagai berikut:

Resiko (\$/tahun)=laju kegagalan (kegagalan/tahun) \times kerugian (\$/kegagalan)

Yang paling sulit disini adalah menentukan besarnya kerugian pada setiap kegagalan karena ada banyak faktor yang berpengaruh. Ada banyak biaya langsung dan biaya tak langsung yang berpengaruh dalam menentukan besarnya kerugian pada setiap kegagalan. Perlu pula dicatat bahwa menambahkan banyak komponen atau peralatan tidak selalu menaikkan ketersediaan atau keandalan. Ada titik optimum yang mana penambahan peralatan malah menurunkan keandalan.

5. Kesimpulan

Pembahasan diatas menunjukkan bahwa ketersediaan yang tinggi tidak selalu identik dengan keandalan yang tinggi. Ada banyak faktor lain seperti MTBF, MTTR, dan waktu yang berpengaruh pada keandalan. Kemampuan untuk menerapkan konsep keandalan dalam pemilihan sistem sangat penting untuk menentukan sistem mana yang paling sesuai dengan kebutuhan.

About angin165

Pria, Indonesia, muda, lajang, belum mapan.
This entry was posted in Application, Miscellanous. Bookmark the permalink.

3 Responses to Keandalan dan Ketersediaan

  1. JBD says:

    Kok 9 bulan nggak ada artikel baru ?

  2. dahono says:

    hehehe sampeyan yang nulis dong

  3. di liat dari gambar sistem redundan aku udah sedikit memahami.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s