কেওস ইঞ্জিনিয়ারিং (Chaos Engineering)

কেওস ইঞ্জিনিয়ারিং (Chaos Engineering) বা CE হল ডিস্ট্রিবিউটেড সিস্টেমে (distributed system) পরীক্ষা করার শৃঙ্খলা যাতে কোলাহলপূর্ণ এবং অপ্রত্যাশিত পরিস্থিতি সহ্য করার জন্য সিস্টেমে ক্ষমতা তৈরি হয়।

এটা যেসব সমস্যাতে দৃষ্টিপাত করে

SRE (Site reliability engineering) এবং DevOps অনুশীলনে, প্রোডাক্টের স্থিতিস্থাপকতা (resiliency) এবং নির্ভরযোগ্যতা (reliability) বাড়ানোর কৌশলের উপর ফোকাস করে। পর্যাপ্ত পরিষেবার মান নিশ্চিত করার সময়, একটি সিস্টেমের ব্যর্থতা সহ্য করার ক্ষমতা সাধারণত সফ্টওয়্যার ডেভেলপমেন্টে খুব প্রয়োজনীয়। এমন বেশ কয়েকটি দিক জড়িত যা একটি অ্যাপ্লিকেশনের আউটেজের দিকে নিয়ে যেতে পারে, যেমন অবকাঠামো (infrastructure), প্ল্যাটফর্ম (platform), বা (মাইক্রোসার্ভিস-ভিত্তিক (microservices)) অ্যাপ্লিকেশনের অন্যান্য চলমান অংশ। প্রোডাকশন পরিবেশে নতুন ফিচারগুলির খুব তাড়াতাড়ি একের পর এক স্থাপনের ফলে ডাউনটাইম (downtime) হওয়ার সম্ভাবনা বেড়ে যায় এবং একটি গুরুতর ঘটনাও ঘটতে পারে — যা ব্যবসার জন্য যথেষ্ট পরিণতিপূর্ণ।

এটা কিভাবে সাহায্য করে

কেওস ইঞ্জিনিয়ারিং হল স্থিতিস্থাপকতার প্রয়োজনীয়তা পূরণ করার একটি কৌশল। এটি অবকাঠামো (Infrustracture), প্ল্যাটফর্ম (Platform) এবং অ্যাপ্লিকেশন ব্যর্থতার (Application failure) বিরুদ্ধে স্থিতিস্থাপকতা অর্জন করতে ব্যবহৃত হয়। একটি অ্যাপ্লিকেশন, অবকাঠামো বা প্ল্যাটফর্ম স্ব-নিরাময় (Self-heal) করতে পারে তা যাচাই করার জন্য কেওস ইঞ্জিনিয়াররা কেয়স এক্সপেরিমেন্ট ব্যবহার করে সক্রিয়ভাবে ব্যর্থতাগুলিকে ইঞ্জেক্ট করে এবং তাতে ব্যর্থতাগুলি গ্রাহকদের লক্ষণীয়ভাবে প্রভাবিত করতে পারে না। কেয়স এক্সপেরিমেন্টের লক্ষ্য অন্ধ দাগ (Blind-spots) আবিষ্কার করা (যেমন Monitoring বা Autoscaling কৌশল) এবং সমালোচনামূলক ঘটনার সময়ে দলগুলির মধ্যে যোগাযোগ উন্নত করা। এই পদ্ধতিটি স্থিতিস্থাপকতা বাড়াতে সাহায্য করে এবং জটিল সিস্টেমে বিশেষ করে প্রোডাকশন দলের আস্থা বাড়ায়।


সর্বশেষ পরিবর্তিত February 24, 2024: [bn] Update main branch with dev-bn (#2894) (19b78e4)