Single Point Of Failure | A Simple Overview – RankRed

Ce este punctul unic de esec numit si single point of failure?

author
6 minutes, 58 seconds Read

În domeniul tehnologiei informației, proiectarea sistemelor implică procesul de determinare a arhitecturii, interfețelor, modulelor și datelor pentru ca un sistem să îndeplinească anumite cerințe. Este un proces crucial pentru îmbunătățirea eficienței dezvoltării produselor/serviciilor și pentru a permite o experiență excelentă pentru utilizator.

Să presupunem că aveți o aplicație care deservește milioane de utilizatori în fiecare zi. Pe partea de server, trebuie să aveți o inginerie excelentă pentru a gestiona un volum atât de mare de solicitări. Solicitările serverului nu trebuie să eșueze niciodată, chiar dacă există o problemă cu baza de date sau o defecțiune hardware.

Cu toate acestea, dacă backend-ul sau front-end-ul nu este proiectat corect, o simplă greșeală ar putea închide întreaga aplicație – totul, de la server la rețeaua la nivel de computer. Una dintre sursele majore ale unor astfel de erori este Single Point Of Failure (SPOF).

În acest articol de prezentare generală, am explicat de ce SPOF este cea mai gravă problemă pentru profesioniștii IT, sursa sa comună și cum să atenuăm astfel de eșecuri. Să începem cu o întrebare de bază.

Ce este un singur punct de eșec?

Definiție: Un singur punct de defecțiune este orice parte a unui sistem care face ca întregul sistem să nu mai funcționeze dacă acesta eșuează. În termeni simpli, dacă un lucru se sparge, totul se prăbușește.

SPOF-urile apar din cauza proiectelor defectuoase și a tehnicilor slabe de implementare. Sunt nedorite în orice sistem, fie că este vorba de o aplicație software, un modul hardware, un sistem de producție sau o practică de afaceri.

De exemplu, dacă rulați un site web care este găzduit pe un singur server într-o anumită locație, atunci acel server ar fi un singur punct de eșec. Dacă serverul eșuează, vizitatorii nu vor putea accesa site-ul web. Acest singur punct poate opri orice activitate legată de site-ul dvs. web. Dacă un astfel de risc există în afacerea dvs., trebuie să luați măsuri pentru a atenua acel risc.

Care este Soluția?

Cea mai eficientă modalitate de a reduce riscul potențial al SPOF este adăugarea de redundanță. Aceasta implică instalarea de componente hardware redundante și aplicații software.

De exemplu, s-ar putea folosi Redundant Arrays of Independent Disks (RAID) pentru a stoca baze de date Directory Server sau pentru a implementa mai multe instanțe duplicate de Directory Server pe diferite gazde.

Redundanța poate fi adăugată la diferite niveluri. Să luăm exemplul unui șofer de taxi independent. La un nivel scăzut, poate avea unelte și piese de schimb pentru a repara vehiculul, în cazul în care acesta se defectează. La nivel mediu, el poate împrumuta taxiul prietenului său pentru a face treaba. La cel mai înalt nivel, poate avea o altă mașină și suficiente componente pentru a înlocui complet piesele defecte în cazul unor defecțiuni multiple.

Acum, să vedem exemplul simplu de redundanță în calcul.

1.) Într-o configurare simplă, ar putea exista mai multe puncte unice posibile de eșec.

figura 1

2.) Unele puncte de defecțiune pot fi evitate prin adăugarea de componente hardware duplicat.

Figura 2

3). Zero SPOF poate fi atins prin construirea unui sistem complet redundant, deși această configurare este mult mai costisitoare decât configurarea simplă prezentată în figura 1.

La nivel de sistem, un echilibrator de încărcare poate fi implementat pentru a asigura o disponibilitate ridicată pentru un cluster de servere. În acest caz, fiecare server poate avea mai multe hard disk-uri, surse de alimentare și alte module. Un nivel mai ridicat de redundanță poate fi atins prin adăugarea de servere suplimentare care ar putea prelua o încărcătură de servere active dacă eșuează.

Centrul de date în sine acceptă multe operațiuni, cum ar fi logica de afaceri. Prin urmare, este în sine un potențial SPOF pentru afacere, dacă caracteristicile sale nu pot fi replicate în altă parte.

La nivelul site-ului (cel mai înalt), întregul centru de date poate fi replicat în diferite setări și accesat atunci când serverul primar nu răspunde. Acest tip de redundanță este de obicei punctul central al unui program de reziliență sau de recuperare în caz de dezastru IT.

Pentru a nu avea SPOF, rețelele mari – inclusiv Internetul și ARPANET – folosesc comutarea de pachete, o tehnică de rutare și transfer de date printr-o rețea digitală în pachete. Utilizează căile multiple dintre două gazde din rețele și utilizează în mod optim capacitatea canalului.

Citiți: 10 organizații care controlează internetul

Când există o defecțiune în orice nod între cele două gazde, datele sunt transferate printr-un nod alternativ. Comutarea de pachete minimizează, de asemenea, latența transmisiei și crește robustețea comunicării.

Există trei protocoale de rețea care sunt utilizate pe scară largă pentru a preveni un singur punct de defecțiune:

  • Sistem intermediar în sistem intermediar mută informația eficient într-o rețea de calculatoare, determinând cea mai bună rută pentru date.
  • Open Shortest Path First distribuie informații de rutare între routerele care aparțin unui singur sistem autonom. Folosește primul algoritm cu calea cea mai scurtă (algoritmul lui Dijkstra) pentru a transmite date.
  • Shortest Path Bridging simplifică dezvoltarea și configurarea unei rețele, permițând în același timp rutarea cu mai multe căi.

Evaluarea SPOF

Cele trei locuri comune în care apar SPOF sunt hardware-ul, software-ul și serviciile/furnizorii terți. Oamenii sunt, de asemenea, un singur punct de eșec în majoritatea organizațiilor, dar sunt adesea trecute cu vederea. Oamenii dintr-o afacere pot fi SPOF din mai multe motive, cum ar fi greșeli, fraudă, necinste, lipsă de cunoștințe și experiență limitată.

Odată ce detectați SPOF, următorul pas este să îl clasificați în funcție de cât de dificil este să îl remediați. Ar putea fi trei categorii:

Ușor: poate fi reparat într-un timp și un cost rezonabil.
Moderat: nu poate fi remediat direct; cu toate acestea, ar putea fi dezvoltată o soluție fiabilă.
Dificil: Defecțiunea este dificilă și foarte costisitoare de remediat.

În plus, SPOF-urile pot fi clasificate în funcție de probabilitatea de apariție (risc scăzut, mediu și ridicat) și impactul lor asupra afacerii (impact scăzut, mediu și mare).

Prevenirea punctului unic de eșec

Deoarece atât de multe procese esențiale depind de conectivitatea rețelei, întreruperile centrelor de date nu pot fi pur și simplu tolerate. Cu toate acestea, peste 30% din toate centrele de date se confruntă cu o întrerupere anual. Aproximativ 34% dintre companii spun că o oră de întrerupere costă mai mult de 1 milion de dolari.

Indiferent de pierderile care au apărut din cauza timpului de nefuncționare a centrului de date, realitatea este că 80% dintre întreruperi pot fi prevenite. În timp ce orice instrument din rețea poate reprezenta un pericol SPOF, majoritatea întreruperilor sunt cauzate de malware și alte amenințări cibernetice.

Instrumentele moderne de protecție împotriva amenințărilor, inclusiv echilibrarea încărcăturii, sistemele de prevenire a intruziunilor, firewall-urile pentru aplicații web și soluțiile de protecție avansată împotriva amenințărilor sunt întotdeauna expuse riscului în timpul întreruperilor de curent sau defectării controlerului de interfață de rețea sau când filtrează traficul de internet.

Aceste instrumente sunt vulnerabile atât la amenințări obișnuite, cum ar fi atacurile cu forță brută, cât și la amenințări complexe, cum ar fi implementarea de entități externe XML sau falsificarea cererilor pe mai multe site-uri. Deoarece nu pot proteja rețeaua tot timpul, este necesar să se ia măsuri de securitate redundante.

Există mai multe metode de implementare a arhitecturii firewall a aplicațiilor web care minimizează eficacitatea și frecvența unei game largi de atacuri. Firewall-urile pentru aplicații web cu mai multe niveluri, de exemplu, separă diferite module de aplicații în funcție de operațiunile lor în mai multe niveluri.

Deoarece fiecare nivel rulează pe un sistem individual, nu există SPOF. În același mod, implementarea corectă a mai multor echilibratori de încărcare poate reduce punctul unic de defecțiune într-o rețea.

 

Voteaza post

Asemanatoare