Η αποτυχία του Facebook δείχνει γιατί δεν πρέπει να βασιζόμαστε σε αυτό για τα πάντα

Πίνακας περιεχομένων:

Η αποτυχία του Facebook δείχνει γιατί δεν πρέπει να βασιζόμαστε σε αυτό για τα πάντα
Η αποτυχία του Facebook δείχνει γιατί δεν πρέπει να βασιζόμαστε σε αυτό για τα πάντα
Anonim

Βασικά Takeaways

  • Τα τεχνικά προβλήματα του Facebook ήταν ατυχή, αλλά το πρόβλημα πιθανότατα θα είχε επιλυθεί πολύ πιο γρήγορα εάν δεν βασιζόταν σε τόσα πολλά διασυνδεδεμένα συστήματα.
  • Δεν υπάρχει τρόπος να αποτραπούν πλήρως οι αποτυχίες του συστήματος, αλλά υπάρχουν τρόποι να τις καταστήσετε λιγότερο πιθανές.
  • Έχοντας εφεδρικά σχέδια για το πότε (όχι εάν, πότε) ένα σύστημα αποτυγχάνει μπορεί να κάνει τη διαφορά μεταξύ "ενοχλητικού" και "καταστροφικού".'
Image
Image

Η πρόσφατη καταστροφή του Facebook δείχνει πώς τα διασυνδεδεμένα συστήματα είναι βέβαιο ότι θα αποτύχουν και γιατί δεν πρέπει να τα χρησιμοποιούμε για τα πάντα.

Η απώλεια του Facebook, του WhatsApp και του Instagram για αρκετές ώρες τη Δευτέρα ήταν άβολη, επιζήμια για τις επιχειρήσεις και σε ορισμένες περιπτώσεις, σχεδόν καταστροφική. Σύμφωνα με το Facebook, όλα οφείλονταν σε αλλαγές διαμόρφωσης στους δρομολογητές συντονισμού του δικτύου του.

Είναι μια λογική εξήγηση, αλλά το γεγονός ότι ένα μόνο σφάλμα όπως αυτό θα μπορούσε να σταματήσει όχι μόνο το Facebook αλλά και άλλα συστήματα που ανήκουν στο Facebook είναι λίγο ανησυχητικό.

Μια λανθασμένη αλλαγή διαμόρφωσης δρομολογητή προκάλεσε τη διακοπή λειτουργίας πολλών υπηρεσιών, ακόμη και ακουστικών VR. Επιπλέον, κατά την παραδοχή του ίδιου του Facebook, είχε επίσης μια κλιμακωτή επίδραση στον τρόπο επικοινωνίας των κέντρων δεδομένων της εταιρείας, με αποτέλεσμα να σταματήσουν όλες οι υπηρεσίες τους.

"Η εξάρτηση από διασυνδεδεμένα συστήματα συνεπάγεται έναν εγγενή κίνδυνο αποτυχίας του συστήματος ή ακόμα και της υπηρεσίας", δήλωσε ο Francesco Altomare, ανώτερος τεχνικός μηχανικός πωλήσεων στην GlobalDots, σε μια συνέντευξη μέσω email στο Lifewire, "Για να αντιμετωπίσουν αυτόν τον τρομακτικό κίνδυνο, οι εταιρείες χρησιμοποιούν την αρχή του SRE (System Reliability Engineering), καθώς και άλλα εργαλεία, τα οποία όλα ασχολούνται με διαφορετικά επίπεδα πλεονασμού ενσωματωμένα σε κάθε επίπεδο της υποδομής ενός συστήματος."

Image
Image

Τι μπορεί να πάει στραβά

Αξίζει να σημειωθεί ότι όταν ένα σύστημα όπως αυτό αποτυγχάνει, συνήθως απαιτεί μια τέλεια καταιγίδα πραγμάτων που πάνε στραβά. Μοιάζει λιγότερο με ένα τραπουλόχαρτο που περιμένει να πέσει και περισσότερο σαν μια εκτεθειμένη θερμική θύρα εξάτμισης σε έναν διαστημικό σταθμό στο μέγεθος ενός μικρού φεγγαριού.

Οι περισσότερες εταιρείες λαμβάνουν μέτρα για να προσπαθήσουν να διασφαλίσουν ότι το μόνο πράγμα που θα μπορούσε να φέρει τα πάντα στο χάος δεν θα συμβεί ποτέ - αλλά ανεξάρτητα από αυτό, μπορεί να συμβεί.

"Οι απροσδόκητες αποτυχίες αποτελούν μέρος της επιχείρησης και μπορεί να προκύψουν ως αποτέλεσμα αμέλειας των εργαζομένων, σφαλμάτων στο δίκτυο του παρόχου υπηρεσιών Διαδικτύου ή ακόμα και των υπηρεσιών αποθήκευσης cloud που αντιμετωπίζουν προβλήματα", δήλωσε η Sally Stevens, συνιδρυτής της FastPeopleSearch, στο μια συνέντευξη μέσω email.

"…Εφόσον τεθούν σε εφαρμογή τα απαραίτητα βήματα για την προστασία του συστήματος-όπως αντίγραφα ασφαλείας, επιτόπιος δρομολογητής και κλιμακωτή πρόσβαση, αυτές οι αποτυχίες είναι μάλλον απίθανες." Παρόλο που ακόμη και με έναν στρατό απορριμμάτων ασφαλείας, είναι ακόμα πιθανό να αποτύχει το λυχνάρι.

Εάν το σύστημα που ελέγχει πράγματα όπως οι κύριες μορφές επαφής, οι συσκευές, οι πόρτες κ.λπ., αποτύχει, τα αποτελέσματα μπορεί να είναι σημαντικά. Από ήπια ταλαιπωρία έως πλήρη καταστροφή, ανάλογα με το πόσο τα άτομα και οι εταιρείες βασίζονται σε όλα.

Image
Image

"Υπάρχει επίσης ο κίνδυνος εισβολής χάκερ στο σύστημα από οποιαδήποτε από τις λιγότερο προστατευμένες συσκευές, όπως ψυγεία και τοστιέρες φούρνου", πρόσθεσε ο Stevens, "που θα μπορούσε να οδηγήσει σε κλοπή δεδομένων και ransomware."

Πώς μπορούμε να προετοιμαστούμε

Δεν υπάρχει τρόπος να εγγυηθεί κανείς ότι ένα σύστημα δεν θα αποτύχει ποτέ, αλλά υπάρχουν βήματα που μπορούν να ληφθούν είτε για να καταστήσουν λιγότερο πιθανή την αποτυχία είτε για την πιο ομαλή αντιμετώπιση της αποτυχίας. Ένας συνδυασμός των δύο προσεγγίσεων που συνδυάζει ασφαλή αστοχία και αντίμετρα με σχέδια έκτακτης ανάγκης και εφεδρικά συστήματα θα ήταν ιδανικός.

"Για την εξάλειψη αυτών των κινδύνων που δημιουργούνται από προϊόντα και υπηρεσίες τρίτων που αντιμετωπίζονται αποτελεσματικά, οι ρόλοι και τα καθήκοντα σχετικά με τη Διαχείριση Κινδύνων Τρίτων πρέπει να περιγράφονται αυστηρά", δήλωσε η Daniela Sawyer, ιδρύτρια και επικεφαλής τεχνολογίας του FindPeopleFast, σε μια συνέντευξη μέσω email, "Για να ανθίσουν σε αυτό το νέο περιβάλλον, οι διαχειριστές κινδύνου πρέπει να κατανοήσουν τα βασικά μέρη ενός τόσο εξελιγμένου οικοσυστήματος."

Αυτό που συνέβη με το Facebook, το WhatsApp και το Instagram ήταν ατυχές, αλλά και ελπίζω να μας άνοιξε τα μάτια. Οι άνθρωποι που βασίζονται σε διασυνδεδεμένα συστήματα πρέπει να καταλάβουν ότι το σωστό λάθος μπορεί να διαταράξει τα πάντα. Και πρέπει να τεθούν σε εφαρμογή μέτρα (ή να εξεταστούν και να τελειοποιηθούν) για να καταστούν τέτοιες διαταραχές λιγότερο πιθανές και λιγότερο επιδράσεις.

Στην περίπτωση του Facebook, το πρόβλημά του δεν ήταν τα προβλήματα του δρομολογητή, αλλά η σύνδεση σχεδόν ολόκληρου του οικοσυστήματος με οτιδήποτε άλλο. Έτσι, με το Facebook (η υπηρεσία) εκτός λειτουργίας, το Facebook (η εταιρεία) έπρεπε να ξοδέψει πολύ περισσότερο χρόνο και ενέργεια απλώς για να οργανώσει και να αντιμετωπίσει το ζήτημα. Εάν είτε δεν χρησιμοποιούσε ένα τόσο βαθιά ριζωμένο, διασυνδεδεμένο σύστημα είτε είχε εφεδρικά σχέδια για την αντιμετώπιση μιας τέτοιας διακοπής λειτουργίας, πιθανότατα θα χρειαζόταν πολύ λιγότερος χρόνος για να διορθωθεί.

Συνιστάται: