Πώς να εκτελέσετε την παλινδρόμηση στο Excel

Πίνακας περιεχομένων:

Πώς να εκτελέσετε την παλινδρόμηση στο Excel
Πώς να εκτελέσετε την παλινδρόμηση στο Excel
Anonim

Η παλινδρόμηση στο Excel είναι ένας τρόπος αυτοματοποίησης της στατιστικής διαδικασίας σύγκρισης πολλών συνόλων πληροφοριών για να δείτε πώς οι αλλαγές σε ανεξάρτητες μεταβλητές επηρεάζουν τις αλλαγές στις εξαρτημένες μεταβλητές. Αν θελήσατε ποτέ να βρείτε μια συσχέτιση μεταξύ δύο πραγμάτων, η χρήση της ανάλυσης παλινδρόμησης στο Excel είναι ένας από τους καλύτερους τρόπους για να το κάνετε αυτό.

Οι οδηγίες σε αυτό το άρθρο ισχύουν για Excel 2019, Excel 2016, Excel 2013, Excel 2010.

Τι σημαίνει η παλινδρόμηση;

Η παλινδρόμηση είναι μια προσέγγιση στατιστικής μοντελοποίησης που χρησιμοποιούν οι αναλυτές για να προσδιορίσουν τις σχέσεις μεταξύ πολλαπλών μεταβλητών.

Η ανάλυση παλινδρόμησης ξεκινά με μια μεμονωμένη μεταβλητή που προσπαθείτε να αναλύσετε και ανεξάρτητες μεταβλητές που δοκιμάζετε για να δείτε αν επηρεάζουν τη συγκεκριμένη μεταβλητή. Η ανάλυση εξετάζει τις αλλαγές στις ανεξάρτητες μεταβλητές και επιχειρεί να συσχετίσει αυτές τις αλλαγές με τις προκύπτουσες αλλαγές στη μεμονωμένη (εξαρτημένη) μεταβλητή.

Αυτό μπορεί να ακούγεται σαν προηγμένα στατιστικά στοιχεία, αλλά το Excel κάνει αυτή τη σύνθετη ανάλυση διαθέσιμη σε οποιονδήποτε.

Εκτέλεση γραμμικής παλινδρόμησης στο Excel

Η απλούστερη μορφή ανάλυσης παλινδρόμησης είναι η γραμμική παλινδρόμηση. Η απλή γραμμική παλινδρόμηση εξετάζει τη σχέση μεταξύ δύο μόνο μεταβλητών.

Για παράδειγμα, το ακόλουθο υπολογιστικό φύλλο δείχνει δεδομένα που περιέχουν τον αριθμό των θερμίδων που έτρωγε ένα άτομο κάθε μέρα και το βάρος του εκείνη την ημέρα.

Image
Image

Δεδομένου ότι αυτό το υπολογιστικό φύλλο περιέχει δύο στήλες δεδομένων και η μία μεταβλητή θα μπορούσε ενδεχομένως να επηρεάσει την άλλη, μπορείτε να εκτελέσετε μια ανάλυση παλινδρόμησης σε αυτά τα δεδομένα χρησιμοποιώντας το Excel.

Ενεργοποίηση πρόσθετου πακέτου εργαλείων ανάλυσης

Προτού μπορέσετε να χρησιμοποιήσετε τη δυνατότητα ανάλυσης παλινδρόμησης του Excel, πρέπει να ενεργοποιήσετε το πρόσθετο Analysis ToolPak στην οθόνη Επιλογές του Excel.

  1. Στο Excel, επιλέξτε το μενού Αρχείο και επιλέξτε Επιλογές.

    Image
    Image
  2. Επιλέξτε Add-ins στο αριστερό μενού πλοήγησης. Στη συνέχεια, βεβαιωθείτε ότι το Excel Add-ins είναι επιλεγμένο στο πεδίο Manage.

    Image
    Image
  3. Τέλος, επιλέξτε το κουμπί Go.

    Image
    Image
  4. Στο αναδυόμενο παράθυρο των πρόσθετων. Ενεργοποιήστε το Analysis ToolPack κάνοντας κλικ στο πλαίσιο μπροστά του για να προσθέσετε ένα σημάδι επιλογής και επιλέξτε OK.

    Image
    Image

Τώρα που το Analysis ToolPak είναι ενεργοποιημένο, είστε έτοιμοι να ξεκινήσετε την ανάλυση παλινδρόμησης στο Excel.

Πώς να εκτελέσετε απλή γραμμική παλινδρόμηση στο Excel

Χρησιμοποιώντας το υπολογιστικό φύλλο βάρους και θερμίδων ως παράδειγμα, μπορείτε να εκτελέσετε μια ανάλυση γραμμικής παλινδρόμησης στο Excel ως εξής.

  1. Επιλέξτε το μενού Data. Στη συνέχεια, στην ομάδα Analysis, επιλέξτε Ανάλυση δεδομένων.

    Image
    Image
  2. Στο παράθυρο Data Analysis, επιλέξτε Regression από τη λίστα και κάντε κλικ στο OK.

    Image
    Image
  3. Το Είσοδος Y Range είναι το εύρος των κελιών που περιέχει την εξαρτημένη μεταβλητή. Σε αυτό το παράδειγμα, αυτό είναι το βάρος. Το Input X Range είναι το εύρος των κελιών που περιέχει την ανεξάρτητη μεταβλητή. Σε αυτό το παράδειγμα, αυτή είναι η στήλη θερμίδων.

    Image
    Image
  4. Επιλέξτε Ετικέτες για τα κελιά κεφαλίδας και, στη συνέχεια, επιλέξτε Νέο φύλλο εργασίας για να στείλετε τα αποτελέσματα σε ένα νέο φύλλο εργασίας. Επιλέξτε OK για να εκτελέσει το Excel την ανάλυση και να στείλει τα αποτελέσματα σε ένα νέο φύλλο.

    Image
    Image
  5. Εξετάστε το νέο φύλλο εργασίας. Το αποτέλεσμα της ανάλυσης έχει έναν αριθμό τιμών που πρέπει να κατανοήσετε για να ερμηνεύσετε τα αποτελέσματα.

    Image
    Image

    Καθένας από αυτούς τους αριθμούς έχει τις ακόλουθες έννοιες:

    • Πολλαπλό R: Ο συντελεστής συσχέτισης. Το 1 υποδηλώνει ισχυρή συσχέτιση μεταξύ των δύο μεταβλητών, ενώ το -1 σημαίνει ότι υπάρχει ισχυρή αρνητική σχέση. Το 0 σημαίνει ότι δεν υπάρχει συσχέτιση.
    • R Τετράγωνο: Ο Συντελεστής Προσδιορισμού, που δείχνει πόσα σημεία μεταξύ των δύο μεταβλητών εμπίπτουν στη γραμμή παλινδρόμησης. Στατιστικά, αυτό είναι το άθροισμα των τετραγωνικών αποκλίσεων από το μέσο όρο.
    • Προσαρμοσμένο Τετράγωνο R: Μια στατιστική τιμή που ονομάζεται τετράγωνο R που προσαρμόζεται για τον αριθμό των ανεξάρτητων μεταβλητών που έχετε επιλέξει.
    • Τυπικό σφάλμα: Πόσο ακριβή είναι τα αποτελέσματα της ανάλυσης παλινδρόμησης. Εάν αυτό το σφάλμα είναι μικρό, τότε τα αποτελέσματα παλινδρόμησης είναι πιο ακριβή.
    • Παρατηρήσεις: Ο αριθμός των παρατηρήσεων στο μοντέλο παλινδρόμησης.

    Οι υπόλοιπες τιμές στην έξοδο παλινδρόμησης σάς παρέχουν λεπτομέρειες σχετικά με μικρότερα στοιχεία στην ανάλυση παλινδρόμησης.

    • df: Στατιστική τιμή γνωστή ως βαθμοί ελευθερίας που σχετίζονται με τις πηγές διακύμανσης.
    • SS: Άθροισμα τετραγώνων. Ο λόγος του υπολειπόμενου αθροίσματος των τετραγώνων προς το συνολικό SS θα πρέπει να είναι μικρότερος εάν τα περισσότερα από τα δεδομένα σας ταιριάζουν στη γραμμή παλινδρόμησης.
    • MS: Μέσο τετράγωνο των δεδομένων παλινδρόμησης.
    • F: Η στατιστική F (δοκιμή F) για μηδενική υπόθεση. Αυτό παρέχει τη σημασία του μοντέλου παλινδρόμησης.
    • Σημασία F: Στατιστική τιμή γνωστή ως τιμή P του F.

    Εκτός και αν κατανοείτε τα στατιστικά στοιχεία και τον υπολογισμό των μοντέλων παλινδρόμησης, οι τιμές στο κάτω μέρος της περίληψης δεν θα έχουν πολύ νόημα. Ωστόσο, τα πολλαπλάσια R και R τετράγωνα είναι τα δύο πιο σημαντικά.

Όπως μπορείτε να δείτε, σε αυτό το παράδειγμα, οι θερμίδες έχουν ισχυρή συσχέτιση με το συνολικό βάρος.

Ανάλυση πολλαπλής γραμμικής παλινδρόμησης στο Excel

Για να εκτελέσετε την ίδια γραμμική παλινδρόμηση αλλά με πολλές ανεξάρτητες μεταβλητές, επιλέξτε ολόκληρο το εύρος (πολλές στήλες και σειρές) για το Εύρος εισόδου X.

Image
Image

Όταν επιλέγετε πολλές ανεξάρτητες μεταβλητές, είναι λιγότερο πιθανό να βρείτε τόσο ισχυρή συσχέτιση επειδή υπάρχουν τόσες πολλές μεταβλητές.

Ωστόσο, μια ανάλυση παλινδρόμησης στο Excel μπορεί να σας βοηθήσει να βρείτε συσχετίσεις με μία ή περισσότερες από αυτές τις μεταβλητές που μπορεί να μην αντιλαμβάνεστε ότι υπάρχουν απλώς ελέγχοντας τα δεδομένα με μη αυτόματο τρόπο.

Συνιστάται: