Πώς να κάνετε μια δοκιμή T στο Excel

Πίνακας περιεχομένων:

Πώς να κάνετε μια δοκιμή T στο Excel
Πώς να κάνετε μια δοκιμή T στο Excel
Anonim

Το T-test είναι ένας τρόπος για να αποφασίσετε εάν υπάρχουν στατιστικά σημαντικές διαφορές μεταξύ των συνόλων δεδομένων, χρησιμοποιώντας την κατανομή t του Student. Το T-Test στο Excel είναι ένα T-test δύο δειγμάτων που συγκρίνει τους μέσους όρους δύο δειγμάτων. Αυτό το άρθρο εξηγεί τι σημαίνει στατιστική σημασία και δείχνει πώς να κάνετε ένα T-Test στο Excel.

Οι οδηγίες σε αυτό το άρθρο ισχύουν για το Excel 2019, 2016, 2013, 2010, 2007. Excel για Microsoft 365 και Excel Online.

Image
Image

Τι είναι η Στατιστική Σημασία;

Φανταστείτε ότι θέλετε να μάθετε ποιο από τα δύο ζάρια θα δώσει καλύτερη βαθμολογία. Ρίχνεις το πρώτο ζάρι και παίρνεις 2. ρίχνεις το δεύτερο ζάρι και παίρνεις 6. Αυτό σας λέει ότι το δεύτερο ζάρι συνήθως δίνει υψηλότερες βαθμολογίες; Εάν απαντήσατε, "Φυσικά όχι", τότε έχετε ήδη κάποια κατανόηση της στατιστικής σημασίας. Καταλαβαίνετε ότι η διαφορά οφειλόταν στην τυχαία αλλαγή στο σκορ, κάθε φορά που ρίχνεται ένα ζάρι. Επειδή το δείγμα ήταν πολύ μικρό (μόνο ένα ρολό) δεν έδειξε τίποτα σημαντικό.

Τώρα φανταστείτε ότι ρίχνετε κάθε ζάρι 6 φορές:

  • Το πρώτο ζάρι ρολά 3, 6, 6, 4, 3, 3. Μέσος όρος=4,17
  • Το δεύτερο ζάρι ρολά 5, 6, 2, 5, 2, 4. Μέσος όρος=4,00

Αποδεικνύει τώρα ότι το πρώτο ζάρι δίνει υψηλότερες βαθμολογίες από το δεύτερο; Πιθανώς όχι. Ένα μικρό δείγμα με σχετικά μικρή διαφορά μεταξύ των μέσων, καθιστά πιθανό ότι η διαφορά εξακολουθεί να οφείλεται σε τυχαίες παραλλαγές. Καθώς αυξάνουμε τον αριθμό των ζαριών, καθίσταται δύσκολο να δώσουμε μια κοινή λογική απάντηση στην ερώτηση - είναι η διαφορά μεταξύ των βαθμολογιών το αποτέλεσμα τυχαίας διακύμανσης ή είναι πραγματικά πιο πιθανό το ένα να δώσει υψηλότερες βαθμολογίες από το άλλο;

Σημασία είναι η πιθανότητα ότι μια παρατηρούμενη διαφορά μεταξύ των δειγμάτων οφείλεται σε τυχαίες παραλλαγές. Η σημασία ονομάζεται συχνά άλφα επίπεδο ή απλά «α». Το επίπεδο εμπιστοσύνης, ή απλά 'c,' είναι η πιθανότητα ότι η διαφορά μεταξύ των δειγμάτων δεν οφείλεται σε τυχαία διακύμανση. με άλλα λόγια, ότι υπάρχει διαφορά μεταξύ των υποκείμενων πληθυσμών. Επομένως: c=1 – α

Μπορούμε να ορίσουμε το «α» σε όποιο επίπεδο θέλουμε, για να νιώθουμε σίγουροι ότι έχουμε αποδεδειγμένη σημασία. Πολύ συχνά χρησιμοποιείται α=5% (εμπιστοσύνη 95%), αλλά αν θέλουμε να είμαστε πραγματικά σίγουροι ότι τυχόν διαφορές δεν προκαλούνται από τυχαία διακύμανση, μπορεί να εφαρμόσουμε υψηλότερο επίπεδο εμπιστοσύνης, χρησιμοποιώντας α=1% ή ακόμα και α=0,1 %.

Χρησιμοποιούνται διάφορες στατιστικές δοκιμές για τον υπολογισμό της σημαντικότητας σε διαφορετικές καταστάσεις. Τα τεστ T χρησιμοποιούνται για να προσδιοριστεί εάν οι μέσοι όροι δύο πληθυσμών είναι διαφορετικοί και οι δοκιμές F χρησιμοποιούνται για να προσδιοριστεί εάν οι διακυμάνσεις είναι διαφορετικές.

Γιατί Δοκιμή για Στατιστική Σημασία;

Όταν συγκρίνουμε διαφορετικά πράγματα, πρέπει να χρησιμοποιούμε τη δοκιμή σημασίας για να προσδιορίσουμε εάν το ένα είναι καλύτερο από το άλλο. Αυτό ισχύει για πολλά πεδία, για παράδειγμα:

  • Στην επιχείρηση, οι άνθρωποι πρέπει να συγκρίνουν διαφορετικά προϊόντα και μεθόδους μάρκετινγκ.
  • Στα αθλήματα, οι άνθρωποι πρέπει να συγκρίνουν διαφορετικό εξοπλισμό, τεχνικές και ανταγωνιστές.
  • Στη μηχανική, οι άνθρωποι πρέπει να συγκρίνουν διαφορετικά σχέδια και ρυθμίσεις παραμέτρων.

Αν θέλετε να ελέγξετε εάν κάτι αποδίδει καλύτερα από κάτι άλλο, σε οποιοδήποτε πεδίο, πρέπει να ελέγξετε τη στατιστική σημαντικότητα.

Τι είναι η Κατανομή Τ για μαθητή;

Η κατανομή t ενός Student είναι παρόμοια με μια κανονική (ή Gaussian) κατανομή. Αυτές είναι και οι δύο κατανομές σε σχήμα καμπάνας με τα περισσότερα αποτελέσματα κοντά στο μέσο όρο, αλλά ορισμένα σπάνια συμβάντα απέχουν αρκετά από τον μέσο όρο και στις δύο κατευθύνσεις, που αναφέρονται ως ουρές της κατανομής.

Το ακριβές σχήμα της κατανομής t του Student εξαρτάται από το μέγεθος του δείγματος. Για δείγματα άνω των 30 είναι πολύ παρόμοια με την κανονική κατανομή. Καθώς το μέγεθος του δείγματος μειώνεται, οι ουρές γίνονται μεγαλύτερες, αντιπροσωπεύοντας την αυξημένη αβεβαιότητα που προκύπτει από την εξαγωγή συμπερασμάτων με βάση ένα μικρό δείγμα.

Πώς να κάνετε ένα T-Test στο Excel

Προτού μπορέσετε να εφαρμόσετε ένα T-Test για να προσδιορίσετε εάν υπάρχει στατιστικά σημαντική διαφορά μεταξύ των μέσων τιμών δύο δειγμάτων, πρέπει πρώτα να εκτελέσετε ένα F-Test. Αυτό συμβαίνει επειδή για το T-Test εκτελούνται διαφορετικοί υπολογισμοί ανάλογα με το αν υπάρχει σημαντική διαφορά μεταξύ των διακυμάνσεων.

Θα χρειαστείτε το πρόσθετο Analysis Toolpak για να εκτελέσετε αυτήν την ανάλυση.

Έλεγχος και φόρτωση του πρόσθετου πακέτου εργαλείων ανάλυσης

Για να ελέγξετε και να ενεργοποιήσετε την Πακέτα εργαλείων ανάλυσης, ακολουθήστε τα εξής βήματα:

  1. Επιλέξτε την καρτέλα FILE >επιλέξτε Επιλογές.
  2. Στο πλαίσιο διαλόγου Επιλογές, επιλέξτε Add-Ins από τις καρτέλες στην αριστερή πλευρά.
  3. Στο κάτω μέρος του παραθύρου, επιλέξτε το αναπτυσσόμενο μενού Διαχείριση και, στη συνέχεια, επιλέξτε Πρόσθετα Excel. Επιλέξτε Go.

    Image
    Image
  4. Βεβαιωθείτε ότι το πλαίσιο ελέγχου δίπλα στο Analysis Toolpak είναι επιλεγμένο και, στη συνέχεια, επιλέξτε OK.
  5. Το πακέτο εργαλείων ανάλυσης είναι πλέον ενεργό και είστε έτοιμοι να εφαρμόσετε F-Tests και T-Tests.

Εκτέλεση ενός F-Test και ενός T-Test στο Excel

  1. Εισαγάγετε δύο σύνολα δεδομένων σε ένα υπολογιστικό φύλλο. Σε αυτήν την περίπτωση, εξετάζουμε τις πωλήσεις δύο προϊόντων κατά τη διάρκεια μιας εβδομάδας. Υπολογίζεται επίσης η μέση ημερήσια αξία πωλήσεων για κάθε προϊόν, μαζί με την τυπική του απόκλιση.

    Image
    Image
  2. Επιλέξτε την καρτέλα Data > Ανάλυση δεδομένων

    Image
    Image
  3. Επιλέξτε F-Test Two-Sample for Variance από τη λίστα και, στη συνέχεια, επιλέξτε OK.

    Image
    Image

    Το F-Test είναι εξαιρετικά ευαίσθητο στη μη κανονικότητα. Επομένως, μπορεί να είναι ασφαλέστερο να χρησιμοποιήσετε μια δοκιμή Welch, αλλά αυτό είναι πιο δύσκολο στο Excel.

  4. Επιλέξτε το εύρος μεταβλητής 1 και το εύρος μεταβλητής 2. ορίστε το Alpha (0,05 δίνει 95% εμπιστοσύνη). επιλέξτε ένα κελί για την επάνω αριστερή γωνία της εξόδου, λαμβάνοντας υπόψη ότι αυτό θα γεμίσει 3 στήλες και 10 σειρές. Επιλέξτε OK.

    Image
    Image

    Για το εύρος μεταβλητής 1, πρέπει να επιλεγεί το δείγμα με τη μεγαλύτερη τυπική απόκλιση (ή διακύμανση).

  5. Δείτε τα αποτελέσματα του F-Test για να προσδιορίσετε εάν υπάρχει σημαντική διαφορά μεταξύ των διακυμάνσεων. Τα αποτελέσματα δίνουν τρεις σημαντικές τιμές:

    • F: Η αναλογία μεταξύ των διακυμάνσεων.
    • P(F<=f) one-tail: Η πιθανότητα η μεταβλητή 1 να μην έχει στην πραγματικότητα μεγαλύτερη διακύμανση από τη μεταβλητή 2. Εάν αυτή είναι μεγαλύτερη από την άλφα, η οποία είναι γενικά 0,05, τότε δεν υπάρχει σημαντική διαφορά μεταξύ των διακυμάνσεων.
    • F Critical one-tail: Η τιμή του F που θα απαιτούνταν για να δώσει P(F<=f)=α. Εάν αυτή η τιμή είναι μεγαλύτερη από F, αυτό σημαίνει επίσης ότι δεν υπάρχει σημαντική διαφορά μεταξύ των διακυμάνσεων.

    Το P(F<=f) μπορεί επίσης να υπολογιστεί χρησιμοποιώντας τη συνάρτηση FDIST με F και τους βαθμούς ελευθερίας για κάθε δείγμα ως είσοδο. Οι βαθμοί ελευθερίας είναι απλώς ο αριθμός των παρατηρήσεων σε ένα δείγμα μείον ένα.

  6. Τώρα που ξέρετε εάν υπάρχει διαφορά μεταξύ των αποκλίσεων, μπορείτε να επιλέξετε το κατάλληλο T-Test. Επιλέξτε την καρτέλα Data > Ανάλυση δεδομένων και, στη συνέχεια, επιλέξτε είτε t-Test: Two-Sample Assuming Equal Variance ή t-Test: Δύο-Δείγματα υποθέτοντας άνισες διακυμάνσεις

    Image
    Image
  7. Ανεξάρτητα από την επιλογή που επιλέξατε στο προηγούμενο βήμα, θα εμφανιστεί το ίδιο πλαίσιο διαλόγου για να εισαγάγετε τις λεπτομέρειες της ανάλυσης. Για να ξεκινήσετε, επιλέξτε τα εύρη που περιέχουν τα δείγματα για Εύρος Μεταβλητής 1 και Εύρος Μεταβλητής 2.

    Image
    Image
  8. Υποθέτοντας ότι θέλετε να ελέγξετε για μη διαφορά μεταξύ των μέσων, ορίστε την Υποθετική μέση διαφορά σε μηδέν.
  9. Ορίστε το επίπεδο σημασίας Alpha (0,05 δίνει 95% εμπιστοσύνη) και επιλέξτε ένα κελί για την επάνω αριστερή γωνία της εξόδου, λαμβάνοντας υπόψη ότι αυτό θα γεμίσει 3 στήλες και 14 σειρές. Επιλέξτε OK.
  10. Ελέγξτε τα αποτελέσματα για να αποφασίσετε εάν υπάρχει σημαντική διαφορά μεταξύ των μέσων.

    Ακριβώς όπως με το F-Test, εάν η τιμή p, σε αυτήν την περίπτωση P(T<=t), είναι μεγαλύτερη από την άλφα, τότε δεν υπάρχει σημαντική διαφορά. Ωστόσο, σε αυτή την περίπτωση δίνονται δύο τιμές p, μία για δοκιμή μιας ουράς και η άλλη για δοκιμή δύο ουρών. Σε αυτήν την περίπτωση, χρησιμοποιήστε την τιμή δύο ουρών, καθώς οποιαδήποτε μεταβλητή έχει μεγαλύτερο μέσο όρο θα ήταν σημαντική διαφορά.

Συνιστάται: