Συσχέτιση

Τι είναι η συσχέτιση:

Η συσχέτιση σημαίνει μια ομοιότητα ή σχέση μεταξύ δύο πραγμάτων, ανθρώπων ή ιδεών . Είναι μια ομοιότητα ή ισοδυναμία που υπάρχει μεταξύ δύο διαφορετικών υποθέσεων, καταστάσεων ή αντικειμένων.

Στον τομέα των στατιστικών και των μαθηματικών, ο συσχετισμός αναφέρεται σε ένα μέτρο μεταξύ δύο ή περισσοτέρων σχετικών μεταβλητών.

Ο όρος συσχέτιση είναι ένα θηλυκό ουσιαστικό που προέρχεται από το λατινικό συσχετισμό.

Η συσχέτιση λέξεων μπορεί να αντικατασταθεί από συνώνυμα όπως: σχέση, εξίσωση, σύνδεσμος, αντιστοιχία, αναλογία και σύνδεση.

Συντελεστής Συσχέτισης

Στις στατιστικές, ο συντελεστής συσχέτισης Pearson (r), ο οποίος ονομάζεται επίσης συντελεστής συσχέτισης προϊόντος-ροπής, μετρά τη σχέση μεταξύ δύο μεταβλητών εντός της ίδιας μετρικής κλίμακας.

Η συνάρτηση του συντελεστή συσχέτισης είναι να προσδιοριστεί η ένταση της σχέσης που υπάρχει ανάμεσα σε γνωστά σύνολα δεδομένων ή πληροφοριών.

Η τιμή του συντελεστή συσχέτισης μπορεί να κυμαίνεται μεταξύ -1 και 1 και το αποτέλεσμα που προκύπτει ορίζει αν η συσχέτιση είναι αρνητική ή θετική.

Για να ερμηνεύσουμε τον συντελεστή είναι απαραίτητο να γνωρίζουμε ότι 1 σημαίνει ότι η συσχέτιση μεταξύ των μεταβλητών είναι τέλεια θετική και το -1 σημαίνει ότι είναι τέλεια αρνητική . Εάν ο συντελεστής είναι ίσος με 0 σημαίνει ότι οι μεταβλητές δεν εξαρτώνται ο ένας από τον άλλο.

Στα στατιστικά στοιχεία υπάρχει και ο συντελεστής συσχέτισης Spearman, ο οποίος φέρει αυτό το όνομα προς τιμήν του στατιστικού Charles Spearman. Η λειτουργία αυτού του συντελεστή είναι η μέτρηση της έντασης της σχέσης μεταξύ δύο μεταβλητών, είτε είναι γραμμικές είτε όχι.

Η συσχέτιση Spearman χρησιμεύει για να αξιολογήσει εάν η ένταση της σχέσης μεταξύ των δύο μεταβλητών μπορεί να μετρηθεί με μια μονότονη συνάρτηση (μαθηματική συνάρτηση που διατηρεί ή αναστρέφει την αρχική σχέση εντολής).

Υπολογισμός του συντελεστή συσχέτισης Pearson

Μέθοδος 1) Υπολογισμός του συντελεστή συσχέτισης Pearson χρησιμοποιώντας συνδιακύμανση και τυπική απόκλιση.

Πού

S XY είναι συνδιακύμανση.

S x και S y αντιπροσωπεύουν την τυπική απόκλιση, αντίστοιχα, των μεταβλητών x και y.

Στην περίπτωση αυτή, ο υπολογισμός περιλαμβάνει πρώτα την εύρεση της συνδιακύμανσης μεταξύ των μεταβλητών και της τυπικής απόκλισης καθενός από αυτούς. Στη συνέχεια, η συνδιακύμανση διαιρείται με τον πολλαπλασιασμό των τυπικών αποκλίσεων.

Συχνά, η δήλωση ήδη παρέχει είτε τις τυπικές αποκλίσεις των μεταβλητών είτε τη συνδιακύμανση μεταξύ τους, εφαρμόζοντας μόνο τον τύπο.

Μέθοδος 2) Υπολογισμός του συντελεστή συσχέτισης Pearson με πρωτογενή δεδομένα (χωρίς συνδιακύμανση ή τυπική απόκλιση).

Με αυτή τη μέθοδο, ο πιο άμεσος τύπος έχει ως εξής:

Για παράδειγμα, υποθέτοντας ότι έχουμε δεδομένα με n = 6 παρατηρήσεις δύο μεταβλητών: επίπεδο γλυκόζης (y) και ηλικία (x), ο υπολογισμός ακολουθεί τα ακόλουθα βήματα:

Βήμα 1) Κατασκευάστε τον πίνακα με τα υπάρχοντα δεδομένα: i, x, y και προσθέστε κενές στήλες για xy, x² και y²:

Βήμα 2: Πολλαπλασιάστε τα x και y για να γεμίσετε τη στήλη "xy". Για παράδειγμα, στη γραμμή 1 θα έχουμε: x1y1 = 43 × 99 = 4257.

Βήμα 3: Αυξήστε τις τιμές της στήλης x και καταγράψτε τα αποτελέσματα στη στήλη x². Για παράδειγμα, στην πρώτη γραμμή θα έχουμε x 1 2 = 43 × 43 = 1849.

Βήμα 4: Κάντε το ίδιο όπως στο Βήμα 3, τώρα χρησιμοποιώντας τη στήλη y και καταγράψτε το τετράγωνο των τιμών σας στη στήλη y². Για παράδειγμα, στην πρώτη γραμμή θα έχουμε: y 1 2 = 99 × 99 = 9801.

Βήμα 5: Αποκτήστε το άθροισμα όλων των αριθμών στηλών και τοποθετήστε το αποτέλεσμα στο υποσέλιδο της στήλης. Για παράδειγμα, το άθροισμα της στήλης Age X είναι ίσο με 43 + 21 + 25 + 42 + 57 + 59 = 247.

Βήμα 6: Χρησιμοποιήστε τον παραπάνω τύπο για να αποκτήσετε τον συντελεστή συσχέτισης:

Έτσι, έχουμε:

Συντελεστής συσχέτισης του Spearman

Ο υπολογισμός του συντελεστή συσχέτισης του Spearman είναι κάπως διαφορετικός. Για αυτό, πρέπει να οργανώσουμε τα δεδομένα μας στον ακόλουθο πίνακα:

1. Έχοντας διατυπώσει 2 ζεύγη δεδομένων, πρέπει να τα εισαγάγουμε στον πίνακα. Για παράδειγμα:

2. Στη στήλη "Κατάταξη Α" θα ταξινομήσουμε τις παρατηρήσεις που βρίσκονται στην "Ημερομηνία Α" με αυξανόμενο τρόπο, με το "1" να είναι η χαμηλότερη τιμή στη στήλη en (ο συνολικός αριθμός παρατηρήσεων), η υψηλότερη τιμή στη στήλη "Ημερομηνία A ". Στο παράδειγμά μας είναι:

3. Κάνουμε το ίδιο για να πάρουμε τη στήλη "Ranking B", τώρα χρησιμοποιώντας τις παρατηρήσεις στη στήλη "Data B":

4. Στη στήλη "d" βάζουμε τη διαφορά μεταξύ των δύο Rankings (A - B). Εδώ το σήμα δεν έχει σημασία.

5. Ανυψώστε κάθε μία από τις τιμές στη στήλη "d" και καταγράψτε στη στήλη d²:

6. Προσθέστε όλα τα δεδομένα από τη στήλη "d²". Αυτή η τιμή είναι Σd². Στο παράδειγμα μας Σd² = 0 + 1 + 0 + 1 = 2

7. Τώρα χρησιμοποιούμε τον τύπο του Spearman:

Στην περίπτωσή μας, το n είναι ίσο με 4, καθώς εξετάζουμε τον αριθμό των σειρών δεδομένων (που αντιστοιχεί στον αριθμό των παρατηρήσεων).

8. Τέλος, αντικαθιστούμε τα δεδομένα στον προηγούμενο τύπο:

Γραμμική παλινδρόμηση

Η γραμμική παλινδρόμηση είναι ένας τύπος που χρησιμοποιείται για την εκτίμηση της πιθανής τιμής μιας μεταβλητής (y) όταν είναι γνωστές οι τιμές άλλων μεταβλητών (x). Η τιμή του "x" είναι η ανεξάρτητη ή ερμηνευτική μεταβλητή και "y" είναι η εξαρτώμενη μεταβλητή ή απόκριση.

Η γραμμική παλινδρόμηση χρησιμοποιείται για να επαληθεύσει πώς η τιμή του "y" μπορεί να ποικίλει ως συνάρτηση της μεταβλητής "x". Η γραμμή που περιέχει τις τιμές του ελέγχου διακύμανσης ονομάζεται γραμμή γραμμικής παλινδρόμησης.

Αν η επεξηγηματική μεταβλητή "x" έχει μία μόνο τιμή, η παλινδρόμηση θα ονομάζεται απλή γραμμική παλινδρόμηση .