Εξόρυξη δεδομένων

Τι είναι η εξόρυξη δεδομένων:

Η εξόρυξη δεδομένων είναι ένας αγγλικός όρος που συνδέεται με την επιστήμη των υπολογιστών, η μετάφραση της οποίας είναι η εξόρυξη δεδομένων . Αποτελείται από μια λειτουργικότητα που συγκεντρώνει και οργανώνει δεδομένα, βρίσκοντας σε αυτά σχετικές μορφές, συσχετισμούς, αλλαγές και ανωμαλίες .

Ο όρος εξόρυξη δεδομένων εμφανίστηκε για πρώτη φορά το 1990 σε κοινότητες βάσεων δεδομένων. Η εξόρυξη δεδομένων είναι το στάδιο ανάλυσης της διαδικασίας που είναι γνωστό ως KDD ( Knowledge Discovery in Databases ), η κυριολεκτική μετάφραση της οποίας είναι η "Ανακάλυψη γνώσης σε βάσεις δεδομένων".

Η εξόρυξη δεδομένων μπορεί να χωριστεί σε μερικά βασικά βήματα: εξερεύνηση, δημιουργία μοντέλου, ορισμός προτύπου και επικύρωση και επαλήθευση.

Η εξόρυξη δεδομένων είναι μια σχετικά πρόσφατη πρακτική στον κόσμο της πληροφορικής και χρησιμοποιεί την ανάκτηση πληροφοριών, την τεχνητή νοημοσύνη, την αναγνώριση προτύπων και τις στατιστικές τεχνικές για την αναζήτηση συσχετίσεων μεταξύ διαφορετικών δεδομένων που σας επιτρέπουν να αποκτήσετε επωφελείς γνώσεις για μια εταιρεία ή ένα άτομο. Για μια εταιρεία, η εξόρυξη δεδομένων μπορεί να είναι ένα σημαντικό εργαλείο που ενισχύει την καινοτομία και την κερδοφορία.

Η χρήση της εξόρυξης δεδομένων είναι συνηθισμένη σε μεγάλες βάσεις δεδομένων και το τελικό αποτέλεσμα της χρήσης τους μπορεί να εμφανιστεί μέσω κανόνων, υποθέσεων, δέντρων αποφάσεων, dendrograms κλπ.

Η καλά εκτελούμενη εξόρυξη δεδομένων θα πρέπει να επιτελεί καθήκοντα όπως: ανίχνευση ανωμαλιών, μάθηση κανόνας σύνδεσης (μοντελοποίηση εξάρτησης), ομαδοποίηση, ταξινόμηση, παλινδρόμηση και σύνοψη. Η διαδικασία εξόρυξης δεδομένων εμφανίζεται συνήθως χρησιμοποιώντας δεδομένα που περιέχονται στην αποθήκη δεδομένων .

Υπάρχουν αρκετές εταιρείες και λογισμικό που είναι αφιερωμένα στην εξόρυξη δεδομένων, καθώς ο προσδιορισμός των μοτίβων στις βάσεις δεδομένων είναι όλο και πιο σημαντικός. Ωστόσο, η αναγνώριση των σχετικών προτύπων δεν είναι μοναδική στον κόσμο των υπολογιστών. Ο ανθρώπινος εγκέφαλος χρησιμοποιεί μια παρόμοια διαδικασία για να αναγνωρίσει τα πρότυπα και να αποκτήσει γνώσεις.

Τα τελευταία χρόνια, η εξόρυξη δεδομένων έχει χρησιμοποιηθεί ευρέως στους τομείς της επιστήμης και της μηχανικής, όπως η βιοπληροφορική, η γενετική, η ιατρική, η εκπαίδευση και η ηλεκτρολογία.

Η έννοια της εξόρυξης δεδομένων συνδέεται συχνά με την εξαγωγή πληροφοριών σχετικά με τη συμπεριφορά των ανθρώπων. Για το λόγο αυτό, σε ορισμένες περιπτώσεις, η εξόρυξη δεδομένων εγείρει νομικά ζητήματα και θέματα σχετικά με την προστασία της ιδιωτικής ζωής και την ηθική. Παρόλα αυτά, πολλοί ισχυρίζονται ότι η εξόρυξη δεδομένων είναι ηθικά ουδέτερη, καθώς δεν έχει ηθικές συνέπειες.

Πραγματικά παραδείγματα εξόρυξης δεδομένων

Η εξόρυξη δεδομένων χρησιμοποιείται συχνά από εταιρείες και οργανισμούς για να αποκτήσουν γνώσεις σχετικά με τους χρήστες / τους υπαλλήλους / τους πελάτες. Για παράδειγμα, στον δημόσιο τομέα είναι δυνατό να γίνει έλεγχος μεταξύ της οικογενειακής κατάστασης ενός υπαλλήλου και του μισθού που κερδίζει για να διαπιστωθεί εάν αυτό επηρεάζει την οικογενειακή του ζωή.

Εταιρείες όπως αλυσίδες σούπερ μάρκετ μπορούν να χρησιμοποιήσουν αυτά τα διασταυρούμενα δεδομένα για να προσδιορίσουν προϊόντα που αγοράζονται από κοινού. Αν ένας πελάτης που αγοράζει το προϊόν X αγοράζει επίσης το προϊόν Y, ίσως είναι καλή ιδέα να τοποθετήσετε τα δύο προϊόντα γύρω από το ξενοδοχείο, ώστε να είναι πιο εύκολο για τον πελάτη να το αγοράσει.