Τα Συστήματα Συστάσεων και η Εφαρμογή τους
Τα συστήματα συστάσεων, επίσης γνωστά ως recommender systems ή recommendation engines, είναι αλγόριθμοι που αξιοποιούν τις πληροφορίες των χρηστών με στόχο να προτείνουν προϊόντα ή υπηρεσίες που ταιριάζουν περισσότερο στις προτιμήσεις τους.
Με την άνοδο των υπηρεσιών διαδικτύου όπως το YouTube, την Amazon και το Netflix, τα συστήματα συστάσεων έχουν γίνει αναπόσπαστο κομμάτι της ψηφιακής μας καθημερινότητας. Η ύπαρξή τους, παρά το γεγονός ότι δεν γίνεται άμεσα αντιληπτή στον περισσότερο κόσμο, έχει καθοριστικό ρόλο στην βελτιστοποίηση της εμπειρίας των χρηστών. Θα μας φαινόταν πλέον αφύσικο, αν δεν βλέπαμε τη λίστα με τα προτεινόμενα βίντεο στο YouTube. Το έξυπνο “auto-complete” κατά την αναζήτηση μας στο Google, το οποίο καταλαβαίνει τί ψάχνουμε με βάση το ιστορικό των αναζητήσεων μας και τις σελίδες που επιλέξαμε στο παρελθόν. Πολλοί αναρωτιούνται πως είναι δυνατόν να βλέπουν διαφημίσεις στο facebook για πράγματα που έψαξαν πριν μερικές μέρες έξω από αυτό ή που (ακόμη πιο εντυπωσιακό!) συζήτησαν με κάποιον φίλο τους όταν πήγαν για καφέ.
Πίσω από όλα αυτά κρύβεται μια μηχανή συστάσεων. Βασίζεται στην τεχνητή νοημοσύνη και πιο συγκεκριμένα ένα παρακλάδι της που ονομάζεται Μηχανική Μάθηση. Η βασική ιδέα πίσω από αυτά τα συστήματα είναι η δυνατότητα αξιοποίησης ακατέργαστων πληροφοριών ή με άλλα λόγια δεδομένων με στόχο την ανίχνευση κάποιων μοτίβων από τα οποία εξάγεται γνώση για κάποιο ζήτημα. Οι μηχανές συστάσεων ανήκουν σε ένα ιδιαίτερα ενεργό πεδίο έρευνας στο οποίο γίνονται συνεχώς προσπάθειες για σχεδιασμό αλγορίθμων που παρουσιάζουν καλύτερη απόδοση.
Παράδειγμα Αλγορίθμου Μηχανής Συστάσεων
Εδώ θα αναφέρουμε ένα απλό αλγόριθμο που υλοποιεί μια τυπική μηχανή συστάσεων ώστε να μπορέσει ο αναγνώστης να αντιληφθεί πως προκύπτουν εξατομικευμένες προτάσεις μέσα από τα μαθηματικά. Έστω ότι υπάρχουν κάποια άτομα τα οποία κάνουν like σε ταινίες που έχουν δει και τους άρεσαν. Θέλουμε να δημιουργήσουμε έναν “έξυπνο” μηχανισμό για να προτείνουμε σε όλους αυτούς κάποιες ταινίες. Μια αρχική ιδέα είναι να βρούμε για κάποιον, άτομα με παρόμιες προτιμήσεις και να του προτείνουμε ταινίες που άρεσαν σε αυτά αλλά δεν τις έχει δει αυτός. Για να μπορέσουμε να εντοπίσουμε τα άτομα με παρόμοια ενδιαφέροντα πρέπει κάπως να μετρήσουμε την “ομοιότητα στις προτιμήσεις”. Μπορούμε να δημιουργήσουμε ένα αριθμητικό σκορ ομοιότητα κάνοντας το εξής:
1. Δημιουργούμε ένα σύνολο για κάθε άτομο το οποίο περιέχει όλες τις ταινίες που έκανε like.
2. Ορίζουμε ως μέτρο ομοιότητας των προτιμήσεων (SCORE) μεταξύ δύο ατόμων το εξής:
Για I: “ΠΛΗΘΟΣ ΤΑΙΝΙΩΝ ΠΟΥ ΑΡΕΣΑΝ ΚΑΙ ΣΤΟΥΣ 2 ΤΑΥΤΟΧΡΟΝΑ” και U: “ΣΥΝΟΛΙΚΕΣ ΤΑΙΝΙΕΣ ΠΟΥ ΑΡΕΣΑΝ ΣΤΟΥΣ 2”
Πιο συγκεκριμένα, θεωρόντας ως Α το σύνολο των ταινιών που άρεσαν στον πρώτο και Β το σύνολο των ταινιών που άρεσαν στον δεύτερο τα I και U υπολογίζονται ως εξής:
και , όπου το πρώτο καλείται τομή των συνόλων Α και Β ή αλλιώς τα κοινά στοιχεία μεταξύ του Α και του Β και το δεύτερο η ένωση των συνόλων ή αλλιώς τα στοιχεία του Α και του Β μαζί.
Αυτό το νούμερο όπως μπορούμε να διαπιστώσουμε μπορεί να πάρει μια τιμή μεταξύ του 0% και του 100%. Αν για παράδειγμα στον Γιώργο όλες οι ταινίες που του άρεσαν είναι ο Τιτανικός και Οι Πειρατές της Καραϊβικής και στο Νίκο οι: Ο Νονός και Η Διάσωση του Στρατιώτη Ράιν τότε το SCORE τους θα είναι 0/4 = 0%. Αν από την άλλη, άρεζαν και στους 2 οι 4 ίδιες ταινίες, τότε το σκορ θα ήταν 4/4 = 100%.
3. Υπολογίζουμε για κάθε ζεύγος ατόμων το SCORE ομοιότητας προτιμήσεων.
4. Επιλέγουμε για τον καθένα τα 2 άτομα με το μεγαλύτερο SCORE.
5. Από τη λιστα (με τα likes) ταινιών των 2 ατόμων με το μεγαλύτερο SCORE, επιλέγουμε τυχαία κάποιες ταινίες τις οποίες δεν έχει δει αυτός (δεν έχει κάνει like ή dislike). Υπογραμμίζουμε ότι αυτά τα 2 είναι τα άτομα με την μεγαλύτερη ομοιότητα ως προς τις προτιμήσεις ταινιών που υπολογίσαμε προηγουμένως.
6. Προτείνουμε στον καθένα τις ταινίες που επιλέξαμε γι’ αυτόν στο προηγούμενο βήμα.
Παρόλο που η παραπάνω μέθοδος φαίνεται απλή, αποδίδει αρκετά καλύτερα από το να προτείναμε απλώς ταινίες με υψηλή δημοτικότητα στον χρήστης ή ταινίες της ίδιας κατηγορίας με αυτήν που είδε ή με τους ίδιους ηθοποιούς, κλπ. Απόδοση εδώ εννοούμε τον βαθμό εξατομίκευσης των προτεινόμενων ταινιών. Πόσο σχετικές είναι δηλαδή με τις προτιμήσεις του κάθε χρήστη.
Ο αλγόριθμος αυτός βασίζεται στα μαθηματικά και πιο συγκεκριμένα στη θεωρία των συνόλων. Η εξίσωση ομοιότητας που χρησιμοποιήσαμε για το SCORE είναι γνωστή ως συνάρτηση ομοιότητας Jaccard. Μπορεί κανείς να μάθει περισσότερες πληροφορίες για αυτή τη μέθοδο αναζητώντας τη ως “Μη-παραμετρικά Συνεργατικά Φίλτρα” (Non-parametric Collaborative Filtering). Φυσικά, αξίζει να σημειωθεί ότι αυτό είναι ένα απλό παράδειγμα συστήματος συστάσεων και στην πράξη οι αλγόριθμοι που χρησιμοποιούνται, όπως το Recommender της roasc, είναι κατά πολύ πιο σύνθετοι και αξιοποιούν μεγάλο όγκο πληροφορίας για να αναγνωρίζουν τις προτιμήσεις των χρηστών.
Στη συνέχεια, αναφερόμαστε στην σημασία της χρήσης τέτοιων συστημάτων σε εμπορικές εφαρμογές όπως τα ηλεκτρονικά καταστήματα παραθέτοντας πλεονεκτήματα και μειονεκτήματα καθώς και τον τρόπο που εφαρμόζονται στα eshop.
Πλεονεκτήματα Συστημάτων Συστάσεων
Μερικά από τα σημαντικότερα πλεονεκτήματα της ύπαρξης τέτοιων συστημάτων για τους χρήστες είναι τα εξής:
- Ευκολότερη εύρεση προϊόντων/υπηρεσιών που προτιμάει ο χρήστης.
- Συνολική βελτίωση της εμπειρίας του χρήστη.
- Μείωση απαιτούμενου χρόνου εύρεσης προϊόντος/υπηρεσίας.
- Εύρεση προϊόντων που συνδυάζονται μεταξύ τους (ιδέες για καλύτερη αξιοποίηση ενός προϊόντος).
Το όφελος των επιχειρήσεων που τα ενσωματώνουν στις υπηρεσίες τους είναι πολύ σημαντικό:
- Αύξηση του αριθμού των πωλήσεων.
- Ανάπτυξη σχέσης εμπιστοσύνης μεταξύ επιχείρησης και πελατών.
- Αύξηση της ικανοποίησης των πελατών.
- Καλύτερη κατανόηση των αναγκών των πελατών.
- Αύξηση της πίστης των πελατών (customer loyalty).
- Ανταγωνιστικό πλεονέκτημα.
- Αποδοτική διαμόρφωση προσφορών σε ομαδοποιημένα προϊόντα.
- Δημιουργία στοχευμένων διαφημίσεων.
Μειονεκτήματα Συστημάτων Συστάσεων
Από την άλλη πλευρά, υπάρχουν και μερικά μειονεκτήματα όπως:
- Δυσκολία υλοποίησης αποδοτικού συστήματος συστάσεων.
- Υψηλό κόστος υλοποίησης και συντήρησης.
- Κίνδυνος παραβίασης της ιδιωτικότητας αν δεν εφαρμοστεί η κατάλληλη πολιτική προστασίας προσωπικών δεδομένων.
Για να αναλογιστούμε πόσο σημαντική είναι η χρήση ενός τέτοιου συστήματος, μπορούμε να αναφερθούμε στον διαγωνισμό που είχε διοργανώσει το Netflix το 2006, ο οποίος διήρκησε μέχρι το 2009 και πρόσφερε 1 εκατομμύριο δολάρια σε όποια ομάδα επιστημόνων έφτιαχνε το καλύτερο σύστημα συστάσεων.
Μηχανές Προτεινόμενων Προϊόντων στο Ηλεκτρονικό Εμπόριο
Καθώς η δημοτικότητα των ηλεκτρονικών επιχειρήσεων και του ηλεκτρονικού εμπορίου αυξάνεται, η χρήση συστημάτων συστάσεων γίνεται επιτακτική. Η έννοια της εξατομίκευσης είναι καθοριστικής σημασίας καθώς η απουσία στήλης με προτεινόμενα προϊόντα φαντάζει επίσης αφύσικη στον κόσμο που επιλέγει τις ηλεκτρονικές αγορές.
Όλες οι πλατφόρμες ηλεκτρονικού εμπορίου, συμπεριλαμβάνουν πλέον μηχανισμούς για προώθηση προϊόντων (cross-sells, upsells). Οι μηχανισμοί αυτοί βέβαια, δεν στηρίζονται σε κάποιο “έξυπνο αλγόριθμο” που βασίζεται στην τεχνητή νοημοσύνη. Δεν λαμβάνουν υπόψη τους τη συμπεριφορά και τις προτιμήσεις των χρηστών.
Αντιθέτως, προβάλουν απλώς προϊόντα που περιλαμβάνουν παρόμοιες λέξεις-κλειδιά ή χαρακτηριστικά με το προϊόν που κοιτάζει ο χρήστης. Μερικές φορές, προτείνουν προϊόντα που είδαν άλλοι χρήστες, οι οποίοι είδαν ή αγόρασαν το συγκεκριμένο προϊόν. Σπανιότερα, τα προτεινόμενα προϊόντα τα καθορίζουν χειροκίνητα οι διαχειριστές των eshop με βάση την διαίσθηση και την εμπειρία τους ή βασισμένοι στα analytics. Η αποτελεσματικότητα της τελευταίας προσέγγισης είναι αμφιλεγόμενη καθώς προϋποθέτει πολύ καλή γνώση του χειρισμού των analytics, συνεχή ενασχόληση ξοδεύοντας πολύτιμο χρόνο από άλλες επιχειρηματικές δραστηριότητες αλλά και πολύ καλή εικόνα της ζήτησης στην αγορά. Πέρα από όλα αυτά, η προσέγγιση αυτή σίγουρα δεν εμπεριέχει την έννοια της εξατομίκευσης.
Τα πραγματικά συστήματα συστάσεων, όπως το recommender της roasc, που χρησιμοποιούνται στο ηλεκτρονικό εμπόριο, καταγράφουν τη συμπεριφορά των χρηστών και κατασκευάζουν μαθηματικά μοντέλα με τα οποία προβλέπουν τις προτιμήσεις τους. Με άλλα λόγια μαθαίνουν να αναγνωρίζουν τα ενδιαφέροντα του χρήστη μετά από μερικά μόλις κλικ. Ο πελάτης καθώς πλοηγείται στο ηλεκτρονικό κατάστημα, λαμβάνει όλο και πιο συναφείς προτάσεις προϊόντων και αν επισκεφτεί ξανά το eshop στο μέλλον, το σύστημα τον αναγνωρίζει και του παρέχει εξατομικευμένες προτάσεις προϊόντων. Η τεχνική αυτή αποτελεί μία από τις βασικότερες μεθόδους αύξησης πωλήσεων για την οποία μπορείτε να μάθετε περισσότερα στον αναλυτικό οδηγό αύξησης πωλήσεων σε eshop που έχουμε δημοσιεύσει στο blog μας.
Η παραδοσιακή στρατηγική προώθησης προϊόντων στηρίζεται σε διαδικασίες που στοχεύουν στην πώληση ενός προϊόντος στους περισσότερους δυνατούς πελάτες. Αντιθέτως, η σύγχρονη μεθοδολογία είναι πελατοκεντρική. Με βάση αυτή οι επιχειρήσεις εστιάζουν στον κάθε πελάτη ξεχωριστά ώστε να του προτείνουν τα καλύτερα δυνατά προϊόντα για εκείνον. Η roasc, χρησιμοποιώντας τεχνητή νοημοσύνη, δημιούργησε ένα σύστημα συστάσεων, προσαρμοσμένο στις ανάγκες του σύγχρονου ηλεκτρονικού εμπορίου. Καλωσήρθατε στην εποχή της εξατομίκευσης!