Home Διπλωματικές Παλιότερα Θέματα Ανάλυση καλαθιού αγορών (market basket analysis) με δίκτυα προϊόντων
Ανάλυση καλαθιού αγορών (market basket analysis) με δίκτυα προϊόντων PDF Εκτύπωση E-mail
Συντάχθηκε απο τον/την Giorgos Siolas   

Η ανάλυση καλαθιού αγορών (market basket analysis) είναι μια από τις παλαιότερες ερευνητικές περιοχές της εξόρυξης δεδομένων (data mining). Βασικός στόχος της είναι ανεύρεση ενδιαφέροντων συσχετισμών στις αγορές των πελατών οι οποίοι στη συνέχεια χρησιμεύουν στην αποτελεσματικότερη προώθηση των προϊόντων (σγκρότηση συνδυαστικών προσφορών, στοχευμένη τοποθέτηση στα ράφια κ.α.).

Η κλασσικότερη προσέγγιση για την ανάλυση είναι η εύρεση συχνών συνόλων αντικειμένων (frequent itemsets) για την διατύπωση κανόνων συσχέτισης (association rules) του τύπου if/then όπως για παράδειγμα “80% των αγοραστών δημητριακών και ζάχαρης αγοράζουν και γάλα” [Rajaraman & Ullman]. Ωστόσο, από μεγάλο όγκο συναλλαγών (transactions) και ανάλογα με την παραμετροποίηση των συχνών συνόλων αντικειμένων, μπορεί να προκύψει είτε πολύ μεγάλος αριθμός κανόνων, όπου είναι δύσκολο να ετιμηθεί ποιοί είναι οι χρησιμότεροι, είτε πολύ μικρός, οπότε προκύπτουν μόνο πολύ προφανείς κανόνες συσχέτισης. Αρκετές προσεγγίσεις προσπαθούν να αντιμετωπίσουν το πρόβλημα αυτό  συσχετίζοντας ένα μέτρο ενδιαφέροντος (interestingness) με τους κανόνες, ωστόσο οι τρόποι που μπορεί να οριστεί το μέτρο ενδιαφέροντος είναι πολλοί και για την επιλογή του απαιτούνται a priori γνώσεις για τα προϊόντα, τους πελάτες κλπ.

Οι [Reader & Chawla] διαπιστώνοντας τις παραπάνω δυσκολίες προτείνουν μια προσέγγιση που βασίζεται στην κατασκευή ενός δικτύου (γράφου) προϊόντων (product network), όπου τα προϊόντα αποτελούν τους κόμβους και μια ακμή μεταξύ κόμβων υποδηλώνει ότι δύο προϊόντα έχουν αγοραστεί μαζί. Κατ’αυτόν τον τρόπο η ανάλυση του καλαθιού αγορών μπορεί να γίνει με μια σειρά γραφοθεωρητικών προσεγγίσεων (συμπληρωματικών μεταξύ τους), όπως η ανίχνευση κοινοτήτων (community detection), τα δίκτυα κανόνων συσχέτισης (association rules networks) και τους υπογράφους κεντρικών αντικειμένων (center-piece subgraphs) που βασίζονται στη μεγιστοποίηση μιας συνάρτησης αποτίμησης (objective function) υπολογιζόμενης με τυχαίους περιπάτους (random walks).

Στα πλαίσια της διπλωματικής, προτείνεται η ανάλυση καλαθιού αγορών, τόσο με την κλασσική προσέγγιση, με συχνά σύνολα αντικειμένων, όσο και με τις γραφοθεωρητικές προσεγγίσεις, στα ακόλουθα σύνολα δεδομένων:

 

  • Extended BAKERY dataset (1). Περιγραφή: a bakery chain has a menu of about 40 pastry items and 10 coffee drinks. It has a number of locations in West Coast states (California, Oregon, Arizona, Nevada). The database stores information about the food/drinks offered for sale, locations, employees at each location and individual sales (receipts) at those locations.
  • FoodMart dataset (1). Περιγραφή: a dataset containing market baskets from 1560 products and 8842 customers of the Food Mart supermarket chain.
  • Amazon product co-purchasing network (1, 2). Περιγραφή: the network was collected by crawling the Amazon website. It is based on the “Customers Who Bought This Item Also Bought This” feature of the Amazon website. If a product i is frequently co-purchased with product j, the graph contains a directed edge from i to j.

 

Θα βρείτε τις αναφορές στα συνημμένα αρχεία.

 

 

Powered by Joomla!. Valid XHTML and CSS.