Εξόρυξη δεδομένων με ΕΛ/ΛΑΚ
Γράφει ο/η newsletter   
09.05.11

 Στο πλαίσιο της δράσης "Ημέρες Συνεργασίας: ΕΛ/ΛΑΚ & Επιχειρηματικότητα", που έχει ως στόχο να φέρει σε επαφή επιχειρήσεις που παρέχουν εφαρμογές ή υπηρεσίες Ανοιχτού Λογισμικού με εταιρείες και φορείς χρήστες, μετά την παρουσίαση των εφαρμογών ΕΛ/ΛΑΚ που χρησιμοποιεί η Proton Bank, o κ. Μιχάλης Βαζιργιάννης (Καθηγητής, Οικονομικό Πανεπιστήμιο Αθηνών), ανέπτυξε το τι είναι εξόρυξη δεδομένων (Data Mining) και την χρησιμότητά της.

 

Ο σκοπός αυτής της διαδιακασίας είναι η αναζήτηση συγκεκριμένων μορφών δεδομένων, μέσα σε μεγάλο όγκο δεδομένων, ώστε να προκύψουν συμπεράσματα και να εξαχθούν στατιστικά δεδομένα. Για να γίνει η εξόρυξη απαιτείται να ορισθούν οι τιμές των επιστημονικών πεδίων, που με βάση αυτές θα εξαχθούν κάποια συμπεράσματα. Το αποτέλεσμα της εξόρυξης μπορεί να οπτικοποιηθεί με γραφήματα και να υπάρχει καλύτερη κατανόηση από τους ενδιαφερόμενους. Σε δεδομένα προγματικού χρόνου μπορεί να δημιουργηθούν γραφήματα όπου η μία παράμετρος να είναι ο χρόνος. Για να γίνει εξόρυξη δεδομένων απαιτείται να γίνουν κάποια στάδια, όπου το πρώτο είναι η ομαλοποίηση των δεδομένων, καθώς απαιτείται βελτίωση της ποιότητας των δεδομένων, καθώς δεδομένα χαμηλής ποιότητας, δεν μπορούν να παράγουν αξιόπιστα συμπεράσματα.

 

Στην συνέχεια παρουσιάσθηκαν τα στοιχεία των αλγορίθμων για την εξόρυξη και οι διάφοροι τρόποι, να επιτευχθεί ο σκοπός αυτός. Για την αναζήτηση δεδομένων στο διαδίκτυο χρησιμοποιείται το λογισμικό ΕΛ/ΛΑΚ Heritrix που είναι και το λογισμικό που διαθέτει η υπηρεσία αρχειοθέτησης του Web, Web Archive.

Tags: EEΛΛΑΚ, δράσεις, Add more tags...,