26 Απριλίου 2011

Διαδικασίες βελτιστοποίησης διαλειτουργικότητας κατανεμημένων πληροφοριακών συστημάτων συμβατών με το πρωτόκολλο Z39.50 και ολοκλήρωση βιβλιογραφικών μέτα-δεδομένων

Διδακτορική Διατριβή του κ. Σφακάκη Μιχάλη
στο Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας του Ιονίου Πανεπιστημίου
2010 
Περίληψη:
Ο τεράστιος όγκος και η ποικιλομορφία των διαθέσιμων πληροφοριών σε συνδυασμό με τις μεθόδους πρόσβασης και το περιβάλλον χρήσης των πηγών πληροφόρησης οδήγησαν στην ανάπτυξη των συστημάτων ενιαίας πρόσβασης. Μία από τις αρχιτεκτονικές των συστημάτων ενιαίας πρόσβασης είναι η μετα-αναζήτηση ή, εναλλακτικά αποκαλούμενη, federated search ή παράλληλη αναζήτηση ή εικονικός συλλογικός κατάλογος. Σε ένα περιβάλλον μέτα-αναζήτησης, ο χρήστης θέτει τις επερωτήσεις του σε ένα κεντρικό σύστημα το οποίο τις προωθεί στις πηγές και στη συνέχεια ενοποιεί και παρουσιάζει στο χρήστη τις απαντήσεις που θα λάβει από αυτές. 

Είναι άξιο αναφοράς ότι ένας μεγάλος αριθμός πηγών, ραγδαία αυξανόμενος, είναι κρυμμένος πίσω από πληροφοριακά συστήματα που διαθέτουν τους πόρους τους μέσα από προκαθορισμένες διαδικασίες και γλώσσες επερωτήσεων, χωρίς να παρέχουν καμία δυνατότητα άμεσης πρόσβασης στους πόρους και τη δομή των πηγών. Η αποτελεσματικότητα (effectiveness) ενός περιβάλλοντος μέτα-αναζήτησης καθορίζεται από τη δυνατότητα που έχει να μετατρέπει τις επερωτήσεις που του θέτουν στην αντίστοιχη επερώτηση που απαιτεί η κάθε πηγή, καθώς επίσης και η ικανότητά του να κατανοεί και να επεξεργάζεται τις απαντήσεις από τις πηγές. Οι δυνατότητες αυτές προσδιορίζονται άμεσα από το επίπεδο της συντακτικής (syntactic), λειτουργικής (functional) και σημασιολογικής (semantic) διαλειτουργικότητας των κατανεμημένων πληροφοριακών συστημάτων διάθεσης των πόρων. 

Επίσης, οι απαιτήσεις για αυξημένη αποδοτικότητα του συστήματος μετα-αναζήτησης, όπου η online φύση του απαιτεί να δοθεί η απάντηση στον ελάχιστο δυνατό χρόνο, περιορίζουν τις λύσεις στα προβλήματα αποτελεσματικότητας του συστήματος. Σε αρκετές περιπτώσεις οι διαδικασίες πρόσβασης και οι γλώσσες επερωτήσεων των πηγών έχουν κοινά χαρακτηριστικά ή είναι συμβατές με διεθνή πρότυπα αναζήτησης και ανάκτησης πληροφοριών. Επιπλέον, οι απαντήσεις των πηγών είναι συμβατές με πρότυπα περιγραφής δεδομένων και μεταδεδομένων. 

Η χρήση κοινών προτύπων είναι αρκετά συνηθισμένη σε περιπτώσεις όπου οι πηγές ανήκουν σε όμοιες πληροφοριακές κοινότητες διευκολύνοντας, παράλληλα, την εξισορρόπηση των παραμέτρων λειτουργικότητας και ευκολίας υλοποίησης στην ανάπτυξη των συστημάτων. Ειδικότερα, η κοινότητα των βιβλιοθηκών θεωρείται μια αντιπροσωπευτική περίπτωση ευρείας εφαρμογής προτύπων κωδικοποίησης και πρωτοκόλλων διάθεσης των πηγών. 
Στόχος της παρούσας διατριβής είναι η ανάπτυξη μεθόδων και διαδικασιών βελτίωσης της αποτελεσματικότητας των συστημάτων μετα-αναζήτησης στο περιβάλλον των ψηφιακών βιβλιοθηκών. Οι προτεινόμενες διαδικασίες και μέθοδοι, βασιζόμενες στα κύρια χαρακτηριστικά των πρωτοκόλλων επικοινωνίας και των μεταδεδομένων που χρησιμοποιούν τα συστήματα διάθεσης των πηγών, στοχεύουν στην έμμεση επίτευξη καλύτερης λειτουργικής και σημασιολογικής διαλειτουργικότητας. Ιδιαίτερη έμφαση δίνεται στο πρωτόκολλο Ζ39.50 μιας και η δεδομένη καθολική χρήση του στο χώρο των βιβλιοθηκών το καθιστά ένα βασικό ρυθμιστή αποτελεσματικότητας και απόδοσης στα περιβάλλοντα μετα-αναζήτησης που υλοποιούνται. 

Οι κύριες κατευθύνσεις μελέτης και συνεισφοράς της διατριβής αφορούν: (α) Τις διαδικασίες προώθησης της επερώτησης στις πηγές καθώς επίσης και την ασύγχρονη τμηματική συλλογή και επεξεργασία των αποτελεσμάτων. (β) Την περιγραφή των χαρακτηριστικών αναζήτησης της κάθε πηγής και τον έλεγχο για το εάν η πηγή υποστηρίζει την εκάστοτε επερώτηση. Στην περίπτωση που η πηγή δεν υποστηρίζει την επερώτηση, η επερώτηση μετεγγράφεται σε μία άλλη ή σε ένα σύνολο επερωτήσεων που υποστηρίζει η πηγή και είναι σημασιολογικά ισοδύναμες, αν αυτό είναι εφικτό, ή η ανάκληση και η ακρίβειά τους βρίσκονται σε ένα προκαθορισμένο εύρος ανοχής από αυτό της αρχικής επερώτησης. 

Η μετεγγραφή βασίζεται στο Σημασιολογικό Δίκτυο Σημείων Πρόσβασης, που είναι ένας σημασιολογικός γράφος εκφρασμένος σε γλώσσα RDFS και ο οποίος προκύπτει έμμεσα από τη σημασιολογία των μεταδεδομένων με αυτόματες διαδικασίες. (γ) Την ταύτιση και κατηγοριοποίηση των αποτελεσμάτων σε συστάδες σύμφωνα με την Έργο-κεντρική (work-entity) προσέγγιση του FRBR εννοιολογικού μοντέλου.


το πλήρες κείμενο εδώ


.

Δεν υπάρχουν σχόλια: