19 Δεκεμβρίου 2009

Μέθοδοι αντιμερώπισης προβλήματων από τη χρήση διαφορετικών σχημάτων μεταδεδομένων

Παρακάτω αναλύονται μέθοδοι, τρόποι, κανόνες που έχουν αναπτυχθεί για να αντιμετωπίσουν τα εμπόδια και τα προβλήματα που συνεπάγονται από τη χρήση τόσων πολλών και διαφορετικών σχημάτων μεταδεδομένων.  

To OAI - PMH (Open Archive Initiative – Protocol for Metadata Harvesting) συλλέγει μεταδεδομένα από το Διαδίκτυο παρέχοντας ένα μοντέλο διαλειτουργικότητας μεταξύ των πάροχων δεδομένων και υπηρεσιών. Ισχύουν δυο βασικές προϋποθέσεις η κωδικοποίηση των σχημάτων μεταδεδομένων σε XML και η χρήση του unqualified Dublin Core. Μια άλλη προσέγγιση στο πρόβλημα της διαλειτουργικότητας για την παροχή συναφών υπηρεσιών ψηφιακών βιβλιοθηκών με κατανεμημένες ετερογενείς συλλογές είναι το Open URL. Το Open URL καθορίζει τους συντακτικούς κανόνες για τη συσκευασία των μεταδεδομένων και των αναγνωριστών (όχι υποχρεωτικά) ενός ψηφιακού αντικειμένου που μεταφέρεται μέσω Ιστού. Η συσκευασία των μεταδεδομένων του ψηφιακού αντικειμένου ανταποκρίνεται διαφορετικά στο περιβάλλον κάθε χρήστη. Ο πρόδρομος του Open URL ήταν το σύστημα CrossRef. Το CrossRef είναι μια συνεργατική υπηρεσία διασυνδετικής παραπομπής. Επιτρέπει στο χρήστη να μεταβαίνει από την παραπομπή στου τεκμηρίου στο ίδιο το περιεχόμενο του άρθρου για παράδειγμα. Η λειτουργία αυτή υποστηρίζεται από το DOI (Digital Object Identifier) που συνδέεται με τα μεταδεδομένα και το URL (Uniform Resource Locator) του άρθρου. 

Το Indecs (Interoperability of Data in E-Commerce systems) είναι μια διεθνής προσπάθεια συνεργασίας που υποστηρίχθηκε από Πρόγραμμα της Ευρωπαϊκής Ένωσης. Συμμετείχαν κάτοχοι πνευματικών δικαιωμάτων όπως εκδότες. Σκοπός ήταν να δημιουργηθεί ένα πλαίσιο για πρότυπα μεταδεδομένων που θα υποστηρίζει την πνευματική ιδιοκτησία στο ηλεκτρονικό εμπόριο. Δεν είναι ένα νέο σχήμα μεταδεδομένων. Είναι ένα κοινό πλαίσιο που επιτρέπει την επικοινωνία ανάμεσα σε διάφορα σχήματα μεταδεδομένων ώστε να μπορούν να ανταλλάσουν πληροφορίες, ειδικά σχετικά με τα πνευματικά δικαιώματα. Χρησιμοποιείται σε διάφορες κατηγορίες υλικού, όπως βιβλία, οπτικοακουστικό υλικό, μουσική, άρθρα από εφημερίδες. 

Ένα από τα γνωστότερα και παλαιότερα πλαίσια διαλειτουργικότητας είναι το Warwick Framework. Η αρχιτεκτονική του βασίζεται στη λογική του δοχείου (container) και των πακέτων (packages) μεταδεδομένων που το αποτελούν για την ανταλλαγή αυτών. Τα πακέτα συναθροίζονται φυσικά και λογικά για να γίνεται εφικτή η ανταλλαγή. Στις βασικές του αρχές προβλέπεται να: 
• Επιτρέπει την πρόσβαση σε διαφορετικά σχήματα μεταδεδομένων τα οποία σχετίζονται μεταξύ τους θεματικά. 
• Προσαρμόζει ευέλικτα νέα σχήματα μεταδεδομένων χωρίς να χρειάζονται αλλαγές ή ειδικά προγράμματα για την χρήση τους. 
• Επιτρέπει στους δημιουργούς των μεμονωμένων μεταδεδομένων να εστιάζουν στις ιδιαίτερες απαιτήσεις τους. 
• Διαχωρίζει την διαχείριση και την υπευθυνότητα των συγκεκριμένων μεταδεδομένων. 
• Επιτρέπει την σύνταξη των μεταδεδομένων να ποικίλει ανάλογα με τις εννοιολογικές και λειτουργικές απαιτήσεις 
• Προωθεί την διαλειτουργικότητα με την παροχή διαφόρων εργαλείων και πρακτόρων για επιλεκτική πρόσβαση και διαχείριση μεμονωμένων πακέτων μεταδεδομένων.

Ένα άλλο επίσης πολύ γνωστό πλαίσιο για την υποστήριξη της διαλειτουργικότητας μεταδεδομένων είναι το RDF (Resource Description Framework). Δημιουργήθηκε και υποστηρίζεται από τον οργανισμό W3C. Τα πολλαπλά και διαφορετικής προέλευσης σχήματα παραγωγής μεταδεδομένων εξανάγκασαν τη κατασκευή ενός πλαισίου υποδοχής, κωδικοποίησης, ανταλλαγής και εκμετάλλευσης τους. To RDF χρησιμοποιείται για την περιγραφή οποιουδήποτε ψηφιακού αντικειμένου που έχει μια διεύθυνση στο Διαδίκτυο δηλ. ένα Uniform Resource Identifier (URI). Η βασική παραδοχή βρίσκεται στο γεγονός κάθε ψηφιακό αντικείμενο μπορεί να περιγραφεί από ένα σύνολο ιδιοτήτων. Η ιδιότητα ανήκει σε ένα τύπο και έχει μια τιμή. Επομένως κάθε επιστημονική ομάδα, κοινότητα μπορεί να διαμορφώσει το δικό της δομημένο σύνολο ιδιοτήτων και τιμών για να περιγράψει τα δικά της ψηφιακά τεκμήρια. Χρησιμοποιείται η λογική του υποκειμένου, του αντικειμένου και του κατηγορήματος για να συνταχθούν οι δηλώσεις σε RDF. 
 
Το CORC (Cooperative Online Resource Catalog) βασίζεται στην ιδέα ενός online καταλόγου τεκμηρίων όπως είναι οι OPAC. Η προσπάθεια αυτή ξεκίνησε το 1999 από το OCLC. Οι βιβλιοθήκες που συμμετείχαν χρησιμοποίησαν το CORC για να δημιουργήσουν έναν κοινό κατάλογο με ηλεκτρονικές πηγές. Υποστηρίζει και το MARC και το Dublin Core και μπορεί να διασυνδέσει τα δύο σχήματα για την εισαγωγή και την εξαγωγή στοιχείων στη μία ή στην άλλη μορφή. Επίσης, μερικά στοιχεία μπορούν να εξαχθούν αυτόματα από την ιστοσελίδα στην οποία γίνεται η καταλογογράφηση. Η επιτυχία του σχήματος οφείλεται στο ότι παρέχει οδηγίες καταλογογράφησης και υπάρχει επίσης αρχείο καθιερωμένων τύπων. Τα θέματα της διαλειτουργικότητας δεν εξαντλούνται μόνο σε ότι αφορά τα μεταδεδομένα. Η διαλειτουργικότητα αναζητείται και στη σημασιολογία. Ο τομέας που ασχολείται με τη διαχείριση της γνώσης έρχεται αντιμέτωπος με τέτοιου είδους ζητήματα. Η σημασιολογική διαλειτουργικότητα είναι αναγκαία γιατί χρειάζεται να λύσει προβλήματα όπως: 
• Την ανομοιομορφία και ασυμβατότητα των μη οργανωμένων και μη δομημένων σημασιολογικών μεταδεδομένων. 
• Την ανάπτυξη από κάθε ενδιαφερόμενη κοινότητα θησαυρών και ταξινομιών για συναφείς γνωστικούς τομείς σε τοπικό ή εθνικό επίπεδο με αποτέλεσμα να υπάρχει έλλειψη συμβατότητας. 
• Την εξέλιξη της γλώσσας με τους νέους όρους και έννοιες που επιφέρουν εννοιολογική σύγχυση, καθώς οι έννοιες δεν είναι ακόμα σαφώς προσδιορισμένες και διασυνδεδεμένες. 
• Την διαφορετική απόδοση της μετάφρασης όρων από μια γλώσσα σε μια άλλη. Τα εργαλεία για την επίλυση των παραπάνω προβλημάτων φαίνεται να είναι το RDF και οι οντολογίες, ειδικότερα κάποιοι συγκεκριμένοι τύποι τους. 

Το ενδιαφέρον για την επίλυση τέτοιων προβλημάτων είναι μεγάλο και οι λύσεις που προτείνονται πάρα πολλές. Η βασική ιδέα βρίσκεται στην αντιστοίχιση των εννοιών και στη διατήρηση αυτών των σχέσεων με τον εμπλουτισμό και τη διαρκή ανανέωση τους. Ενδεικτικά αναφέρονται οι ακόλουθες εφαρμογές. Το σύστημα της οντολογίας FOS (Fishery Ontology System) αφορά την ένωση και ομαδοποίηση θησαυρών σχετικών με την ιχθυολογία από οικονομική, πολιτική, κ.ά. προσεγγίσεις. Το ίδιο κάνει και το μοντέλο οντολογίας CIDOC – CRM (International Committee for Documentation Conceptual Reference Model), που ενδιαφέρεται για τα αντικείμενα και τις διαδικασίες του πολιτισμού.

Δεν υπάρχουν σχόλια: