Text Encoding Initiative![]() Text Encoding Initiative ( TEI ) ονομάζεται μια κοινότητα κειμενοκεντρικής πρακτικής στον ακαδημαϊκό τομέα των ψηφιακών ανθρωπιστικών επιστημών, που λειτουργεί αδιάκοπα από τη δεκαετία του 1980. Η κοινότητα διατηρεί επί του παρόντος μια λίστα αλληλογραφίας, διοργανώνει συναντήσεις και συνέδρια και συντηρεί τις τεχνικές προδιαγραφές ΤΕΙ, ένα περιοδικό, ένα wiki, ένα αποθετήριο GitHub και μια αλυσίδα εργαλείων . Οδηγίες ΤΕΙΟι Οδηγίες ΤΕΙ ορίζουν συλλογικά έναν τύπο μορφής XML και αποτελούν το καθοριστικό προϊόν της κοινότητας πρακτικής. Η μορφή διαφέρει από άλλες γνωστές μορφές κειμένου ανοιχτού κώδικα (όπως το HTML και το OpenDocument ) στο ότι είναι κυρίως σημασιολογική παρά απεικονιστική. καθορίζονται η σημειολογία και η ερμηνεία κάθε τιμής και ιδιότητας . Υπάρχουν περίπου 500 διαφορετικά κειμενικά στοιχεία και έννοιες ( word, [1]sentence ,[2]character , [3]glyph , [4]person , [5] κ.λπ.), καθένα απ' τα οποία βασίζεται σε ένα ή περισσότερα ακαδημαϊκά πεδία και για τα οποία δίνονται παραδείγματα. Τεχνικές λεπτομέρειεςΤο πρότυπο χωρίζεται σε δύο μέρη, μια περιληπτική κειμενική περιγραφή με εκτεταμένα παραδείγματα και συζήτηση και ένα σύνολο ορισμών ανά τιμή. Τα σχήματα στις περισσότερες σύγχρονες μορφές ( DTD, RELAX NG και W3C Schema ) δημιουργούνται αυτόματα από τους ορισμούς ανά τιμή. Ένας αριθμός εργαλείων υποστηρίζει την ανάπτυξη των οδηγιών και την εφαρμογή τους σε συγκεκριμένα έργα. Ένας αριθμός ειδικών τιμών χρησιμοποιείται για την παράκαμψη των περιορισμών που επιβάλλονται από το υφιστάμενο Unicode: η τιμή glyph για να επιτρέπεται η αναπαράσταση χαρακτήρων που δεν πληρούν τις προϋποθέσεις ενσωμάτωσης για συμπερίληψη Unicode [1] και η τιμή choice για να επιτραπεί η προσπέλαση της απαιτούμενης αυστηρής ιεραρχίας. [6] Οι περισσότεροι χρήστες του προτύπου δεν αξιοποιούν το πλήρες φάσμα των τιμών, αλλά παράγουν μια παραμετροποίησή τους χρησιμοποιώντας ένα υποσύνολο ειδικών ανά έργο τιμών και ιδιοτήτων, όπως ορίζονται από τις Οδηγίες. Για το σκοπό αυτό το ΤΕΙ παρέχει έναν εξελιγμένο μηχανισμό προσαρμογής, γνωστό ως ODD. Εκτός από την τεκμηρίωση και την περιγραφή κάθε τιμής TEI, μια προδιαγραφή ODD καθορίζει το μοντέλο περιεχομένου και άλλους περιορισμούς χρήσης, οι οποίοι μπορούν να αποδοθούν χρησιμοποιώντας πρότυπο σχηματοποίησης (schematron) . Το TEI Lite είναι ένα παράδειγμα τέτοιας παραμετροποίησης. Ορίζει έναν μορφότυπο αρχείου, βασισμένο σε XML με σκοπό την ανταλλαγή κειμένων. Είναι μια διαχειρίσιμη επιλογή από το εκτενές σύνολο στοιχείων που διατίθενται στις πλήρεις Οδηγίες του ΤΕΙ. Ως μορφότυπος βασισμένος σε XML, το ΤΕΙ δεν μπορεί να ασχοληθεί άμεσα με επικαλυπτόμενες σημάνσεις και μη ιεραρχικές δομές. Οι οδηγίες προτείνουν ποικίλες επιλογές για την αναπαράσταση αυτού του είδους δεδομένων προτείνεται από τις οδηγίες. [7] ΠαραδείγματαΤο κείμενο των οδηγιών του ΤΕΙ βρίθει παραδειγμάτων. Υπάρχει επίσης μια σελίδα προτύπων αναφοράς στο wiki του ΤΕΙ, [8] που δίνει παραδείγματα πραγματικών έργων που υποδεικνύουν τη δομή ΤΕΙ που χρησιμοποίησαν. Τιμές πεζού κειμένουΤο TEI επιτρέπει την επισημείωση του κειμένου ως προς τη συντακτική σχέση των όρων της πρότασης με όσο βαθμό λεπτομέρειας επιθυμούμε. Για παράδειγμα, αυτή η παράγραφος (p) έχει επισημειωθεί σε επίπεδο περιόδων (s) και σε επίπεδο προτάσεων (cl). [9] <s>
<cl>It was about the beginning of September, 1664,
<cl>that I, among the rest of my neighbours,
heard in ordinary discourse
<cl>that the plague was returned again to Holland; </cl>
</cl>
</cl>
<cl>for it had been very violent there, and particularly at
Amsterdam and Rotterdam, in the year 1663, </cl>
<cl>whither, <cl>they say,</cl> it was brought,
<cl>some said</cl> from Italy, others from the Levant, among some goods
<cl>which were brought home by their Turkey fleet;</cl>
</cl>
<cl>others said it was brought from Candia;
others from Cyprus. </cl>
</s>
<s>
<cl>It mattered not <cl>from whence it came;</cl>
</cl>
<cl>but all agreed <cl>it was come into Holland again.</cl>
</cl>
</s>
ΣτίχοιΤο ΤΕΙ έχει τιμές για σήμανση στίχων. Το ακόλουθο παράδειγμα (παρμένο από τη γαλλική απόδοση των Οδηγιών ΤΕΙ) παρουσιάζει τη δομή ενός σονέτου σε TEI. [10] <div type="sonnet">
<lg type="quatrain">
<l>Les amoureux fervents et les savants austères</l>
<l> Aiment également, dans leur mûre saison,</l>
<l> Les chats puissants et doux, orgueil de la maison,</l>
<l> Qui comme eux sont frileux et comme eux sédentaires.</l>
</lg>
<lg type="quatrain">
<l>Amis de la science et de la volupté</l>
<l> Ils cherchent le silence et l'horreur des ténèbres ;</l>
<l> L'Érèbe les eût pris pour ses coursiers funèbres,</l>
<l> S'ils pouvaient au servage incliner leur fierté.</l>
</lg>
<lg type="tercet">
<l>Ils prennent en songeant les nobles attitudes</l>
<l>Des grands sphinx allongés au fond des solitudes,</l>
<l>Qui semblent s'endormir dans un rêve sans fin ;</l>
</lg>
<lg type="tercet">
<l>Leurs reins féconds sont pleins d'étincelles magiques,</l>
<l> Et des parcelles d'or, ainsi qu'un sable fin,</l>
<l>Étoilent vaguement leurs prunelles mystiques.</l>
</lg>
</div>
Τιμή choiceΗ τιμή choice χρησιμοποιείται για την αναπαράσταση ενοτήτων κειμένου που ενδέχεται να κωδικοποιηθούν ή να επισημανθούν με περισσότερους από έναν πιθανούς τρόπους. Στο ακόλουθο παράδειγμα, με βάση ενός παραδείγματος του προτύπου, η τιμή choice χρησιμοποιείται δύο φορές, μία για να υποδείξει έναν πρωτότυπο και έναν διορθωμένο αριθμό και μία για να υποδείξει μια πρωτότυπη και κανονικοποιημένη ορθογραφία. [11] <p xml:id="p23">Lastly, That, upon his solemn oath to observe all the above
articles, the said man-mountain shall have a daily allowance of
meat and drink sufficient for the support of <choice>
<sic>1724</sic>
<corr>1728</corr>
</choice> of our subjects,
with free access to our royal person, and other marks of our
<choice>
<orig>favour</orig>
<reg>favor</reg>
</choice>.
ODDΤο One Document Does it all ("ODD") είναι μια γλώσσα κωδικοποίησης (literate programming) για σχήματα XML . [12] [13] [14] [15] Στο είδος του εγγράμματου προγραμματισμού, τα έγγραφα ODD συνδυάζουν τεκμηρίωση αναγνώσιμη από τον άνθρωπο και μηχαναγνώσιμα μοντέλα χρησιμοποιώντας τη λειτουργική μονάδα των Στοιχείων Τεκμηρίωσης (Documentation Elements) του Text Encoding Initiative (Πρωτοβουλίας Κωδικοποίησης Κειμένου). Τα εργαλεία δημιουργούν τοπικά και διεθνοποιημένα HTML, ePub ή PDF αποτελέσματα αναγνώσιμα από τον άνθρωπο και DTD, σχήμα W3C XML, Relax NG Compact Syntax ή Relax NG XML Syntax μηχαναγνώσιμα αποτελέσματα. Η διαδικτυακή εφαρμογή Roma [16] είναι βασισμένη στη μορφή ODD και μπορείτε να τη χρησιμοποιήσετε για τη δημιουργία σχημάτων σε μορφές DTD, W3C XML Schema, Relax NG Compact Syntax ή Relax NG XML Syntax, όπως χρησιμοποιείται από πολλά εργαλεία και υπηρεσίες επικύρωσης XML. Το ODD είναι ο μορφότυπος που χρησιμοποιείται εσωτερικά από το Text Encoding Initiative για το τεχνικό πρότυπο ΤΕΙ. [17] Αν και τα αρχεία ODD γενικά περιγράφουν τη διαφορά μεταξύ μιας προσαρμοσμένης μορφής XML και του πλήρους μοντέλου TEI, το ODD μπορεί επίσης να χρησιμοποιηθεί για να περιγράψει μορφές XML που είναι εντελώς ξεχωριστές από το TEI. Ένα παράδειγμα αυτού είναι το Internationalization Tag Set του W3C που χρησιμοποιεί τη μορφή ODD για τη δημιουργία σχημάτων και την τεκμηρίωση του λεξιλογίου του. [18] [19] Παραμετροποιήσεις ΤΕΙΟι παραμετροποιήσεις του TEI είναι εξειδικεύσεις του προτύπου TEI XML για αξιοποίηση σε συγκεκριμένους τομείς ή από συγκεκριμένες κοινότητες
Η παραμετροποίηση του ΤΕΙ γίνεται μέσω του μηχανισμού ODD που προαναφέρθηκε. Στην πραγματικότητα, από την έκδοσή του P5, όλες οι λεγόμενες «TEI Conformant» χρήσεις των Οδηγιών ΤΕΙ βασίζονται σε μια παραμετροποίηση ΤΕΙ,όπως τεκμηριώνεται σε ένα αρχείο TEI ODD. Ακόμη και αν προτιμηθούν από τους χρήστες τα προ-δημιουργημένα και τυποποιημένα σχήματα επικύρωσης, αυτά έχουν δημιουργηθεί από ελεύθερα διαθέσιμα αρχεία προσαρμογής. ΈργαΤο μορφότυπο χρησιμοποιείται από πολλά έργα παγκοσμίως. Πρακτικά όλα τα έργα είναι συνδεδεμένα με ένα ή περισσότερα πανεπιστήμια. Μερικά γνωστά έργα που κωδικοποιούν κείμενα χρησιμοποιώντας ΤΕΙ περιλαμβάνουν: ΙστορίαΠριν από τη δημιουργία του ΤΕΙ, οι μελετητές των ανθρωπιστικών επιστημών δεν είχαν κοινά πρότυπα για την κωδικοποίηση ηλεκτρονικών κειμένων με τρόπο που να εξυπηρετεί τους ακαδημαϊκούς τους στόχους (Hockey 1993, σελ. 41). Το 1987, μια ομάδα μελετητών που αντιπροσώπευαν τομείς στις ανθρωπιστικές επιστήμες, τη γλωσσολογία και την πληροφορική συγκεντρώθηκε στο Vassar College για να παρουσιάσει ένα σύνολο κατευθυντήριων γραμμών γνωστών ως «Αρχές Poughkeepsie». Αυτές οι οδηγίες κατεύθυναν την ανάπτυξη του πρώτου προτύπου ΤΕΙ, «P1». [22] [23]
Βιβλιογραφία
Εξωτερικοί σύνδεσμοι
|