The World Wide Web Consortium - Eλληνικό Γραφείο W3C

Η Κοινοπραξία του Παγκοσμίου Ιστού Εκδίδει τη Γλώσσα SSML 1.0 ως Σύσταση του W3C

Η Υψηλής Ποιότητας Σύνθετη Ομιλία Ενισχύει το Πλαίσιο Διεπαφής Ομιλίας

Για επικοινωνία με Αμερική και Αυστραλία --
Karen Myers, <w3t-pr@w3.org>, +1.617.253.5884 ή +1.978.502.6218
Για επικοινωνία με Ευρώπη --
Marie-Claire Forgue, <mcf@w3.org>, +33.492.38.75.94
Για επικοινωνία με Ασία --
Yasuyuki Hirakawa, <chibao@w3.org>, +81.466.49.1170

(Το δελτίο τύπου είναι επίσης διαθέσιμο στα Αγγλικά, Γαλλικά και Ιαπωνικά)

Συστάσεις (Testimonials) είναι επίσης διαθέσιμες.


http://www.w3.org/ -- 8 Σεπτεμβρίου 2004 -- Η Κοινοπραξία του Παγκοσμίου Ιστού (W3C) ενδυναμώνει τη φωνή του Παγκοσμίου Ιστού με την έκδοση της Γλώσσας Σήμανσης Σύνθεσης Ομιλίας: Speech Synthesis Markup Language (SSML) 1.0 ως Σύσταση του W3C. Η SSML 1.0, μια βασική προδιαγραφή του Πλαισίου Διεπαφής Ομιλίας του W3C (W3C Speech Interface Framework), αναβαθμίζει το ρόλο της σύνθετης ομιλίας υψηλής ποιότητας, σε αλληλεπιδράσεις στον Παγκόσμιο Ιστό. Οι σχεδιαστές εφαρμογών για κινητά τηλέφωνα, προσωπικούς ψηφιακούς βοηθούς (PDAs) και εύρος τεχνολογιών που προκύπτουν, χρησιμοποιούν την SSML 1.0 για να επιτύχουν προσεγγιστικό αλλά και ακριβή έλεγχο σημαντικών συνιστωσών της σύνθεσης ομιλίας, συμπεριλαμβανομένης της προφοράς, της έντασης και του τόνου. Όπως και οι άλλες Συστάσεις του W3C: VoiceXML 2.0 και η Προδιαγραφή Γραμματικής Αναγνώρισης Ομιλίας: Speech Recognition Grammar Specification (SRGS) που εκδόθηκαν από την Ομάδα Εργασίας Περιηγητή Φωνής του W3C (W3C Voice Browser Working Group), η SSML 1.0 είναι χτισμένη για ενσωμάτωση με άλλες τεχνολογίες του Παγκοσμίου Ιστού και για να προάγει τη δια-λειτουργικότητα σε εύρος διαφορετικών πλατφόρμων σύνθεσης.

“Είμαι ενθουσιασμένος με την πρόοδο της Ομάδας Εργασίας Περιηγητή Φωνής, στην παροχή βελτιωμένης πρόσβασης σε τηλεφωνικές υπηρεσίες μέσα από τη χρήση τεχνολογιών του Παγκοσμίου Ιστού,” είπε ο Διευθυντής του W3C Tim Berners-Lee, που θα απευθύνει κεντρική ομιλία στο Συνέδριο SpeechTEK Conference την επόμενη βδομάδα. Πρόσθεσε, “Οι εταιρείες μπορούν τώρα να προσφέρουν πρόσβαση στον Παγκόσμιο Ιστό στους πελάτες τους μέσω τηλεφώνου καθώς και μέσω προσωπικού υπολογιστή.”

Το Πλαίσιο Διεπαφής Ομιλίας του W3C που στοχεύει στα περίπου δύο δισεκατομμύρια σταθερές γραμμές και κινητά τηλέφωνα παγκοσμίως, - που είναι μια συλλογή προδιαγραφών για το χτίσιμο εφαρμογών φωνής για τον Παγκόσμιο Ιστό - θα επιτρέψει σε ένα χωρίς προηγούμενο πλήθος ανθρώπων να χρησιμοποιήσουν οποιοδήποτε τηλέφωνο για να αλληλεπιδράσουν με κατάλληλα σχεδιασμένες υπηρεσίες που βασίζονται στον Παγκόσμιο Ιστό μέσω πληκτρολογίων, προφορικών εντολών, με ακρόαση προ-μαγνητοφωνημένης ομιλίας, συνθετική ομιλίας και μουσικής.

Μια Σύσταση της Κοινοπραξίας του Παγκοσμίου Ιστού (W3C Recommendation) γίνεται αντιληπτή από τη βιομηχανία και την κοινότητα του Παγκοσμίου Ιστού ως πρότυπο (standard) του Παγκοσμίου Ιστού. Κάθε Σύσταση είναι μια σταθερή προδιαγραφή που αναπτύσσεται από μια Ομάδα Εργασίας του W3C και αξιολογείται από τα Μέλη του W3C (W3C Membership). Οι Συστάσεις προάγουν τη δια-λειτουργικότητα των τεχνολογιών του Παγκοσμίου Ιστού με το να εκφράζουν την ομοφωνία της βιομηχανίας, όπως διαμορφώνεται από την Ομάδα Εργασίας.

Ένα Πλούσιο Λεξιλόγιο για Ομιλία Υψηλής Ποιότητας

Μια από τις πρωταρχικές προκλήσεις που απευθύνει η SSML για την ενδυνάμωση της φωνής στον Παγκόσμιο Ιστό είναι η προφορά. Για παράδειγμα, πως προφέρουμε το “1/2”? Η προδιαγραφή SSML 1.0 χρησιμοποιεί αυτό το απλό παράδειγμα για να δείξει μερικές από τις προκλήσεις μετατροπής κειμένου γενικού σκοπού σε σύνθετη, με νόημα ομιλία. Χωρίς περισσότερη πληροφορία, δε θα μπορούσε κανείς να πει αν το νόημα είναι “μισό” ή “δύο Ιανουαρίου” ή “μια Φεβρουαρίου” ή “ένα δια δύο”. Οι κατασκευές (constructs) της SSML 1.0 βοηθούν να εξαλειφθεί αυτή η αβεβαιότητα. Το λεξιλόγιο της SSML επιτρέπει σε επίπεδο λέξεων, σε επίπεδο φωνημάτων και ακόμα σε επίπεδο διακύμανσης τον έλεγχο του αποτελέσματος για να ικανοποιείται ένα ευρύ φάσμα σεναρίων εφαρμογής και απαιτήσεων συγγραφής.

“Η SSML χτίζει στη δουλειά των πρωτεργατών στη σύνθεση ομιλίας για να παράσχει στους κατασκευαστές εφαρμογών ένα ισχυρό και ευέλικτο μέσο για υψηλής ποιότητας συνδυασμό σύνθετης και προ-μαγνητοφωνημένης ομιλίας ως μέρος δια-λειτουργικών υπηρεσιών που αφορούν φωνητικές απαντήσεις,” είπε ο Dave Raggett, Επικεφαλής της Δραστηριότητας της δουλειάς του W3C σε περιηγητές φωνής και Συνεργάτης του W3C από την Canon. Πρόσθεσε, “Η SSML επιτρέπει να υπάρχει πρόσβαση στις υπηρεσίες που βασίζονται σε VoiceXML μέσω συσκευών κειμένου (textphones) για άτομα με ομιλητικές ή ακουστικές αναπηρίες. Επιπρόσθετα, η SSML έχει μεγάλες προοπτικές πέρα από τη χρήση της με τη VoiceXML, καθώς συγκλίνουν τα πρότυπα για την πολυτροπική αλληλεπίδραση (standards for multimodal interaction).”

Όπως η XHTML, η SSML είναι γλώσσα σήμανσης που βασίζεται στο ευρέως διαδεδομένο πρότυπο XML. Το περιεχόμενο της SSML μπορεί να είναι αυτόνομο ή να συμπεριληφθεί σε άλλο περιεχόμενο XML ώστε να βελτιωθεί η απόδοση ως σύνθετη ομιλία. Φυσικά, η SSML είναι κατάλληλη για χρήση με VoiceXML wrapper όταν χτίζεται μια δια-λειτουργική εφαρμογή φωνητικής απάντησης.

Η SSML 1.0 χτίζεται για ενσωμάτωση στον Παγκόσμιο Ιστό και με άλλους τρόπους. Η Ομάδα Εργασίας Περιηγητή Φωνής δούλεψε στενά με άλλες ομάδες του W3C για να επιβεβαιώσει ότι ο σχεδιασμός του SSML 1.0 είναι συμβατός με τις αρχές προσβασιμότητας, διεθνοποίησης και γενικά με την αρχιτεκτονική του Παγκοσμίου Ιστού. Πράγματι, μια σημαντική εφαρμογή της SSML αφορά τα "τηλέφωνα κειμένου" που μπορούν να χρησιμοποιηθούν από άτομα με ακουστικές δυσκολίες. Το ίδιο περιεχόμενο μπορεί να είναι φωνητική απόδοση μέσα από ένα κοινό τηλέφωνο. Η SSML 1.0 είναι επίσης συμβατή με προηγούμενη δουλειά του W3C στην περιγραφή της προφοράς με Φύλλα Στυλ: Cascading Style Sheets (CSS). Η Ομάδα Εργασίας CSS του W3C αναπτύσσει μια ενότητα ομιλίας στο CSS3 για την απόδοση εγγράφων XML με μηχανές ομιλίας που βασίζονται σε SSML.

Έγκαιρη Υιοθέτηση από τη Βιομηχανία

Η Ομάδα Εργασίας Περιηγητή Φωνής του W3C ήταν πολύ επιτυχής στην εξασφάλιση της υιοθέτησης των προδιαγραφών της, πριν αυτές φτάσουν το στάδιο της Σύστασης. Ένα σύνολο δοκιμών (που συζητήθηκε στην αναφορά εφαρμογής της SSML τον Ιούλιο του 2004 - July 2004 SSML implementation report) βοήθησε στην επιβεβαίωση της συνεπούς συμπεριφοράς και ποιότητας ανάμεσα στις ήδη πολυπληθείς εφαρμογές της SSML 1.0. Αυτοί που έχουν ήδη εφαρμόσει την SSML 1.0 και συμμετέχουν στην Ομάδα Εργασίας περιλαμβάνουν: Aspect Communications, France Telecom, Hewlett-Packard, IBM, Loquendo, Microsoft, MITRE, Nuance Communications, SAP, ScanSoft, Sun Microsystems, VoiceGenie Technologies, Voxeo και Voxpilot.

Η Ομάδα Εργασίας θα επικεντρώσει τώρα τις ενέργειές της στο υπόλοιπο του Πλαισίου Ομιλίας. “Μετά τη VoiceXML 2.0 και την Προδιαγραφή Γραμματικής Αναγνώρισης Ομιλίας (Speech Recognition Grammar Specification - SRGS), η SSML είναι η τρίτη γλώσσα του Πλαισίου Διεπαφής Ομιλίας που γίνεται πλήρης Σύσταση του W3C,” είπε ο Jim Larson, διευθυντής στο τμήμα “advanced human input/output”, στην Intel και επίσης συν-επικεφαλής της Ομάδας Εργασίας Περιηγητή Φωνής του W3C. “Δουλεύουμε για να ολοκληρώσουμε τη δουλειά σε άλλες γλώσσες του Πλαισίου Διεπαφής Ομιλίας του W3C, συμπεριλαμβανομένης της VoiceXML 2.1, της Σημασιολογικής Ερμηνείας, και της Επεκτάσιμης Γλώσσας Σήμανσης Κλήσης Ελέγχου (Call Control eXtensible Markup Language - CCXML).”

Η Ομάδα Εργασίας είναι ανάμεσα στις μεγαλύτερες και πιο ενεργές του W3C. Οι συμμετέχοντές της περιλαμβάνουν: Aspect Communications, BeVocal, Brooktrout Technology, Canon, Comverse Technology, Convedia, Electronic Data Systems, France Telecom, Genesys Telecommunications Laboratories, HeyAnita, Hitachi, Hewlett-Packard, IBM, Intel, IWA-HWG, Korea Association of Information and Telecommunication, Loquendo, Microsoft, MITRE, Mitsubishi Electric, Motorola, Nokia, Nuance Communications, Openstream, SAP, ScanSoft, Siemens, Sun Microsystems, Syntellect, Tellme Networks, Verascape, Vocalocity, VoiceGenie Technologies, Voxeo και Voxpilot.

Σχετικά με την Κοινοπραξία Παγκοσμίου Ιστού (W3C)

Το W3C δημιουργήθηκε με σκοπό να οδηγήσει τον Παγκόσμιο Ιστό στην πλήρη αξιοποίηση των δυνατοτήτων του μέσω της ανάπτυξης κοινών πρωτοκόλλων που προάγουν την εξέλιξη του και διασφαλίζουν την δια-λειτουργικότητα του. Είναι μια διεθνής κοινοπραξία που διευθύνουν από κοινού το MIT Computer Science and Artificial Intelligence Laboratory (CSAIL) στις ΗΠΑ, το European Research Consortium for Informatics and Mathematics (ERCIM) στη Γαλλία και το Keio University στην Ιαπωνία. Οι υπηρεσίες που παρέχονται από την Κοινοπραξία περιλαμβάνουν μια αποθήκη πληροφοριών σε θέματα του Παγκοσμίου Ιστού για τους κατασκευαστές λογισμικού και τους χρήστες, μαζί με πρωτότυπα και δείγματα εφαρμογών που επιδεικνύουν τη χρήση της νέας τεχνολογίας. Σχεδόν 400 οργανισμοί είναι Μέλη της Κοινοπραξίας. Για περισσότερες πληροφορίες απευθυνθείτε στο: http://www.w3.org/