Τρίτη 13 Μαρτίου 2012

Λογισμικό Μετάφρασης με τη δική μας φωνή από την Microsoft!


  Τα Ερευνητικά Εργαστήρια της Microsoft ανέπτυξαν ένα νέο πρωτότυπο λογισμικό που μπορεί να είναι το επόμενο μεγάλο βήμα για την “συσκευή παγκόσμιας μετάφρασης”, μία συσκευή δηλαδή που θα μπορεί να αναστρέψει άμεσα μια γλώσσα σε μια άλλη, έτσι ώστε να είναι δυνατή η συνομιλία μεταξύ δύο ανθρώπων ακόμα και όταν δεν μπορεί ο ένας να καταλάβει τη γλώσσα του άλλου.

  Η νέα καινοτομία παρουσιάστηκε κατά τη διάρκεια του TechFest 2012 από τον υπεύθυνο των Ερευνητικών Εργαστηρίων της Microsoft Rick Rashid. Η τεχνολογία αυτή διατηρεί τη χροιά, την προφορά και τον τονισμό των ομιλητών και η μετάφραση γίνεται σε 26 γλώσσες. Αν και αφήνει ένα ίχνος “ρομποτικής φωνής” σε ορισμένες συλλαβές, κάνει μια εξαιρετική δουλειά στην διατήρηση της προσωπικής απόχρωσης της φωνής του κάθε ομιλητή. Δηλαδή μπορείτε να πείτε μια πρόταση στα ελληνικά και η συσκευή αυτή θα παράγει την αντίστοιχη πρόταση,  για παράδειγμα στα ισπανικά, με την δική σας φωνή!


  Η διαδικασία δεν είναι στιγμιαία. Το λογισμικό θα πρέπει να δαπανήσει περίπου μία ώρα με κάθε έναν που λαμβάνει μέρος στη συνομιλία, μαθαίνοντας τα στοιχεία των επιμέρους χαρακτηριστικών του λόγου αυτού του ατόμου. Όμως μόλις το λογισμικό έχει προσαρμοστεί, μπορεί να μεταφράσει περισσότερα και σε πραγματικό χρόνο. Η ιδέα της εφαρμογής είναι ότι μια μέρα, όχι και τόσο μακρινή, θα είμαστε σε θέση να εκπαιδεύσουμε τα τηλέφωνα μας μόνο μία φορά στο στυλ του λόγου μας και στη συνέχεια να χρησιμοποιούμε το λογισμικό για να μιλήσουμε πάνω από το τηλέφωνο με οποιονδήποτε και σε πραγματικό χρόνο, ανεξάρτητα από το αν μιλάμε την ίδια γλώσσα.

  Για να αναπτύξει η Microsoft αυτήν τη παγκόσμια μετάφραση βασίστηκε σε διάφορα ήδη υπάρχοντα εργαλεία. Η διαδικασία έχει ώς εξής: Αρχικά το σύστημα χρησιμοποιεί λογισμικό αναγνώρισης φωνής, στη συνέχεια χρησιμοποιεί Bing για μετάφραση και τέλος εισάγει μια τεχνολογία μετατροπής κειμένου σε ομιλία για να μετατρέψει τα αποτελέσματα σε φωνή. Το δύσκολο κομμάτι είναι η διαμόρφωση της φωνής. Η ηχογραφημένη μητρική γλώσσα χωρίζεται σε δείγματα των 5 ms και τα επιμέρους δείγματα χρησιμοποιούνται για να “εκπαιδεύσουν” το πρόγραμμα στη γλώσσα-στόχο.
   
  Η Microsoft βρίσκεται ακόμη στο στάδιο επεξεργασίας αυτής της εφαρμογής, αλλά όπως δείχνουν 
τα πράγματα δεν θα αργήσει να την τελειοποιήσει και αυτή να τεθεί σε κυκλοφορία.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου