SpeechLab 2.0 - синтезатор на българска реч
Категория: Системна интеграция
PC MAGAZINE
сряда, 15 Ноември 2006 0:00ч
Ръководителят на проекта н.с. д-р Стоян Михов направи демонстрация и представи софтуерните технологии и математически методи, използвани при реализацията. Голяма част от презентацията бе представена от гласа „Гергана“ на самия синтезатор.
SpeechLab 2.0 е синтезатор на българска реч, постигащ забележително естествено и гладко звучене, в пълно съответствие с българските езикови норми. За целта, наред с интонационно модулирания глас, са използвани усъвършенствани методи за фонетизация на текста, пълен речник на ударения, граматики за определяне частите на речта и правила за анотация на прозодията. При разработката са използвани уникални научни резултати, чрез които се постига скорост на синтез над 1500 думи/сек. при прилагане на стотици контекстни правила и огромни речници.
С помощта на тази програма можете да четете, създавате и обработвате текстове на български език в различни приложения. SpeechLab разполага с възможности за различни настройки, които улесняват работата на потребителя. С тази говореща програма можете да четете избран от вас текст в различни текстообработващи програми или Интернет с подходящата за вашите нужди интонация и да прослушате копиран в клипборда откъс, без да е необходимо да използвате скрийн риидър. С нея можете да четете субтитри, ако разполагате с програми за гледане на филми, които поддържат MS SAPI 5. SpeechLab ви дава възможност да четете дори когато не разполагате с компютър, като запишете в аудио формат избраното от вас четиво.
Програмата е разработена след задълбочена граматична обработка на текст чрез граматичен речник с обем над 1 млн. словоформи и стотици контекстни граматични правила, постигащи граматична прецизност над 98,4%. Скоростта на синтеза е 1500 думи за секунда, а пълната платформена независимост на основния модул прави разработката особено гъвкава. Сред плюсовете на синтезатора са възможностите за правилно произнасяне на английски думи, потребителски речник, който позволява добавяне на съкращения, нови думи, специални символи и други. Не на последно място, използвани са гласове на професионални диктори, което гарантира приятен за ухото тембър и добра артикулация.
Продуктът е разработен от екип от лингвисти, програмисти, специалист по аудио-обработка, професионални диктори и група, отговаряща за тестването, в рамките на проект на Българската асоциация за компютърна лингвистика. Асоциацията стана известна с разработката на серия от продукти за български език, сред които са правописният коректор „ItaEst – Така е!“, граматичен анализатор „GrammLab“ и др.
Партньор на БАКЛ (www.bacl.org) в разработката на SpeechLab 2.0 е Microsoft България. Microsoft подпомогнаха проект за разпространението на информационните технологии сред хората със зрителни увреждания. Фондацията на студентите със зрителни увреждания „Хоризонти“ и Съюзът на слепите в България са регистрирали вече над 500 ползватели на Desktop модификацията на SpeechLab 2.0.
Сървърната модификация на SpeechLab 2.0 е внедрена в информационната система на НОИ (на тел. 02 9261099) в партньорство с фирма OpenCode. Други индустриални приложения са в процес на внедряване.
