Automatic speech recognition system for Turkish spoken language
题名:
Automatic speech recognition system for Turkish spoken language
个人著者:
PRODUCTION_INFO:
[s.l. : s.n.], 2012.
物理描述:
xvii, 212 leaves : illustrations ; 30 cm + 1 CD-ROM.
一般注释:
Date of approval: 21.06.2012
摘要:
The transmission and storage of speech sounds is possible for decades. In addition by using signal processing techniques, it is also possible tp process speech signals. By using time abd frequency analysis od speech signal and several machine learning algorithms, it is possible to build a system which is used to recognize spoken words. Such systems are called Automatic Speech Recognition systems. In our work, We have used the Automatic Speech Recognition system for Turkish spoken language which has built by BUSIM speech group. However, the output of the recognizer is the list of spoken words. Even for humans it is avery hard to understand a text without punctuation symbols. Hence to build more complex recognizer whose goal to perform topic segmentation and topic summarization, the output of ASR should be divided into sentences at first. Our goal is to build a system which performs the sentence segmentation. In our work We have used ASR system to obtain word level and phoneme level time marks and by using that time marks with the audio files, We have extracted prosodic features, where the prosodic properties of speech contains information about the punctuation in the text, which is not available at the output of ASR system.
Uzun yıllardan beri ses ve konuşmaların saklanması ve iletilmesi mümkündür. Ayrık zamanlı ve sürekli zamanlı işaret işleme yöntemleri sayesinde ses ve konuşma işaretleri de işaretleri de işlenebilmektedir. Bununla beraber, eğitilebilen algoritmalar kullanılarak Otomatik Konuşma Tanıma ve Otomatik Konuşmacı tanıma sistemleri de geliştirilebilmektedir. Bu çalışamada Boğaziçi Üniversitesi'nde bulunan ''BUSİM spech group'' tarafından geliştirilmiştir, Türkçe dili için otomatik konuşma tanıma sistemi kullanılmıştır. Bu sistem; konuşmacıların söylediği kelimeleri bir liste halinde dökebilmektedir. Ancak; bir insan için bile noktalama işaretlerinden yoksun bir metinden bilgi alabilmek oldukça zordur. Bu sebebten dolayı konu bölütleme veya konu özetleme gibi daha ileri uygulamaları yapabilmek için, öncelikle cümle bölütleme işlemenin yapılması gerekmektedir. Dil bilgisine uygun bir yazılı metindeki noktalama işaretleri, diksiyonda vurgu ile belirtilmektedir. Başka bir deyişle bu özellikler konuşma işaretinin bürünsel özellikleridir. Amacımız, Otomatik Konuşma Sisteminin çıktıları ile ses işaretinin bürünsel özelliklerini kullanarak cümle bölütlenmesini otamatik yapabilenbir sistem geliştirmektedir.
附加统一题名:
Thesis (Master) -- Işık University: Graduate School for Science and Engineering.
M.S. -- Electronics Engineering.
Graduate School for Science and Engineering -- Electronics Engineering.
Türkçe dili için otomatik konuşma tanıma sistemi. English.
电子访问:
Click for open access
语言:
英文