Tugas Akustik
Voice Synthesis :
Another Acoustic based Technology
diajukan untuk memenuhi tugas akustik
Hari Solagratia Sinuhaji – 13305017
Normalnya, perambatan suatu suara mencapai telinga manusia melewati gelombang tekanan dalam medium udara. Rentag pergetaran suara manusia yang dapat terdengar merambat pada rentang frekuensi diantara 16 Hz dan 20KHz. Sound Pressure Level dan kecepatan perambatan suara tergolong rendah, seperti dapat dilihat tabel dibawah
Tingkat tekanan suara diberikan dalam nilai akar kuadrat rata-rata (RMS). Nilai akar kuadrat rata-rata ini didapat dari pengakaran dari rata-rata data kuadrat yang didapat.
Nilai akar kuadrat rata-rata sebuah area yang terlingkupi gelombang suara dalam lingkungan terbuka dapat direpresentasikan dalam persamaan matematis :
Pr = P0/r dynes/cm2
dimana nilai Pr adalah nilai akar kuadrat rata-rata tingkat tekanan suara dalam jarak r dari sumber suara dan P0 adalah nilai akar kuadrat rata-rata tekanan suara setiap satuan jarak dari sumber suara.
Pendahuluan
Dewasa ini, beberapa industri dan universitas telah banyak mengembangkan sistem identifikasi suara. Sistem identifikasi ini dan lainnya dikembangkan dari penghibahan Defense Advanced Research Projects Agency (DARPA) untuk menyatukan kemampuan untuk mengubah pembicaraan menjadi teks elektronik dengan kepintaran buatan untuk memahami teks tersebut. Dalam sistem ini komputer berperan sebagai agen untuk mengetahui kemauan user dan bagaimana cara untuk melaksanakan perintah tersebut, termasuk didalamnya suara yang dapat dihasilkan dari suatu pernagkat digital. Secara keseluruhan, sistem penyusunan suara manusia ini dapat menggantikan pekerjaan seorang pekerja sebuah industri tanpa menggunakan tangannya, dimana dapat diartikan pada kenaikan produktifitas dan penghematan biaya.
SPEECH SYNTHESIS
Pertama, Suatu program sintesis suara manusia harus mengakses dari perbendaharaan kata dari sekuens kata yang dibutuhkan. Keseluruhannya butuh dipadupadankan, dengan durasi yang tepat, intensitasm dan nada suara dari teks yang dideskripsikan. Deskripsi yang dihubungkan dengan penyebutan diberikan dalam alat sintesis, yang menghasilkan sinyal untuk mentransmisikan pada suatu rangkaian penghasil suara.
Tiga teknik berbeda yang dapat digunakan untuk menghasilkan suatu ucapam : (1) adaptive differential pulse-code modulation (ADPCM), (2) sintesis formant, (3) tes sintesis.
Adaptive Differential Pulse-Code Modulation (ADPCM)
Program yang mensintesa ini memanggil kata yang dikodekan digital dari sebuah piringan, tempat dimana penyimpanan sekuens kata, dan mengirimkan ke ADPCM decoder, yang menghasilkan sinyal analog. Pengaturan persajakan (aksen dan modulasi suara) yang berdampak pada rekonstruksi pesan dikendalikan dengan mengatur interval waktu diantara kata berturutan, dan intensitas kemungkinan kemunculan kata. Namun, sampai saat ini belum ada pengendalian yang dapat mengatur intonasi suara atau penggabungan vokal dari gema di sekitar dinding pembatas.
Teknik ini sangat cocok untuk pesan yang membutuhkan ukuran perbendaharaan kata yang sederhana dan sangat terbatas pada arti kata yang longgar. Beberapa penyampai pesan yang dapat digunakan adalah pembacaan suara dari bilangan, seperti nomor telepon, dan instruksi untuk prosedur operasi, seperti perlengakapan merangkai atau pengkabelan. Gambar di bawah memperlihatkan skematik simple dari ADPCM decoder.
Formant Synthesis
Sintesis formant menggunakan pemodelan sintesis dimana perbendaharaan kata dianalisis dan parameternya tersimpan sebagai variasi waktu dari sistem resonansi vocal, atau formants. Speech formants atau ucapan formants direpresentasikan dalam daerah yang gelap dalam spektogram suara yang ditunjukkan pada panel paling bawah.