« 『ブラスト!』  blast! | Main | 氷の世界 »

November 15, 2004

音声合成

日頃疑問に思っているのは、最近はフルCGの映画などもちょくちょく出始めてるし、3DCGの動画を作れるソフトウェアなども出回ってきている反面、フルCGの映画であっても起用しているのは人間の声優で、音声の合成で作られる様子はまだないことだ。また、たどたどしい音声読み上げのソフトウェアは出てきてはいるが、音声合成のソフトウェアについてはコンシュマー系のものはあまり見当たらない。

この分野についてはまったく専門ではないので想像で書くことしかできないので、間違いなどあると思うのでご指摘願いたい。動画と音声の構成要素を考えるに、デジタル記録ディアでの容量を比較すれば圧倒的に動画の方が多くなるであろう。ただシンセサイザーの音作りでもそうなのだが、「分かりやすいインターフェイス」が非常に作りにくいということがこの分野での発展が思いの外遅れている一因ではないかと想像する。

音を視覚的に表現できるのは縦波を横波に変換した波形であるが、波形自体時系列での変化が非常に激しい上に単純な音を除けば波形自体から音を推測してくのは難しいものがある。音の高低だけであれば周波数の単純な演算で処理できるし、おそらく言葉独自の抑揚やイントネーションも辞書の形で装備していけば精度があがっていくのだろうが、フォルマントの解析はできてもどういじれば意思道理に変化させていくことができるかは、インターフェイスを工夫するか人が歩み寄っていくかしないと難しい気がする。

今年になってからも、いろいろ各社がよりなめらかな音声合成を開発していることを発表したり、YAMAHA XG WORKSのようにプラグインで歌を歌わせるようなものも出てたりする。この分野の今後の進歩に大いに期待したい。


|

« 『ブラスト!』  blast! | Main | 氷の世界 »

Comments

Post a comment



(Not displayed with comment.)




TrackBack

TrackBack URL for this entry:
http://app.cocolog-nifty.com/t/trackback/53033/1972171

Listed below are links to weblogs that reference 音声合成:

« 『ブラスト!』  blast! | Main | 氷の世界 »