歌声合成を調べているうち隠れマルコフモデルを使った音源というのを見つけた。
この隠れマルコフモデルとはなんぞやと調べるとまあ難しい。Wikipediaにはこう書いてあった。
隠れマルコフモデル(かくれマルコフモデル、英語: Hidden Markov Model)は確率モデルの一つである。「システムがパラメータ未知のマルコフ過程である」と仮定し、観測可能な情報からその未知のパラメータを推定する。音声認識、ゲノミクス、形態素解析(自然言語処理)などに応用されている。
まあまずマルコフモデルというのがわからないね。さらにはそれが隠れているのいうのだからなんだかさっぱりだ。ソースコードを読むにはある程度理屈がわかっていないと読めない。プログラムを書くほどに知識はいらないけどね。
それでいろいろ資料を読んでいるけどわかりそうでわからないのが今の状態だ。
- http://abcpedia.acoustics.jp/bs13_a_q5.pdf
- http://www.bioinfo.sfc.keio.ac.jp/class/bioinfo-a/PPT/bioinfo-a09s-6_HMM.pdf
- http://www.gavo.t.u-tokyo.ac.jp/~mine/japanese/nlp+slp/IPSJ-MGN451003.pdf
- http://www.slp.ics.tut.ac.jp/nakagawa/ml/04.pdf
- http://unicorn.ike.tottori-u.ac.jp/murakami/doctor/node7.html
あたりを読んでみたけどさっぱりだ。確率あたりの話は苦手だけど、なんとかさわりだけでも理解したいね。。