学生時代にやった研究、今思うと本当に倫理的に間違ったことをしていて反省している。統計的手法(今AIと呼ばれている技術)に基づく歌声合成をするために、本来膨大な歌声の学習データを必要とするところを、歌声を集めるのは大変だけど非歌声(セリフ音声等)なら集めやすいので、非歌声を加工したりラベリングを工夫することで行えないかという実験だった。これである程度の精度が得られれば誰の声でも歌声合成が出来て素晴らしいよねって主張の研究だったのだけれど、それで得する人より、迷惑かかる人の方が多いんじゃないか?という。
個人の学部生レベルの研究なので大した結果にならなかったけれど、これをもし企業がやっていたら……
6 months ago