ニュースイッチ

ボーカロイドは音楽の歴史を変えたのか?初音ミクだけでないブームの背景とは

連載・先駆者に聞く #5「ボーカロイド」ヤマハ 剣持秀紀氏

歌声を楽器のように扱える、音声ソフトウエアの「ボーカロイド」。多くのファンに支持され、現在第一線で活躍する音楽プロデューサーやアーティストも、ボーカロイドを使い多くの楽曲を作っていた。開発者の剣持秀紀氏にボーカロイドの開発背景やビジネスの転換点を聞いた。(聞き手・昆梓紗)

連載・先駆者に聞く:新たな学問や文化の領域を切り開く先駆者たち。彼らはなぜその分野を開拓してきたのか。6人の先駆者の声に耳を傾けた。

リアルな歌声目指す

―2000年にボーカロイドの開発がスタートしました。
 当時はパソコンの性能向上とともにいろいろな楽器が打ち込み音源になっていきましたが、唯一残されていたのが歌声でした。歌声の打ち込みもできるのでは、ということで「リアルな人間の歌声ときちんと歌詞を聞き取れること」を目指し、バルセロナのポンペウ・ファブラ大学との共同開発をスタートしました。
 ボーカロイド以前にも歌声を打ち込みにしようという研究がされていました。ボーカロイド開発が5~10年早かったらパソコンの処理能力が追い付かず、実用化に至らなかったし、5年遅くても他社に先を越されていたでしょう。最初のバージョンが発売された2004年は環境が整っており、タイミングが良かったと思います。

―「リアルな歌声」を目指したとのことですが、どのような仕組みで実現したのでしょうか。
 歌詞と音符を入力し、それに沿ってあらかじめ登録されている歌声ライブラリ(ボイスバンク)から音の断片を周波数領域で処理して接続し加工することで歌声を作り出します。その時、ただつなぎ合わせるだけでは違和感が残りますので、スムーズにつながるような処理をします。
 例えば、「朝(a-sa)」を合成するとして、「無音からa」「aからsへの移り変わり」「sa」「a」「aから無音」を記録しておいて、それを歌声合成に利用します。このようなテキスト音声合成技術は数十年前からあったのですが、それを歌声に利用しました。

(ヤマハ提供)
 「音の断片を繋ぎ合わせる」と言いましたが、繋いだだけでは音色が違いますよね。ただ2音間の音の移り変わりはなるべく保持し、伸ばしの部分で音色を変えるようにしたこともポイントです。そしてこの技術は理にかなっていたと開発後に気づきました。人間は言語を認識するときに音が変化する部分を注力して聞いているようで、だからこそ自然な歌声に近づけたのだなと。
(ヤマハ提供)
 そして、変化する部分が大切なのは音楽も同じ。浪々とした伸ばし音が美しいというのもありますが、メロディやコードが変化するから音楽たりえる。音楽にとって変化する部分は大切なのだなと、これも後になって気づいたことでした。
 また歌声ならではの難しさもあり、その1つがテンポに合わせるということです。例えば「チューリップ」の冒頭「咲いた(sa-i-ta)」。この「s」の発音はメロディの「ドレミ」よりも先なんです。このように、さまざまな工夫を重ねています。

―ボーカロイドは現在5まで発売されていますが、どのような進化があったのでしょうか。
 私が開発に関わったのは4までですが、主な改良としては、まず2では息の音がより自然に出るようにしました。3では、高音~低音の音色が滑らかに繋がるように改良しました。4では、唸り声が再現できるようになりました。徐々に改良を重ね、より人間の歌声に近い合成音声を目指しています。

ならではの魅力

―2007年に、クリプトン・フューチャー・メディアからソフトウェア音源「初音ミク」が発売され、ブームが巻き起こりました。広く使われるようになった背景は。
 「初音ミク」の効果はもちろんですが、YouTube、ニコニコ動画などの動画サービスが普及し、インターネット上で音源を公開・共有できるようになったことが大きいです。ここもタイミングが良かったと思います。

―ユーザーが増えたことでの発見はありましたか。
 開発当初はコーラスや仮歌での利用が主でリードボーカルに使われるのはまだ先だと思っていたのですが、2007年以降はリードボーカルに使われるようになり、想像していたよりも早く、驚きました。
利用者の増加に伴って要望も増えましたが、そのまま取り入れるのではなく、その奥の真意を読み取って工夫していきました。開発中に色々悩むよりも、「使われてなんぼ」だなと実感しました。

―「リアルな人間の歌声」を目指していますが、それでも人間とは違ったボーカロイドならではの歌声が愛されている面もありますね。
 人間では難しい連続早口や高音が歌えるという点もありますが、「コンピューターが歌う」ことならではの表現の魅力があるのではと思います。例えば人間が歌うにはちょっと躊躇するような歌詞も歌うことができるといったことで、新たな表現が広がってきた部分もあるでしょう。
 この「自然な歌声」を目指してきたボーカロイドの歴史は、シンセサイザーの歴史と似ているなと感じます。シンセサイザーは「昔からある楽器へのノスタルジー」と、「新たな音」を追求してきた楽器なのだと開発者の方が仰っていました。その技術革新の過程では「その時点でしかない音」があり、例えば70~80年代には当時のシンセサイザーでしか出せない音が音楽シーンを彩っていました。それがノスタルジーを生み、音楽の魅力となっています。
 ボーカロイドも同じで、自然な歌声と新たな表現への挑戦を続ける過程で、「その時点でのボーカロイドでしかできない表現」が生まれ、魅力が出てくるのだと思います。機能の向上一辺倒ではない、情緒的価値が魅力となる技術ですね。

音楽シーンの変化

―発売から17年が経過し、米津玄師さんをはじめ、ボーカロイドで楽曲を作っていた人たちが音楽のメジャーシーンで活躍するようになってきました。
 単純に嬉しいです。そういった方々の活躍に微力ながら貢献できたことは誇らしいなと思います。

―ボーカロイド以前、以後で音楽シーンが大きく変化したなと思われることは。
 インターネットの普及の影響もセットですが、作り手だけですべての音作りができるようになり、直接音楽をリスナーに届けられるようになったことです。さらにボーカロイドの開発によって歌声を楽器のように使えるようになったことで、楽曲の作り手が直接音楽を届けられる機会が増しました。

―ボーカロイドが人間の歌手や歌い方に影響を与えている側面もあるのでしょうか。
 歌手自身が意識していることは少ないでしょうが、ボーカロイドの影響を感じることはあります。例えば今まで抑揚をつけていたような表現で、あえて抑揚をつけない歌い方などはボカロっぽさがありますね。

―現在はボーカロイドの開発を離れ、研究開発部門と音響事業の橋渡しのような仕事をされています。
 音楽はあまり変化してないように見えますが、長いスパンで見ると変化を続けています。伝統的な楽器であっても技術革新が進んでおり、後で振り返ると大きく変化していたことが分かります。例えばベートーヴェンの時代にはピアノの音域が広がり、それによって作られる楽曲も変化しました。1840年代にはサクソフォーンが開発され、その後音楽の幅が広がりました。ボーカロイドがもたらした変化も、現在はあまり分かりませんが、数年後に振り返ってみると見えてくるものがあるかもしれません。

【略歴】けんもち・ひでき 1967年静岡市清水区(旧清水市)生まれ。1993年京都大学大学院工学研究科修士課程修了。同年ヤマハ(株)入社。1996年エル・アンド・エイチ・ジャパン(株)に出向、音声合成・音声認識に関する研究開発を行う。1999年ヤマハ(株)復職。現在、ヤマハ株式会社 音響事業本部 基盤技術開発部主幹。
昆梓紗
昆梓紗 Kon Azusa デジタルメディア局DX編集部 記者
私が初めてボカロ曲を聞いた2010年頃には、まだ「機械の声」の違和感が強かった記憶があります。しかし、剣持さんのお話を聞いた後に2010年頃の楽曲を久しぶりに聴いてみたのですが、当時の「違和感」を「味」だと捉えられている自分に驚きました。ボカロが一般化した現在の、聴き手側の意識の変化を感じました。

編集部のおすすめ