コラム一覧へ戻る

電気喉頭の声を、自分の声に。声質変換アプリ「コエノコ変換」とその技術

名古屋大学「Save the Voice」が目指す、第4の選択肢

電気喉頭を使って自宅で会話するご利用者とご家族

喉頭を摘出すると、これまでの自分の声は失われます。術後は食道発声・電気式人工喉頭・シャント発声といった「代用発声」で会話を取り戻しますが、とくに電気式人工喉頭は機械的に響きがちで、「自分の声とは違う」と感じる方も少なくありません。

その課題に対する第4の選択肢を目指すのが、電気喉頭の声をリアルタイムで自分の声へと近づける声質変換アプリ「コエノコ変換」です。このページでは、その仕組みと、技術の土台となった名古屋大学「Save the Voice」の研究を解説します。

代用発声と「機械的な声」という課題

とくに電気式人工喉頭は機械的に響きやすい

喉頭を摘出すると、術後は食道発声・電気式人工喉頭・シャント発声といった「代用発声」で会話を取り戻していきます。声を失った方は国内で約3万人にのぼるとされています。

なかでも電気式人工喉頭は比較的習得しやすい一方で、機械的に響く音色になりやすく、「自分の声とは違う」と感じる方も少なくありません。この機械的な声を、どう自分らしい声に近づけるか——コエノコ変換が向き合うのは、この課題です。(3つの代用発声の比較は関連記事をご覧ください。)

「第4の選択肢」を目指す ——「声質変換」という発想

機械的な声を、その人らしい声色へ近づける

食道発声・電気式人工喉頭・シャント発声に続く「第4の選択肢」となることを目指して開発が進むのが、AIによる声質変換です。代用発声で出した音声を、本人の声をもとにしたモデルで変換し、より「その人らしい声色」に近づけて再生します。

コエノコが提供する「コエノコ変換」は、マイクに吹き込んだ電気喉頭の音声を、リアルタイムであらかじめ収録しておいた本人の声へと変換する専用アプリです。機械的に響きがちな発声を、ご本人らしい自然な声色へ近づけることを目指しています。

「コエノコ変換」のしくみと、いまの限界

手術前の収録が、変換の素材になる

コエノコ変換のしくみは、手術前の「収録」から始まります。声を失う前に、専門スタッフによるスタジオ収録で、話し方の癖や抑揚まで含めていまの声を高品質に保存し、AIがその人専用の音声モデルを作成します。

術後は、電気喉頭で発した声をマイクに通すと、保存しておいた本人の声をもとにリアルタイムで変換され、より自分らしい声色で会話できることを目指します。

ただし、変換した声を再生している間も、電気喉頭そのものの音は周囲に放射されます。そのため、機械的な響きが完全になくなるわけではありません。変換はあくまで本人の声色へ「近づける」ことを目指す技術であり、手術前とまったく同じ声がそのまま戻るものではありません。それでも、機械音のままで話すのとは異なる体験を届けることを目標にしています。

変換と合成、場面に応じて使い分ける

リアルタイムの会話と、テキストの読み上げ

コエノコには、自分の声を使う方法が二つあります。「コエノコ変換」は、電気喉頭などで発した声をリアルタイムに自分の声へ近づけるアプリで、対面でのとっさの会話に向いています。

もう一つの「コエノコ合成」は、テキストを入力すると保存しておいた自分の声で読み上げるアプリです。電話での手続きや、まだ電気喉頭が使えない術後すぐの時期など、状況に合わせて二つを使い分けられます。

技術の土台は、名古屋大学の研究

2021年に始まった臨床研究と「低遅延リアルタイム音声変換」

コエノコ変換の技術的な土台は、名古屋大学が取り組む「Save the Voice(喉頭摘出者の音声再生プロジェクト)」にあります。2021年9月、名古屋大学は「喉頭摘出者における音声変換技術を用いた自己音声再獲得の臨床研究」を発表し、耳鼻咽喉科の西尾直樹医師を中心とする医工連携の体制で、日本医療研究開発機構(AMED)の支援を受けて研究が進められています。

この研究で開発が進められてきたのが、持ち運べるデバイスでも使える「低遅延リアルタイム音声変換」の技術です。コエノコ変換は、その知見を、いま実際に使える形にしたものです。

プロジェクトがどのように始まり、どんな歩みをたどってきたかは、関連記事「失った声を、もう一度。名古屋大学『Save the Voice』プロジェクトとコエノコ」で詳しく紹介しています。

よくある質問

コエノコ変換とコエノコ合成は何が違いますか?
コエノコ変換は、電気式人工喉頭などで発した声をマイクを通してリアルタイムで自分の声に近づけて再生するアプリです。コエノコ合成は、テキストを入力すると保存しておいた自分の声で読み上げるアプリです。場面に応じて使い分けられます。
声質変換を使えば、手術前と同じ声に戻りますか?
変換は、機械的に響きがちな代用発声を、ご本人らしい自然な声色へ近づけることを目指す技術です。手術前とまったく同じ声がそのまま戻るものではありませんが、より自分らしい声で話せることを目標にしています。
変換を使うには、手術前に何が必要ですか?
本人の声を素材にした変換には、声が残っている手術前に音声を収録しておくことが重要です。専門スタッフによるスタジオ収録で、話し方の癖や抑揚まで含めて高品質に保存します。
電気式人工喉頭以外(食道発声・シャント発声)でも変換は使えますか?
現在のコエノコ変換は、電気式人工喉頭での発声を主な対象としています。食道発声やシャント発声への適用についても、名古屋大学「Save the Voice」の研究で取り組みが進められています。ご利用状況によって最適な方法が異なりますので、まずはお気軽にご相談ください。
費用はかかりますか?
費用を含む詳しい条件は、お問い合わせ時に個別にご案内しています。まずはお気軽にご相談ください。

出典・参考

関連記事

関連事例

手術前の声を残すことについて、相談してみませんか?