PHONAK AUDÉO SPHERE ~Hearing Trackerフォーラムから~

久しぶりの投稿となりました。8/7に米国で発売された Phonak AUDÉO SPHERE について、Hearing Trackerフォーラムで議論されている内容をまとめてお伝えします。日本での発売は来年となると思われますが、発売を前にフォーラムで盛り上がっています。

先ずはHearing Tracker記事をAIさんに簡単にまとめてもらいました。

Phonakは、Infinioという新しいフラグシップの補聴器プラットフォームを発表しました。このプラットフォームには、Audéo Sphere Infinioという世界初の補聴器が含まれています。この補聴器は、専用のリアルタイムAIチップを搭載しており、雑音からの音声分離を実現しています。
Audéo Sphere Infinioは、デュアルチップ技術を採用しています。1つのチップはリアルタイムAI処理に専念し、音声を背景の雑音から瞬時に分離します。これにより、10 dBの信号対雑音比(SNR)の恩恵が得られるとされています。これは、従来の補聴器ではリモートマイクなどのアクセサリーを使用しない限り、実現できなかったレベルです。
Phonakの内部調査によれば、Infinioの初期設定は、2つの主要な競合補聴器よりも93%のユーザーに好評であるとのことです。また、静かな環境での聞き取り努力の削減率は45%、Speech Enhancerをオンにした場合の疲労感は21%減少すると報告されています。
Phonak Infinioは、Bluetooth LEオーディオとAIベースのノイズ除去を組み合わせており、同社とユーザーにとって画期的な補聴器となることを約束しています。

議論の中心は、何といっても新開発のAIチップとそれによる雑音除去についてでした。

  • AIチップ搭載は、Audéo Sphere Infinio RIC にのみ。2,200 万のサウンド サンプルでトレーニングされており、 毎秒 77 億の演算が可能で、これは 450 万のニューラル接続に相当する。しかしながら、このスペックはPCに搭載されているチップと比べても遥かにパワーが少なく、補聴器のAIチップはこれからだろう
  • 従来機Lumity90の状況では、話し相手ではなく、最も騒がしい会話にロックオンすることがよくある。
    その際に、バッテリーをより速く消費する。バッテリー寿命 16 – 18時間、近距離で同時に多数の会話は難しい
  • 難聴に 12dB の信号対雑音比が必要で、最新のデジタルマイクで 7dB を実現でき、AIを追加することで 14dBを実現できる場合、これは大成功と言われる。1997 年にワイデックスが初めてデジタル ノイズ リダクションを導入したとき、SNR の向上に大きな期待が寄せられたが、競合他社も含めデジタル ノイズ リダクションでは SNR は向上せず、改善は指向性マイクによってもたらされた。マーケティングの宣伝は盛んだったが、DNNによる SNRの実際の改善について確固たる証拠はまだない。実現不可能というわけではなく、独立した研究によって証明されなければならない
  • Phonak の文献によると、Sphere を Roger デバイスと併用すると単語認識がさらに向上し、Sphere のみを使用した場合の単語認識の向上が 38% であるのに対し、約 61% に向上する。Sphere 自体には SNR 改善における方向性はなく、DNN 処理によってデジタル的にノイズをフィルタリングするのみ
  • Roger マイクには方向性があるため、方向性のあるサウンドを Sphere DNN 処理に送り込むことで、Roger の方向性フィルタリングによってかなりの量のノイズを除去できる
  • 数年前、クリフ博士は、HA では SNR が約 6 db しか増加しないが、リモート マイクでは最大 26 dB の改善が実現できると述べた。つまり、Roger On や Roger Select は非常に高価なデバイスだが、Phonak によると、Sphere と Roger を組み合わせた場合のパフォーマンスは、10 dB の SNR 改善よりもはるかに優れているとしている
  • Roger ですでに期待しているゲインを超えることを意味しているのか、それとも結局のところ Roger が引き続き最高の SNR を提供し続けていると言っているだけなのかということです。8大メーカーのほとんどの補聴器のプレミアム モデル間で、SNR サポートに明らかな違いが見られない

AIチップ搭載はPhonakとしても新境地を切り開きましたが、PC搭載チップなどと比較しても演算パワーは低く、逆に補聴器のAI活用が黎明期であり、これからの伸びしろを感じさせるものでした。また、AIチップ搭載による雑音除去がどれほどかは推し量りがたく、Phonakとして遠隔マイクRogerによる雑音除去性能を超えたかどうかというところなのかと読めました。

次にバッテリーやサイズの問題です。

  • 通常の Infinio を改良したような外観であり、バッテリーが大きくなり、非 Sphere よりも 25% 重い
  • 専用のAIチップ駆動のため大量の電力となり、使い捨て電池では利用できない
    →最上位の Sphereモデルと通常の Infinioモデルに分割した理由と推測される
  • 競合他社が、1回の充電で 1日以上 (ストリーミング使用時) 持続するのに対し、Phonakは 16時間持続
  • Sphereモデル内蔵の DEEPSONIC チップはデフォルト設定 3時間しか動作せず、バッテリー充電は 50% まで低下するため、9 時間しか持続しない(宣伝されている 18 時間と比較して)
  • DEEPSONIC チップの動作時間は延長可能だが、使い切ると補聴器の動作時間は 6 時間のみ

今回の発表のラインナップで、AIチップを搭載しているのは、Audéo Sphere Infinio RIC のみであり、重さやサイズは他ラインナップと比較して大きくなっています。また、AIチップ駆動時間がデフォルトで3時間までとなっており、AIチップの演算量向上と共に消費電力が大きな問題となってきています。

次にAIチップで話題先行した oticonとの比較についです。

  • PhonakのDEEPSONIC(AIチップ)は、リアルタイムの音声分析と機械学習を組み合わせて、会話の明瞭さを強調し、ノイズ抑制を強化する。特に、複雑な音環境での使用において、自動的に最適な音声処理を行うとしている
  • DEEPSONICは、音声認識やノイズ管理だけでなく、特定の音声や状況に対して自動的に適応することを目的としており、異なる環境に迅速に対応できる点が強調されている
  • OticonのAI技術は、特定の音声だけを強調するのではなく、周囲のすべての音を自然に取り込み、それを脳が処理するのを助ける「BrainHearing」アプローチに基づいている
  • OticonのAIは、360度の音場を常に監視し、ユーザーが必要な音声に集中できるよう、不要なノイズをリアルタイムで抑制する機能を持っている。この技術は、自然な音の流れを保ちながら会話の明瞭さを提供することに重点を置いている
  • PhonakのAI技術は、特定の音(特に人の声)に焦点を当てて強調し、ノイズを除去するのに対し、Oticonは全体的な音環境を重視し、ユーザーの脳が音を自然に処理できるようにする点が際立っている
  • フォーラム内では、PhonakとOticonの技術が補聴器市場におけるAI競争を活発化させているとの指摘がある。どちらのアプローチがより多くのユーザーに支持されるかが今後の焦点となる

DNNの取込みにより、PhonakとOticon両者のポリシーの違いは広がりつつあるようです。このポリシーの違いは、どちらの聞こえが好みなのかをユーザが選択できるという意味で歓迎すべきことかもしれません。

その他のトピックスについてみてみましょう。

  • Bluetooth
    LE Audioの接続性は安定しない。Classic Bluetoothは安定している。(Classic BTをサポートしているのはPhonakの強み) Bluetooth オーディオははるかに高速で、離れていても接続が切れる可能性が低くなった。距離も長くなった
  • Sphere70と90の違い
    AutoSense 6.0の 「Speech Enhancer」の有無
    Speech Enhancerは、https://youtu.be/A0qSaQmiqcg
  • 価格
    オンライン販売業者である Fit Hearing では、Luminty 90 を 2,998.00 ドル、
    Infinio Sphere70 を 3,398.00 ドル、
    Infinio Sphere90 を 3,798.00 ドル
    卸売価格は 1 ペアあたり 5,600 米ドルという話もあり、これはすごい。
    小売価格は長期サービス付きで 8,000 米ドル以上

議論の終わりの方で、Hearing Trackerの編集者の方から、こんなコメントが出ています。

AI 補聴器の開発者と話をしていると、彼らは現在、AI に人の声のスペクトル特性を認識させる作業に忙しいようです。つまり、たとえば、あなたの友人や家族が AI システムによって認識され、彼らの声が優先的に扱われるようになるのです。これはもちろん「将来」の話ですが、補聴器に共通のコミュニケーション パートナーを教えることができる「コンパニオン プログラムがあれば便利だと思います。これは、Apple の写真アプリが AI を使用して、写真によく写っている人を (恐ろしいほど正確に) 分類する方法に似ているかもしれません。

難聴な私たちにはかかせない電子メモパッド。データのPCへの取込みなど様々な機能を搭載したものがありますが、私のお勧めはシンプルで安価なものです。電子メモパッドには二つの思い出があります。一つは、転職した際に当時の上司が部署全員にメモパッドを配布して私を迎えいれてくれたこと。当時は補聴器を装用するもほとんど会話が困難だったため、相手の方から進んでメモパッドを使ってコミュニケーションいただきありがたかったです。もう一つは、人工内耳をしてから初めてお会いした方からメモパッドをいただいたことです。その方は、たぶんいつも初めて会う人にメモパッドをプレゼントすることで、ご自身の難聴の状況(メモパッドが必要な状況であること)を相手に理解してもらい、会ってすぐにスムースにコミュニケーションができる。そんなことを考えてらっしゃる素敵なかたです。この安価なメモパッドを状況に応じてこれからも活用していきたいと思っています。

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

通信関係の開発やってます。重度難聴で両耳人工内耳を装用しています。

コメント

コメントする

目次