Apple、HomePodが機械学習でユーザーの声を認識する技術の論文を公開

2018年12月4日2024年10月31日

Apple HomePod

Appleは、スマートスピーカーHomePodに搭載されたSiriが、機械学習を用いてユーザーの声を正確に聞き分ける仕組みを論文として公開しました。

Siriがユーザーの声を認識するために機械学習を活用

Appleが運営するブログサイト「Apple Machine Learning Journal」に公開された論文「Optimizing Siri on HomePod in Far‑Field Settings（遠隔環境下におけるHomePod上のSiriの最適化）」は、HomePodが「ヘイ、Siri」と呼びかけられた時に、ユーザーの声を正確に認識するための機械学習技術についてのものです。

iPhoneと違ってHomePodの場合、HomePodが鳴らしている音楽や、周囲で動作する食器洗い機などの騒音の影響を受けるほか、ユーザーが話しかけてくる方向や距離もその都度異なります。

Apple Machine Learning Journal "Optimizing Siri on HomePod in Far‑Field Settings" Fig.1

論文には、HomePodに搭載された6つのマイクを使い分けるとともに、機械学習を用いて雑音や反響をマスキングすることで、ユーザーの声の認識精度を高めるための方法が詳細に記されています。

Apple Machine Learning Journal "Optimizing Siri on HomePod in Far‑Field Settings" Fig.6

Siriが聴き取ったユーザーの声のサンプル音声も公開

論文では、HomePod内部での音声処理前後の音声を比較して、Siriがユーザーの声をどう聞き取っているかを示す、4種類のサンプル音声を聴くことができます。

例えば以下の画像で上に示されているのは、近くで食器洗い機が動作している状態で話しかけられた時の音声パターンです。ユーザーの声はほぼ騒音にかき消されてしまっています。

Apple Machine Learning Journal "Optimizing Siri on HomePod in Far‑Field Settings" Fig.6

機械学習によってノイズ低減処理を行った下の図では、ユーザーの声を示す赤い波形がはっきりと見えており、音声もはっきり聞き取れます。

ご興味のある方は、Appleが公開した論文の最後に近い部分で、音声サンプルを聴いてみてください。

2016年末に研究成果の公開を許可したApple

Appleは、研究開発の内容が外部に知られないよう、過剰と批判されるほどの秘密主義を貫いてきました。

しかし、2016年12月に人工知能分野の研究者に研究成果の公開を許可し、同年末には論文が公開されています。

Appleの方針転換は、驚きをもって受け止められましたが、人工知能分野での人材獲得競争が激化する中、研究成果の公開を許可することで、優秀な研究者を惹きつける必要があると判断したためと考えられています。

Source:Apple Machine Learning Journal, ArsTechnica
(hato)

この記事がお役に立ったらシェアお願いします