「スマートスピーカー」の記事

「音声」巡り覇権争うアマゾンとグーグル、立ち止まるアップル

「音声」巡り覇権争うアマゾンとグーグル、立ち止まるアップル

2019.01.21

CESで存在感を放つアマゾンとグーグル、各社の最新動向は?

レノボはGoogleアシスタント、Alexaに対応した新製品を発表

アップルは各社にプライバシー問題を警告、独自路線を貫くか

米ラスベガスで開催された世界最大級の家電見本市「CES 2019」で、別格の存在感を放っていたのがアマゾンやグーグルだ。2018年はグーグルがCESに初めて本格出展したことで話題となったが、2019年も大がかりなブースを設置して来場者の注目を浴びた。

ラスベガスのCES会場前に設置されたグーグルのブース

アマゾンやグーグルは音声アシスタントで競争しており、家電製品への組み込みを進めている。2019年のCESではどうだったのか、両社の最新動向をレポートする。

グーグル対アマゾンの音声争いが加速

グーグルは今年もCES会場に「Googleアシスタント」を目玉にした大型ブースを設置。巨大な壁面広告やモノレールのラッピング広告で存在を示し、家電メーカーのブースには白い帽子のスタッフを派遣するなど、CESを乗っ取る勢いだった。

「Googleアシスタント」に対応した家電製品が並ぶグーグルブース

一方、Alexaで先行するアマゾンも展示エリアを拡大。業界やメーカーの枠を越えた「Alexa対応製品」を一挙展示することで、エコシステムの強大さを示した。家庭向けのスマートホーム用途だけでなく、オフィスで使う事例も示すなど、応用範囲を広げている。

アマゾンは「Amazon Alexa」対応製品をブースに集めた

具体的な対応製品として、音声で操作できるスマートスピーカーやスマート電球はもちろんだが、これまでにないジャンルの製品も増えている。たとえばレノボは「目覚まし時計」と「タブレット」の2機種を発表した。

レノボの目覚まし時計「Smart Clock」(左)とタブレット「Smart Tab」(右)

Googleアシスタントに対応した「Smart Clock」は、目覚まし時計の置き換えを狙った製品だ。音声だけでなく画面のタッチ操作にも対応しており、カレンダーの予定や寝覚めのいい音楽、室内の照明と連動した目覚まし機能を提供する。

一方、Amazon Alexaに対応した「Smart Tab」は、一般的なAndroidタブレットとして使えるほか、ドックに置くと音声とタッチで操作するスマートディスプレイに早変わりする。自宅でも外出先でも1台2役で使えるお得さが特徴だ。

アップルが投げかける「プライバシー」問題

CESに両社が注力する背景には、音声アシスタント市場におけるシェア争いがある。「Amazon Echo」や「Google Home」といったスマートスピーカーの売上ではグーグルがアマゾンを猛追しており、2018年第1四半期には逆転劇を果たした(英Canalys調べ)。しかし第3四半期にはアマゾンが再び首位に立つなど、接戦が続いている。

その勢力はスマートスピーカーを越えて、家電全体に広がりつつある。家電の操作といえばスイッチやリモコン、タッチ操作が一般的だが、音声に対応する製品は増えている。これまで独自の音声アシスタント「Bixby」を展開してきたサムスンも2019年にはグーグルとアマゾンとの連携を発表した。

サムスンはスマートTVでグーグル、アマゾンと連携

このまま音声が普及していけば、世界中の人々がインターネットのサービスやコンテンツにアクセスする手段になる可能性がある。音声アシスタントのシェア争いは、スマホOSのシェア争いと同じくらい重要というわけだ。

ただ、音声操作はプライバシーに関する懸念もある。音声操作を受け付けるには、マイクが常時オンになっている必要があるからだ。マイクをオフにする機能はあるとはいえ、家庭内のプライベートな会話を常にマイクに拾われるのは心地よいものではない。

この問題に一石を投じたのがアップルだ。CES会場からよく見えるホテルの壁に意見広告を掲載。ラスベガスの有名なコピーをもじって「iPhoneで起きることはiPhoneの中にとどまる」と訴え、サードパーティと広く連携するアマゾンやグーグルを牽制した。

アップルはCESでプライバシー重視をアピール。元々の言葉は、「What happens in Vegas stays in Vegas.(ラスベガスで起きたことはラスベガスに残る)」というもの

アップルも独自の「Siri」をiPhoneに搭載し、スマートスピーカー「HomePod」も販売している。だがサードパーティとは積極的に連携していないため、音声のシェア争いでは不利な立場に追い込まれている。アップルがこのまま「プライバシー重視」路線を貫くかどうかも、音声アシスタント市場の行方を左右しそうだ。

「Hey Siri」と言えない日本人は、世界市場から取り残されるのか

「Hey Siri」と言えない日本人は、世界市場から取り残されるのか

2018.12.26

日本人の音声認識機能の利用率は低い

スマートスピーカーの市場は2025年、12.5倍に

「デジタルアシスタント」攻略は生き残りのカギ

SiriにGoogleアシスタント。最近、スマホの音声アシスタントを利用したという方はどれほどいるだろうか。

筆者はiPhoneとGoogle Pixelを併用しているが、「Hey Siri」も「OK Google」も言わないし、Pixelに採用されている「Active Edge」(本体をギュっと握ることでGoogleアシスタントを起動する機能)を使ったのも、Pixelを手にしてからのほんの数日だけだった。

デジタルパフォーマンス・マーケティングエージェンシー iProspectの調べでは、APAC地域における18~50歳の1800人以上のスマホ利用者のうち、過去6カ月以内に音声認識機能(音声検索、音声対応アプリなどを含む)を使った人の割合は62%。この割合は日本では約40%といい、APAC平均にかなり見劣りし、中国(77%)やインド(82%)と比べると半分に過ぎない。

なぜ日本では普及しないのか。調査を発表したiProspect社に実態を取材し、その理由を探ると、スマホ、スマートスピーカーに限らない「音声アシスタント」の現状と未来が見えてきた。もしかすると、音声アシスタントを活用しない国は、世界市場から取り残されてしまうかもしれない。

米iProspectがAPACにおける音声認識機能の使用率を調査。同社のAPAC Head of Innovation & North Asia Commerceのネイト・シュリラ氏(左)、COOの渡辺大吾氏に話を伺った

地域によって「音声認識」への印象は違う

――なぜ日本では音声アシスタントの使用率は低いのでしょうか

渡辺大吾氏(以下、渡辺):文化的な影響はあるでしょう。日本人は、集団の秩序を守る傾向にあります。注目されたくない、恥をかきたくないと思う人が多い。人前で「Hey Siri」と言って、認識されなかったら恥ずかしいですよね。

ネイト・シュリラ氏(以下、シュリラ):反対に、中国やインドなどの地域では音声アシスタントを使用しているのが「格好いい」というイメージを持っている人が多い。そもそも音声認識機能を使えるようなデバイスを持っていることが1つのステータスであり、彼女の前で「OK Google、美味しいレストランを教えて」と言うのが、スマートだという価値観があるのです。

――使っている姿を見られたくない?

渡辺:かつての失敗体験も影響しているでしょうね。2011年にSiriが登場した時、人々は「人間の声を認識して機械が応えてくれるなんて、素晴らしい」と思ったことでしょう。しかし、いざ使ってみると誤認識することが多かった。

その頃のSiriの認識率は77%ほどでした。つまり4分の1ほどの言葉を間違って認識するのです。今では性能はかなり上がり、2017年には(英語で)95%ほどの認識率を達成しました。人間の認識能力と同程度です。しかし、当時の経験がもとになって未だに「大丈夫かな?」と不安になる人も多い。

――地域によって音声アシスタントへの印象が異なるのはなぜなのでしょう

渡辺:頻繁に利用されている地域で共通しているのは、“テクノロジーの変化に慣れている”点。中国やインドは、ここ数年で急激にテクノロジーが成長しており、新たなテクノロジーに触れる機会が多い。しかし、日本はそうではありません。テクノロジーの進化は緩やかに市場に受け入れられてきました。日本は常に最新のテクノロジーに囲まれており、豊かな生活をおくっていました。だからこそ、急激な変化に保守的になってしまうのです。

「音声アシスタント」がもたらす市場への影響

――スマホに限らず、最近は「Google Home」「Amazon Alexa」など、音声認識技術を活用した「スマートスピーカー」が普及しています

渡辺:家では人の目を気にする必要がないこともあり、音楽を聴く、天気情報を確認する、照明やエアコンのオンオフを切り替える、といった用途でスマートスピーカーを使う人が増えてきています。

シュリラ:最近は、メルセデスが音声アシスタントを取り入れたことも話題になりました。人前での音声認識機能の使用に抵抗のある日本人も、車や家などの「クローズな空間」で使用できるスマートスピーカーは、徐々に普及していくことでしょう。そうやって音声認識を使う人が増えてくると、デバイスに声をかけることへのハードルが下がります。

「Pokemon Go」のリリース当時、スマホを見ながら歩き、急に立ち止まるような人を見ると、違和感がありました。しかし、今はそんな人を見ても特に驚きはしません。これは私たちの慣れが原因でしょう。音声認識においても、いつかブレイクスルーのタイミングが来ることでしょう。

――現在のスマートスピーカーの市場規模はどれほど?

シュリラ:ニールセンの調査では、2018年の第2四半期、米国におけるスマートスピーカーの普及率は25%という結果も出ています。それに比べると日本はまだまだ普及が少ないですが、市場規模はこれから多くなっていくでしょうね。2018年、日本のスマートスピーカーの売り上げは46億円だと言われています。2025年にはその12.5倍にもなると言われています。

情報革命の主戦場は「デジタルアシスタント」へ

――今後のグローバル市場における音声アシスタントの役割はどのように変化していくのでしょう?

渡辺:注目すべきは、音声に限らない「IoT化の流れ」と言えるでしょう。音声は、消費者との接触ポイントとして注目すべきことの1つにすぎません。

シュリラ:そういう意味で言うと、音声アシスタントというよりも「デジタルアシスタント」について考えた方が良いでしょう。今は音声アシスタントが徐々に日常に入り込んでいますが、今後はビジュアル面で、ARやVR、ホログラムなどと連携していくことでしょう。

情報革命の主戦場はPCに始まり、モバイルへと続いてきました。その次に来るのが、デジタルアシスタントだと言われています。2017年に公開された映画『ブレードランナー 2049』では、物語の中で主人公は家庭用AIとともに暮らしていました。これは未来に起こり得ることでしょう。デジタルアシスタントはデバイスの壁を越えて、人とより密に接する存在になっていきます。

――パナソニックはIoT家電に舵を切りAmazonもAlexa対応家電を増やことに力を入れているように、スマートホームの普及に合わせて、デジタルアシスタントの存在感は増していくことになりそうです

渡辺:利用者との接触ポイントが増えると、そこで新たなマーケティングのチャンスが生まれます。今のデジタルアシスタントは受動的にしか動きませんが、今後は能動的になってくるでしょう。例えば、冷蔵庫内にカメラやセンサを入れることによって、飲食料品の減少を検知し、「〇〇が少なくなってるので注文しますか?」と購買を促したり。

シュリラ:スマートスピーカーの2台巨頭であるGoogle・Amazonは、デジタルアシスタントを、ありとあらゆる場所で使えるようにしようと考えています。例えば、個人の保有するデバイスに限らず、街の中に「スマートバス停」を作ったり、「スマート案内所」を作ったりすることによって、街全体をスマート化しようという動きを始めています。

自分好みにアシスタントをカスタマイズすることもできるようになるでしょう。Googleは今年、歌手のジョン・レジェンドの声をGoogleアシスタントに搭載すると発表しています。これは、想定されるすべての質問に対する返答を録音したわけではなく、いくつかのセリフを録音し、機械学習技術に基づいて、彼のクセや言葉遣いなどを分析して作られたものです。

【Googleの発表後、ジョン・レジェンドの妻クリッシー・テイゲンは、「もう人間のジョン・レジェンドは必要ないね」とツイート】

デジタルアシスタントは、より人々に受け入れられやすい形に姿を変え、ライフスタイルに寄り添う存在となっていくことでしょう。

企業に求められる「ボイスストラテジー」

――私たちの生活はどう変化していき、企業にはどういった取り組みが求められるのでしょう?

シュリラ:マーケティングの観点から言えば、デジタルアシスタントが利用者の好みを深く理解することによって、“利用者にメリットがない広告を排除する”ようになることが考えられます。例えば、「ナイキが大好きな人」にアディダスが広告を打つ際に、アシスタントが「この人はアディダスの靴は履かないから」とブロックするようになるかもしれません。

私たちはGoogleアシスタントやAlexaを用いたマーケティング手法の研究をしていますが、それぞれのアルゴリズムは異なるため、当然アプローチの仕方は変わってきます。これは難しい作業です。しかし、そこで身を引いてしまったら、これからのデジタルアシスタントが普及する時代に取り残されていくことでしょう。将来のビジネスチャンスを見越して、今のうちにテクノロジーにキャッチアップしていくことが求められるのです。

***

現状の利用率は低いが、『ドラえもん』や『鉄腕アトム』を見て育った日本人に、デジタルアシスタントを受け入れる素地がないとは思えない。Googleがアシスタントにジョン・レジェンドの声をあてたように、日本向けにはドラえもんの声でも使ってくれれば、この現状は変わるのかもしれない。呼びかけるときはもちろん、「Hey」や「OK」といった横文字ではなく、「聞いてよドラえも~ん」なんかだと、楽しそうだ。

「Home Hub」を使って実感、AI時代のGoogleのキラーサービス

山下洋一のfilm@11 第2回

「Home Hub」を使って実感、AI時代のGoogleのキラーサービス

2018.12.05

Googleの2018年のスマートスピーカー新製品「Google Home Hub」

スマート家電コントロールとフォトフレームに絞り込んだ設計

「Googleフォト」+「Googleアシスタント」の抗しがたい便利さ

Googleが米国で発売したHomeシリーズの最新製品「Google Home Hub」。ディスプレイ付きでありながら、149ドルに価格を抑えたスマートスピーカーだ。製品の発表会で同社がアピールしていたスマート家電のコントロール機能に惹かれて、ダイニングキッチンで家族が家電を操作するデバイスとして購入したのだが、使ってみて「価値あり」と思ったのはデジタルフォトフレーム機能の方だった。

日本でもAI処理を活用した「Pixel 3」シリーズの撮影機能が話題だが、Google Home Hubもまた、AIとGoogleのサービス (Googleフォト)との組み合わせで相乗効果を発揮するハードウェアになっている。この数週間Google Home HubとPixel 3を使ってみて、15年前のWeb成長期における「Gmail」と同じように、AI時代においてGoogleが「Googleフォト」をキラーサービスにしようとしているのを実感している。

Google Home Hubは何ができるの?

Google Home Hubは、いわゆるスマートスピーカーだが、スマートディスプレイと呼ばれることもある。7インチのタッチ対応の液晶ディスプレイを搭載し、スクリーンによって音声だけでなく目でも情報を捉えられるGoogleアシスタント・デバイスだ。OSはAndroidではなく、Linuxベースでもない。セキュリティが問われるIoTを視野にGoogleが新開発している「Fuchsia」の技術が用いられているという報道もあり、実際Fuchsiaを思わせるユーザーインターフェイス (UI)が採用されていて動作は軽快だ。

7インチというとスマートフォンに近いサイズだが、テーブルの上で小さすぎるということはない。Google Home Hubの操作は現時点で日本語非対応だが、日本語コンテンツの表示は可能だ

特徴の一つが機能を絞り込んでいること。カメラ非搭載で、ディスプレイがあるのにビデオ通話ができない。オーディオ機能もシングルの小さなスピーカーのみだ。何でもできるハイエンドデバイスではなく、スマート家電コントロールとフォトフレームに追加機能を集中させたスマートスピーカーであり、代わりに価格が149ドルと求めやすい。米国のスマートスピーカー市場は「一家に一台」から「一部屋に一台」時代に突入しており、Google Home Hubはダイニングキッチンやベッドルームをターゲットにした価格・設計と言える。

ディスプレイを上からスワイプダウンするとスマート家電のコントローラ画面が現れ、Homeアプリで管理しているスマート家電を、ビジュアルを駆使した分かりやすいUIで操作できる。便利ではあるのだが、ウチの場合は大して広くない家にすでにスマートスピーカーが何台かあるので、どこに居ても音声で操作できる。Amazon Echo Plusのようにスマートホームハブを内蔵していたらうれしかったが、残念ながらGoogle Home Hubという名前なのにハブ機能は備えていない。

Homeアプリで管理するスマート家電を一箇所で操作、スワイプダウンで素早くアクセス可能

AIの価値を実感、フォトフレーム機能の出来栄え

一方フォトフレーム機能は、PixelシリーズのスマートフォンとGoogleフォトの組み合わせで使うと「目から鱗が落ちる」快適さだ。モバイル優先からAI優先にシフトしたGoogleがアピールする「AI+ソフトウェア+ハードウェア」の価値を実感できる。

Googleは今年、度々「AI+ソフトウェア+ハードウェアのシナジーで最高の体験を作り出す」とアピールしていた

Google Home Hubは、標準設定では常時画面オン状態で写真のスライドショーまたは時計を表示し続ける。前面上部に環境光センサーを用いたAmbient EQという機能を備え、周囲に応じて画面の明るさや色合いを変化させる。暗い部屋ではぼんやりと光る程度だからベッド横に置いても睡眠の妨げにならないし、どのような状況でもフォトフレームの写真がキレイに表示される。

フォトフレーム機能はGoogleフォトを写真のソースとしており、すでにGoogleフォトを使っているのであれば、特に追加で何かやる必要はない。スマートフォンで撮影した写真が自動的にクラウドに送られ、家族や友達との写真がGoogle Home Hubに表示される。

今さらではあるが、デジタルフォトフレームがあると、撮った写真をカメラやスマートフォン、クラウドの中に埋もれさせずに楽しむ機会がグッと増える。Googleフォトの場合、ユーザーが写真を分類しなくても投げ込んでおくだけで自動的に写真を分析して、写っている人やもの、場所などをタグ付けしてくれるので、Googleアシスタントを使って「先月に撮影した写真を見せて」とか、「ポートランドで撮った写真を見せて」というように音声で簡単に取り出せる。音声検索でもきびきびと反応してくれるので、過去の写真を見るのも楽しい。

撮った写真を見る機会が増えると、さらに写真を撮ろうという意欲が湧いてくる。Google Home Hubはディスプレイが常時オンなので、キッチンでのレシピの表示などにも便利だ

スマートスピーカーはAIを身近にしたか?

今年の米国のブラックフライデーセールではスマートスピーカーの値引きが目立ったが、昨年に比べると消費者側の購買熱は明らかに冷めている。買ってはみたけど、照明のオン/オフ、天気やニュース、道路情報の確認にしか使っていないという人も多い。市場は、スマートスピーカーに対して盛り上がった期待感がひとまず落ち着き、一周回って新たな需要を喚起できるかどうかという分岐点にある。

スマートスピーカーのコア機能であるデジタルアシスタントは、ネット大手のAI戦略に密接に結びつく。一般の人達にAIをどのように活用してもらうか? Googleは、その効果を最も分かりやすく人々に実感してもらえる方法として写真を選んだのだろう。

Pixel 3の撮影機能はデュアルカメラのような表現力をシングルカメラで実現し、暗いシーンでも明るい写真に仕上げる夜間モード「Night Sight」はAI時代のコンピュテーショナルフォトグラフィの大きな可能性を示している。Pixelシリーズで撮影した写真や動画はオリジナルのまま、容量制限なしでGoogleフォトにアップロードできる。Google Home Hubを持っていたら、クラウドにある大量の写真をインテリジェントに楽しめる。一つ一つは小さな快適だが、それらが組み合わさった「AI+ソフトウェア+ハードウェア」の効果は大きい。

Night Sightモードを使いPixel 3で撮影した写真

Googleフォトに関しては、家族や友達との関係、日常行動などを読み取れる写真をGoogleに渡すことにプライバシー問題を不安視する声が根強い。しかし、新しい撮影機能はこれまで撮れなかったような写真を実現し、Pixelユーザーは制限なしにオンラインストレージを使え、Google Home HubのAIによる補助で撮った写真を存分に楽しめる便利さは大きな魅力だ。

GoogleフォトはAI時代にGmailの夢を見る

この便利さと懸念のせめぎ合いの状況は、2004年にGmailが登場した時に似ている。Gmailは、Web 2.0の頃のWeb企業の競争においてGoogleが抜け出せたキラーサービスになった。Webメールの容量が数十MBだった時代に、1GBの大容量スペースを無料提供。ビジネスモデルの維持が不安視されたが、Gmailによってクラウドサービスに対する人々の理解が深まり、Googleアカウントを持つ人が飛躍的に増加した。広告のためにメールをGoogleにスキャンさせることにプライバシー問題の懸念が広がったものの、Gmailの成長をとどめるものにはならなかった。

これまでGoogleフォトを使っていなくても「Night Sight」に興味を持ってPixelシリーズのスマートフォンを購入して使い始める人がいれば、Google Home Hubにもっとたくさんの写真を表示させたくてGoogleフォトに写真を入れ始める人もいるだろう。そしてGoogleアシスタントのできる仕事ぶりを実感したら、Googleフォトから離れ難くなる。Googleフォトで管理する写真を増やし、PixelユーザーがGoogle Home Hubを購入したり、その逆も起こり得る。そして、さらにGoogleアシスタントが便利になるという蟻地獄のようなプラス循環にはまってしまう。

背面上部のボタンは、マイクをオフにするプライバシー保護機能

山下洋一のfilm@11」は、シリコンバレーを中心にテクノロジー企業の勃興を追い続けてきた筆者が、独自の視点で米国の”今のリアル”を切り取る連載コラムです。