ディズニーも使い始めたGoogleのAIテクノロジー、何が凄い?

ディズニーも使い始めたGoogleのAIテクノロジー、何が凄い?

2018.01.30

AIやMachine Learning(機械学習)はうちの会社に関係ない……なんて時代はもう過去のものになるかもしれない。米Googleが1月17日に公開した「Cloud AutoML Vision」は、データさえあれば素人でも機械学習の力を多分に活用できるサービスだ。

機械学習をさまざまなサービスに適用

これまでもGoogleは、一般ユーザー向けに「Googleフォト」や「Google翻訳」「Google Home」で機械学習、AIのパワーを提供してきた。例えば、Googleフォトに写真をアップロードすれば、クラウドが写真上の風景や人を自動で認識してさまざまなキーワード分類を行う。

「山」や「海」といった風景はもちろん、「犬」や「猫」といった動物も認識し、キーワードで検索しただけで関連度の高い写真をピックアップできる。特に性能の高さを示しているのが人間の顔の抽出機能だ。同一人物の写真が複数枚ある場合、服装やメガネの有無があっても個々人の顔を認識してグループ化してくれる。

Googleフォトは、単に同じ顔をグループ化するのではなく、例えば成長による顔の変化なども捉える。写真は筆者の犬のグループ化例

筆者もGoogleフォトを利用しているが、100人を遥かに超える顔がグループ化して表示されている。その精度は驚くべきもので、有人・知人はもちろん、社内の人間、そしてたまたま写り込んだ人までもがグループ化されている。100%同じ人を抽出できるとまではいかず、顔の雰囲気が近い人を誤ってグループ化しているケースも少なくないが、実用レベルという意味では十分な精度という印象だ。

こうした技術を企業が自社製品・サービスへ応用するにはこれまで、TensorFlowなどの機械学習のライブラリを活用してカスタマイズしたアルゴリズムを用いるか、Googleフォトと同等レベルの学習済みモデルを利用できるGoogle CloudのAPI「Cloud Vision API」を利用するほかなかった。なお、競合では米MicrosoftがAzureで「Computer Vision API」、米AWSが「Amazon Rekognition」が同様の機能を提供している。

AIファーストのGoogle

では、なぜTensorFlowやCloud Vision APIではダメなのか。

TensorFlowはGoogleがオープン化したライブラリで、前述のGoogleフォトやGoogle翻訳、Google Homeにおける音声認識などさまざまな製品の根幹をなすものとして作られた。つまり、これを用いれば誰もがGoogleレベルのテクノロジーを使える……というわけではない。

これはあくまでライブラリであって、あくまで計算を走らせるためのベースであり、ニューラルネットワークや最適化するための数学知識を持たざるものにとってはまったく"使えない"もの。言うなれば「レクサスの主要パーツはここにすべて揃ってるから、あなたは高級車に乗れる」と言ってるようなものであり、そこにあるのは無用の長物と化したパーツ群だけだ。

一方のCloud Vision APIは、自社製品・サービスに機械学習の力を確かに活用できる。ただしそれは写真を「山です」「海です」という判定を出すものに過ぎず、例えば「車の車種を特定したい」「コートのブランドを特定したい」といった専門性の高いニーズに応えられない。

そうした需要を満たすにはTensorFlowが必要だが、やはり、ディープラーニングの専門家という"エンジニア"が必要になる。そこでこうした課題を解決すべく登場したのがCloud AutoML Visionだ。このサービスでは、ユーザーが求めるサービスレベルに合わせた学習が可能になるうえ、高度なエンジニアも必要としない。

Google Cloud マシンラーニング スペシャリスト 大薮 勇輝氏は「GoogleとしてAIファーストを掲げる中で、さまざまな製品でAIを利用する一方、一般企業では使えていない状況にあった。AIファーストと共に掲げるのが『AIの民主化』。さまざまな企業や開発者がAIをスピーディー、かつ便利に使えるようにしたい」と話す。

Google Cloud マシンラーニング スペシャリスト 大薮 勇輝氏

TensorFlowでは、データの前処理(画像と正確なタグ付けラベル)から機械学習モデルのデザインと最適化、性能評価、デプロイ、アップデートというさまざまな工程が必要で、高精度なモデル構築を必要とする場合は「長いもので1年かかる」(大薮氏)ケースもあった。一方のAutoML Visionではデータの前処理とトレーニング、性能評価の工程に限られるため、データ量によっては1日で高精度なモデル構築が可能になる。

Learning2learnや転移学習、ハイパーパラメータチューニングといった自動学習機能を応用したもので、クラウドが自ら改善を繰り返した最適解を見出す。Googleのディープラーニングと言えば、世界最強の囲碁棋士を破った「AlphaGo」でも有名だが、最新世代のAlphaGo Zeroでは自己対戦を490万回も繰り返し、既存のAlphaGoに圧勝した。必ずしも同じテクノロジーを採用したわけではないが、このような改善のアプローチを応用した信頼性の高さは商用利用レベルといっても良いだろう。

Cloud AutoMLは画像認識機能のVision以外にも提供を予定しており、今回はあくまで第1弾。そのためVisionも、現時点でα版の限定公開と、チューニング途上にある。ただ、アメリカではディズニーがWebサイトにおけるレコメンデーションにCloud AutoML Visionを採用。ディズニーのキャラクターや製品カテゴリ、色といった属性を製品ごとに関連付け、整理するのに利用しているという。

米国の事例。URBAN OUTFITTERSはディズニーと同様の活用例、ZSLは動物保護の慈善団体で、自動で撮影された野生生物のグループ化に利用する

一方で高性能なものの、機械学習のテクノロジー自体はまだまだ発展途上だ。前述のGoogleフォトでは、2015年のサービスがスタートした際に、黒人ユーザーがアップロードした写真をグループ化したところ「ゴリラ」とタグ付けされた問題が生じた。その後、Googleは謝罪して問題を解消するとBBCにコメントしていた。

ただしこの問題の解決方法は「犬」や「猫」といったグループ化のような「ゴリラ」というキーワードを省くもの。ゴリラ以外にも人間以外の霊長類をすべて省いたことで誤認識問題を解消したのだが、2年強が経った2018年1月時点でも、これらのキーワードを排除していることが話題となった

もちろん、これは一例であって、企業が活用する上で「小さいデータセット、リソースでビジネスに活用できるのがAutoML」と大薮氏は話す。

これまでは場合によって数千~1万個のデータセットを用意し、さらに数百万円以上の多額のコストをかけて外注してシステムを構築していた。これに対してAutoML Visionでは、小規模なデータセット+ストレージ&サービス利用料というスモールスタートで済む。自社サービスに応用できるレベルにあるのか、気軽に「お試し」できるのがこのサービスの最大の魅力だ。

大薮氏は「ITエンジニアの総数は全世界で2100万人いるものの、データサイエンティストは100万人、ディープラーニングにいたってはさらに少ない」と話すが、その数少ない専門家の"コピー"のような存在をいかに早く使い倒すかが、遠くない将来に企業競争力の差として現れそうだ。

総務省施策が追い風に? 携帯分離の「歴史的チャンス」狙うファーウェイ

総務省施策が追い風に? 携帯分離の「歴史的チャンス」狙うファーウェイ

2019.03.20

モバイル業界を変える「携帯値下げ議論」が過熱

ファーウェイは日本を取り巻く環境を「歴史的チャンス」と発言

コスパ高いミッドレンジ端末でシェア拡大を目指す

20日、NTTドコモが特定の端末の購入を条件に通信料金を割り引く「docomo with」、購入する端末に応じて通信料金を割り引く「月々サポート」を終了する方針を固めたという報道が話題となっている。

国内のモバイル業界では携帯電話料金見直しが進んでおり、3月5日には総務省が中心に進めてきた端末代金と通信料金の分離が閣議決定された。NTTドコモは分離プランを軸とした新料金プランを4月に発表する見込みだ。

日本のモバイル市場を大きく変えるこの動きを「歴史的チャンス」と見ているのがファーウェイだ。2018年末から米中対立が加速する中、ファーウェイが打ち出すメッセージも語気を強めている。果たして日本市場でシェアを拡大できるのだろうか。

逆風吹けども、依然として業績は好調

今年に入り、ファーウェイの周辺が騒がしい。3月7日には、ファーウェイは米国政府を相手取って訴訟を起こした

さらにその内容をFacebookでライブ配信するなど、米国以外の世界市場に向けたメッセージにもしており、そのメッセージをまとめたウェブサイト「Huawei Facts」は、わざわざ日本語版も用意している。

2018年末から続く米中対立を巡る報道は、ファーウェイの業績にどのような影響を与えたのか。MWC19でインタビューに応じたファーウェイ・ジャパンの呉波氏は、「一部の消費者は影響を受けたが、2019年に入ってから売上は大幅に伸びている」と語った。

ファーウェイ デバイス 日本・韓国リージョン プレジデントの呉波(ゴ・ハ)氏

話題の「折りたたみスマホ」でもファーウェイは先行する。

ファーウェイに先立って折り畳みスマホを発表したサムスンだが、こちらはMWCではガラスケース内での「展示」のみにとどまったのに対し、ファーウェイは「Mate X」の実機を用いて報道関係者に折り曲げを試させるなど、製品化で一歩先を行っていることをアピールした。

ファーウェイの折りたたみスマホ「Mate X」。報道陣には手に取って折り曲げてみる機会も用意された

Mate Xは次世代移動通信の「5G」にも対応しており、日本では5Gサービスの開始を待って投入時期を見極める方針だという。

ちなみに3月26日に発表予定のフラグシップ機「HUAWEI P30」シリーズは、例年通りのタイミングで日本市場に投入するようだ。SIMフリーでの発売だけでなく、ドコモが採用した「HUAWEI P20 Pro」のように大手キャリアによる採用があるかどうかも注目したい。

分離プランを「歴史的チャンス」と捉えるワケ

一方、2019年の国内モバイル市場で話題となっているのが携帯料金における「分離プラン」の導入だ。KDDIとソフトバンクはすでに導入済みだが、NTTドコモは4月に発表する新料金プランから本格導入するとみられている。

分離プランの特徴は、NTTドコモの「月々サポート」のように回線契約と紐付けた端末の割引が禁止される点だ。端末の割引自体が禁止されるわけではないというものの、大幅な割引は難しくなる。その結果、10万円を超えるようなハイエンド機ではなく、3〜4万円で一括購入しやすいミッドレンジ機の需要が高まるとの見方が有力だ。

この動きをファーウェイはどう見ているのか。

呉氏は「非常に重要視している。スマホが登場したときや、SIMフリー市場が始まったときのインパクトに引けを取らない、歴史的な瞬間になる」と興奮気味に語る。

日本のSIMフリー市場でベストセラーとなった「HUAWEI P20 lite」を始め、ファーウェイのミッドレンジ機のラインアップは厚い。モデルによってはフラグシップと同じCPUでミッドハイの価格を実現するなど、コスパの高さも特徴だ。大手キャリア向けにさまざまな提案ができる体制といえる。

フラグシップと同じ「Kirin 980」搭載でミッドハイ価格の「HONOR View 20」

また、5G対応も順調だ。

モバイルWi-Fiルーターに強みを持つファーウェイは、MWC19でも5G対応ルーターを多く出展していた。日本ではまだ周波数の割り当てが終わっていないものの、国内大手キャリアは2019年内にもプレサービスを始める動きがある。5Gスマホが普及するまでの間、5Gルーターの需要は高まる可能性がある。

5G対応のモバイルWi-Fiルーターも出展していた

ミッドレンジ市場の拡大を狙って、今年はシャープやサムスン以外にも、ソニーモバイルの参入も予想されている。

この価格帯が激戦区になることは間違いないが、ファーウェイはその中で高コスパの製品ラインアップや、国内での地道な販促活動やブランドメッセージの打ち出しによって対抗していく構えだ。

ヨドバシカメラ梅田店での販促イベントの様子
関連記事
Googleがゲーム本格参入の衝撃、2019年中にゲーム基盤「STADIA」を投入

Googleがゲーム本格参入の衝撃、2019年中にゲーム基盤「STADIA」を投入

2019.03.20

Googleが新しいゲームプラットフォームを発表

配信方式でゲーム機不要、「ゲーム機」の時代の終焉?

2019年内にローンチ、性能はプレステやXbox以上か

3月19日、米国で開催中のゲーム開発者会議「GDC 2019」の会場で、Googleがクラウドベースのゲーミングプラットフォーム「STADIA」を発表した。特定のゲーム機に縛られず、ネットに接続したスマホやパソコン、テレビを通してストリーミング(配信)形式でゲームをプレイできる。

この事業を担当するバイスプレジデントとして、STADIAを発表するフィル・ハリソン(Phil Harrison)氏。そもそも彼からして、元はソニーのプレイステーション立ち上げの主要メンバーで、その後Microsoftに移りXboxを担当したという経歴の持ち主

かねてより、MicrosoftのXbox事業のトップマネージャーを引き抜いた、ソニーでPlayStationのハード開発にかかわったエンジニアが転職したといった噂が頻繁に流れており、「Googleがゲーム市場に本格参入する」という憶測は強まっていた。実際に2018年には、Googleは「Project Stream」と呼ばれるストリーミング形式のゲーム基盤の計画を発表し、米国内でベータテスターを募って技術テストを行っていた。

STADIAは、Project Streamの延長線上にあるサービスと見られる。ユーザーは特定のゲーム機を持っている必要がなく、従来のゲーム機の役割をするのはGoogleの設置するデータセンターだ。簡単に言えばクラウドサービスのように、実際にゲームタイトルが動作しているのはデータセンター側で、ユーザーはインターネットを介してゲームを遠隔でプレイする。

STADIAのデータセンターから配信されたゲームをパソコンでプレイしている様子
パソコンで遊んでいたのと同じゲームを、タブレットやテレビでも同じように遊ぶことができる

このプラットフォームの特徴によって、例えばYouTubeで新作ゲームのトレーラー動画を見ていて気に入ったときには、そのページ内の「プレイする」ボタンを押すだけで、インストールすら不要で、動画を再生するかのようにそのゲームをプレイできるようになる。

そして、STADIAのデータセンターが持つゲーム機としてスペックは、サービス開始時のものとして、GPUの演算性能は10.7テラFlopsに達するといい、これはPlayStation 4 Proの4.2テラFlopsや、Xbox One Xの6.0テラFlopsを大きく上回る。映像品質も4K/60fpsのストリーミングに対応し、将来は8K/120fps対応も予定しているという。

STADIA用の「STADIAコントローラー」も販売する。SNSアップ用のボタンや、Googleアシスタントボタンが備わっている

Googleは2019年中にSTADIAをローンチする予定で、まずは米国、カナダ、欧州でサービスを開始すると説明している。発表を受けた翌20日の東京株式市場では、任天堂とソニーの株価が揃って大きく下落した。投資家たちが、GoogleのSTADIAによって、Nintendo SwitchやPlayStationのビジネスが脅かされると考えたからだ。

関連記事