iedge
  • iedge
スマートホーム(スマートハウス)の記事
2019.07.10
2019.11.26

音声認識の仕組みとは?AI活用のメリットと音声認識技術の最新事例【テクノロジー・AI 入門編】

記事ライター:iedge編集部

最近では「Google Home」や「Amazon Echo」など、AIスピーカーがたくさん登場しています。「今日の天気はどうなる?」や「今のタイミングにピッタリな曲をかけて」などと音声で命令するだけで、自動でユーザーの音声を処理して適切な答えを返してくれます。このときに使われているのが音声認識の技術です。

音声認識を利用して議事録を自動化するなど、音声認識を利用したサービスは私たちの日常の至るところで目にします。例えば「Android」のスマホを持っている場合は、「Google音声検索」を活用している方も多いのではないでしょうか。しかしさまざまな音声認識サービスを手軽に利用できるにもかかわらず、音声認識の仕組みについてはよく知らない、という方も多くいらっしゃるのではないでしょうか?

そこで今回は音声認識の仕組みやAIを活用した音声認識で実現できることなど、音声認識についてさまざまな観点から解説を行います。

▼この記事でわかる!

  • 音声認識の仕組み
  • 音声認識とAIで実現できること
  • 音声認識の身近な活用事例

 

音声認識の仕組みとは

音声入力のイメージ画像

音声認識とはコンピューターに人間の音声などを認識させる技術のこと。音声を認識させた上で発音者を特定したり、音声の内容をテキストで出力したりと、色々な作業が可能です。

本格的な音声認識の研究が始まったのは1971年アメリカ。軍事に関する研究を行うアメリカ政府機関「国防高等研究計画局」が音声認識に関する研究に着手しました。

そして1975年にはITサービス大手の「IBM」が、民間初の音声認識技術開発を行いました。一般に音声認識が広まるきっかけになったのが「Microsoft」が「Windows95」にスピーチツールを搭載したことです。そしてスマホでは2011年に「iPhone4S」に音声アシスタント「Siri」が搭載され、高精度の音声認識技術で話題となりました。

そして2017年にはGoogleがGoogle Homeを、AmazonがAmazon Echoを発売。日本でも同年に「LINE」が「Clova WAVE」を発売開始しました。さらに他メーカーもGoogle Homeに搭載されている「Googleアシスタント」やAmazon Echoに搭載されている「Alexa」など、音声認識プラットフォームを搭載したAIスピーカーを続々発売。値段も手ごろだったことから、売れ行きも好調でした。2017年はAIスピーカー元年とも呼ばれ、音声認識技術に注目が集まりました。

 
音声認識では、ユーザーがまず認識させたい音声をコンピューターに入力します。そして不要な音声部分(ノイズ)を取り払い、処理できる形にデータを加工します。その際人間が発する音声は「アナログ信号(波の形状をした信号)」のようになっているので、これをコンピューターが認識できる「デジタル信号(0か1か、2パターンで表現された信号)」に変換します。

次に取得したデジタル信号からコンピューターが「音素」を特定します。音素とは人間が発する音声の最小の単位で、以下で構成されます。

  • 母音
  • 子音
  • 撥音

 
例えば「Hello」とユーザーが発音したときは、「H-e-l-l-o」とコンピューターの方で音素単位に区切ります。

発音を音素に区切った後は、音素の並び順番をあらかじめ用意されている音声データベースと照合します。音声データベースは「H-e-l-l-o→Hello」というように、音素の並びとそれに対応する単語が関連付けられて収納されています。また音声データベースでは「Hello」、「He」など、最初が同じ音素の並びは同じグループとして格納されています。

そしてユーザーが入力した音声に合ったパターンを特定し、単語の並びを作ります。最後に単語の並びを文に変換してテキストなどで出力を行います。

従来の音声認識は人間が音声データを加工し、音声データベースを作っていました。しかし莫大なパターンがある音声パターンを、一から人間の手でノイズを取り除き適切な形に変換したりと作業するのはかなりの時間がかかります。また音声データベースの元になるデータの量自体も不足していました。

しかし最近では「ディープラーニング」技術を活用したAIが登場。ディープラーニング技術を使えば、従来一から人間の手で行っていた音声データベースの作成が簡単になります。またインターネット普及により、大量のデータを簡単に取得できるようになりました。

結果音声認識技術の精度も向上し、変換精度が100%に近付きつつあります。

 次ページ >
音声認識とAIで実現できること

関連記事

NEW

世界で一番人気のスマートタグ「Tile」全6機種を比較してみた

スマートタグとは 画像引用元:https://thetileapp.jp/ スマートタグは、キーホルダーやカードの形をした小さなIoTデバイスです。スマートタグとスマートフォンをBluetoothでペ ...

続きを見る
スマートホーム(スマートハウス)の記事 2020.05.25
NEW

【Apple機器が車のキー代わりになる】CarKeyとは?

CarKeyとは CarKeyとは、appleの最新OS「iOS13.4」のベータ版(開発者向けのテスト版)で存在が発覚したスマートキー機能です。iPhoneやApple WatchなどApple系機 ...

続きを見る
スマートホーム(スマートハウス)の記事 2020.05.22
NEW

5G対応スマートフォン端末はもうチェックした?国内3キャリアから発売中の3機種をご紹介

5G対応端末1「Galaxy S20 5G SC-51A」(ドコモ、au) 画像引用元:https://www.nttdocomo.co.jp/product/sc51a/?icid=CRP_AREA ...

続きを見る
スマートホーム(スマートハウス)の記事 2020.05.20

Qrio Smart Lockなら、鍵をシェアすることができて、スマホで解錠できる!

Qrio Smart Lockなら、まるで鍵を開けるかのようにスマホを操作するだけ Qrio Smart Lockは、スマートロックサービスです。 鍵をドアに設置する際の工事も不要です。鍵につけさえす ...

続きを見る
スマートホーム(スマートハウス)の記事 2019.11.28

これからのスマートホームには欠かせないAIについて知っておこう!

そもそもAIって何? AI(Artificial Intelligence=人口知能)は、人間が行う様々な作業や活動をコンピューターなどで模倣し、人間と同じような知能の実現を目的としたソフトウェアおよ ...

続きを見る
スマートホーム(スマートハウス)の記事 2019.11.28

人の感情に共感する次世代のAIロボット「JIBO」とは?

多くの可能性を秘めた新型AIロボット「JIBO」 JIBOは、アメリカのMIT(マサチューセッツ工科大学)のシンシア・ブリジール准教授により開発されました。 その後、2014年にIndiegogoのク ...

続きを見る
スマートホーム(スマートハウス)の記事 2019.12.03

Copyright© iedge , 2020 AllRights Reserved.