音声認識スピーカーでの疑問 その2
可聴領域外の音を出して、データを取得するようになると思うのだが、あまり指摘はされていないようだ。
音声認識スピーカーでの疑問
- 音声コマンドをそれほど人は覚えられるのか。
ニュース、天気、株価くらいの単語を拾ったら、答えられるものはいいのだが、そうではないことの方が多いだろう。
機械応答で、1番、2番、3番・・・から選択と返されるような場合、10個以上のものを覚えていられないだろうし、時間もかかってかったるい。
スマフォでワンクリックで済むような単純なタスクしかこなせないのではないか。 - 単語をWikipediaで載っていることを返答するというのが微妙である。
書き言葉と読み言葉は違う。
オーディブルが書籍をそのまま読ませても頭に入ってきにくい問題は同じく発生するかと思われる。 - そもそも読み方もわからないようなものは調べられないので、カメラやコピペを使った検索との併用となる。
- 方言、トーンの違いについては上手く出来たが、ステートマシンを書かないといけないところは変わっていないのではないか。
Amazonは過大評価されていないか
Amazonがサービスを開始すると、15秒ほどでザーッと見たときは、有望に見えるのだが、日常的に使って便利かと言われると、微妙な気がするのだが、どうなのだろうか。
目利きの人の割合が多かったときは、データベース型でもランキングやレビューという仕組みで上手く回っていたように思えるが、データベースの登録件数が増えたためなのか、それとも利用者が一般的になってしまったのかわからないが、少なくとも自分には合っていない。