音声認識スピーカーでの疑問
- 音声コマンドをそれほど人は覚えられるのか。
ニュース、天気、株価くらいの単語を拾ったら、答えられるものはいいのだが、そうではないことの方が多いだろう。
機械応答で、1番、2番、3番・・・から選択と返されるような場合、10個以上のものを覚えていられないだろうし、時間もかかってかったるい。
スマフォでワンクリックで済むような単純なタスクしかこなせないのではないか。 - 単語をWikipediaで載っていることを返答するというのが微妙である。
書き言葉と読み言葉は違う。
オーディブルが書籍をそのまま読ませても頭に入ってきにくい問題は同じく発生するかと思われる。 - そもそも読み方もわからないようなものは調べられないので、カメラやコピペを使った検索との併用となる。
- 方言、トーンの違いについては上手く出来たが、ステートマシンを書かないといけないところは変わっていないのではないか。