人間の声で制御をする音声指令システムであり,音声認識技術がおもである.機械側から人間に対して音声伝達するには音声合成が用いられる.人間が日常に使用している自然言語で,不特定話者を対象に,リアルタイムで連続音声認識できることが理想であるが,一般には,言語や話者を特定し,システムの信頼性を高めているものが多い.