Las cámaras que permiten enfoque automático por voz, ajustan continuamente el enfoque de la cámara, y se acercan o alejan, para realizar un seguimiento del objeto que capten, según el sonido que reciben. Por ejemplo: en una mesa de reuniones, según quién este hablando en cada momento, la cámara capturará vistas de cerca de cada orador.