Para crear un programa asi deberas utilizar controles OCX el Text to speach, lo puedes bajar de la web de microsoft, tienes que bajar el control en español... su uso es muy sencillo, usas las propiedades play, stop, pause, etc...
Ej:
Para el reconocimiento de voz tambien hay otro control la verdad no lo use,
pero tambien lo puedes encontrar en la pagina de microsoft
Salu2