• Domingo 22 de Diciembre de 2024, 22:29

Autor Tema:  Voz A Texto, Sacar Palabras De Audio  (Leído 1145 veces)

sakuragi

  • Miembro activo
  • **
  • Mensajes: 57
    • Ver Perfil
    • http://www.sakux.com
Voz A Texto, Sacar Palabras De Audio
« en: Viernes 28 de Julio de 2006, 19:40 »
0
hola que tal,

Eh estado queriendo hacer un programita que hagarre un archivo de audio y le saque todas las palabras posibles que se diga en dicho audio.

algo asi como de "voz a texto"

me encontrado con la dificultad de no saber por donde empesar.

alguien sabe algo al respecto? por donde empesar? alguna idea de algoritmo?
alguna documentacion?

saludos

gracias
www.sakux.com

 No contamines. Uso de Energias Limpias y Reutilizables.

"Solamente cuando el último árbol este muerto, el último río esté envenenado y el último pez esté atrapado, entenderemos que no se puede comer dinero"

JuanK

  • Miembro de ORO
  • ******
  • Mensajes: 5393
  • Nacionalidad: co
    • Ver Perfil
    • http://juank.io
Re: Voz A Texto, Sacar Palabras De Audio
« Respuesta #1 en: Viernes 28 de Julio de 2006, 20:46 »
0
a no ser que consigas un componente ya hecho... creeeme que sera un infierno.

Que sabes acerca de algoritmos de reduccion de ruido, convolucion, filtrado, mezcla etc. de sonidos?

En el caso que ya tengas un buen conocimiento al respecto y un dominio adecuado del tema, debes pensar en hacerlo a traves de una red neuronal de autoaprendizaje que sea capaz de diferenciar un sonido de otro y de establecer bajo que parametros un sonido puede equivaler a una letra, consonante, consonante - letra, consonante consonante, letra- letra  etc....
tambien debes entrar a evaluar las caracteristicas de timbre, frecuencia, amplitud, modulacion etc etc...

es decir cuantas combinaciones diferentes de esas caracteristicas producen un sonido que podamos identificar como la letra A?

miles , o millones, incluso cada persona tiene algo diferente pero igual la A se oye como una A.

ASi que tambien debes alimentar la red neuronal con informacion acerca de que caracteristicas debe evaluar y con que tolerancia de valores para distinguir un sonido de otro encada letra o combinacion posible...

mejor dicho necesitas un grupo de investigacion y de buenos matematicos y fisicos para hacer eso... y mucha paciencia y seguramente recursos...

Mejor busca si y hay algo hecho y utilizalo... sino puedes tardar años... muchos años
[size=109]Juan Carlos Ruiz Pacheco
[/size]
Microsoft Technical Evangelist
@JuanKRuiz
http://juank.io

arielb

  • Moderador
  • ******
  • Mensajes: 771
  • Nacionalidad: pa
    • Ver Perfil
    • http://coder-pa.blogspot.com
Re: Voz A Texto, Sacar Palabras De Audio
« Respuesta #2 en: Viernes 28 de Julio de 2006, 21:41 »
0
:blink:  :blink:  :blink:    se lee sencillo   :huh:  :whistling:
"Porque de tal manera amó Dios al mundo que dio a su hijo unigénito para que todo aquél que en él crea no se pierda mas tenga vida eterna"
Juan 3:16

http://coder-pa.blogspot.com