• Domingo 19 de Mayo de 2024, 01:43

Autor Tema:  Codigo para captura y conteo de texto  (Leído 1305 veces)

cristsanz

  • Nuevo Miembro
  • *
  • Mensajes: 2
  • Nacionalidad: co
    • Ver Perfil
Codigo para captura y conteo de texto
« en: Miércoles 26 de Agosto de 2009, 22:47 »
0
Un saludo cordial para todos, soy nuevo en esto y quisiera la colaboracion de alguien con el siguiente problema:
El trabajo consiste en hacer un análisis detallado de la entropía por letras, digramas, trigramas, palabras, y dipalabras(pares de palabras) de una novela en lenguaje Español (por ejemplo: Don Quijote de la Mancha, Lazarillo de Tormes, etc.) que tenga al menos 20000 palabras.
Junto con el análisis de entropía mencionado antes se debe incluir la siguiente información:
• Número total de caracteres
• Número total de caracteres distintos
• Número total de palabras
• Número total de palabras distintas
1) Escribir una función que permita encontrar la probabilidad de los caracteres imprimibles de un archivo texto de entrada.
2) Escribir una función que permita encontrar la probabilidad de los caracteres imprimibles de un archivo texto de entrada considerando dos caracteres a la vez (digramas), por ejemplo “ho”, “ad”, “li”, etc.
3) Escribir una función que permita encontrar la probabilidad de los caracteres imprimibles de un archivo texto de entrada considerando trios de caracteres (trigramas), por ejemplo “aho”, “adv”, “lin”, etc.
4) Escribir una función que permita encontrar la probabilidad de las palabras de un archivo texto de entrada.
5) Calcular la entropía para cada uno de los casos (letras, digramas, trigramas, y palabras)

La verdad es que con lo unico que estoy familiarizado de matab es con los sistemas de control y procesamiento de imagenes por eso solicito su colaboracion, gracias de antemano. :good: