No existe el número "correcto", se trata de ir probando hasta obtener el mejor resultado. Aunque también existen los "meta-algoritmos" que se dedican ellos sólos a buscar la mejor topología de red (cascade-correlation, algoritmos con poda, redes radiales...).
Para redes pequeñas suele bastar con aplicar la regla del logaritmo. Pon en la capa oculta el logaritmo binario del número de neuronas de la capa de entrada.
Por ejemplo, si tienes 4 perceptrones en la entrada, pues en la oculta pones 2; si tienes 8, pones 3; si 16, 4; etc. Para problemas sencillos suele dar buen resultado.
Saludos.