Abro este hilo para que se puedan publicar enlaces interesantes de mecanismos de optimización para ASM.
Aqui encontrarán una buena lista de "tips" para optimizar tanto como sea posible esa parte crítica del código: (ojo que está en inglés)
http://www.lxhp.in-berlin.de/lhpk6opt.htmlP.D.
¿Alguien conoce algún documento que describa si el par push/pop, o todo el código que esté dentro de este recibe algún tratamiento especial por el hardware actual, tal vez por los mecanismos de proceso multi-hilo? Hago esta pregunta por que en mediciones de rendimiento que hice pareciera que es así... por lo menos el rendimiento es mejor si el código está entre
push edi
push esi
push ebx
y sus correspondientes "pop", en lugar de preservar esos registros de otras formas, y aclaro que lo que está codificado en medio de esos push/pop no es para nada algo "ligero", sino extremadamente "pesado". (Mediciones hechas en procesadores AMD-Athlon)