Lo mas comodo que veo es que grabes un archivo binario con el identificador de cada nota, podes usar una cabecera si queres. Los datos en si serian una secuencia de numeros enteros (BYTE, 0-255) que grabarias y despues al leerlo pudieras interpretar, tenes que relacionar cada nota con un numero y esa nota con un wav.