import hashlib, sys, os
#Esta funcion detectara el hash MD5 del archivo
def sabersiya(archivo):
....archi = open(archivo)
....cabeceramd5 = hashlib.md5(archi.read()).hexdigest()
....archi.close()
....return cabeceramd5
todo = os.walk(sys.argv[1])
#Diccionario para guardar los datos
dic = {}
#Esta variable sera el nombre de los indices
x = 0
#Recorremos el arbol de directorios
#todo = os.walk('.')
for path, dirname, filename in todo:
....for x in filename:
........var = '%s/%s' % (path, x)
........dic[var] = sabersiya(var)
........
#Verificamos que sea el mismo hash, pero diferente clave
for h in dic:
....for hh in dic:
........if dic.get(h) == dic.get(hh) and h != hh:
............#print '%s/%s --> %s/%s' % (h, dic.get(h),hh, dic.get(hh))
............try:
................#Eliminamos el archivo
................os.remove('%s' % (hh))
................print 'El archivo eliminado fue %s' % (hh)
............except:
................pass