Qualche settiman fa mi è capitato uno strano errore a livello di Dell EqualLogic e purtroppo non avevo trovato informazioni a riguardo di questo strano messaggio legato alle repliche (tra l’altro solo ad alcune repliche):
Subsystem: MgmtExec
Event ID: 8.3.48
Schedule Replica oraria aborted because the group was too busy processing a max-keep value change to create the operation scheduled for time …
I dettagli non erano di alcun aiuto e sia lo spazio che il numero di repliche erano congre da non dare (in teoria) alcun problema.
Morale, l’errore era nato dopo una procedura di upgrade del gruppo che probabilmente ha lasciato incosistente l’elenco delle repliche.
La soluzione per sistemare l’errore (visto che da solo non si sistemava neppure dopo giorni e neppure cancellando le singole repliche o cambiando il numero di repliche) è di cancellare l’intero set di repliche, la definizione e ricreare tutto da zero. Ovviamente questo non è ottimale sia per i tempi necessari a ricreare la prima copia, sia il fatto di rimanere senza repliche per un certo periodo di tempo.
Una soluzione più semplice che apparentemente funziona, è di cancellare solo schedulazione della replica e ricrearla. Da quel momento le repliche riprendo a funzionare correttamente.