Estou desconfiado de que existe um lote de HDDs de 1.5TB da Samsung que corrompe arquivos. Os arquivos gravados são diferentes do que foi transferido. Detectei isso em cerca de 2 ou 3 HDDs sendo que provavelmente os três são do lote 2011.04.
José Carneiro, são os HDDs que compramos na Nagem por último.
Não é algo alarmante ainda. No último HDD eu detectei três diferenças (possivelmente apenas três bytes) em 1.5TB. Mas o normal é ZERO.
Como eu só notei o padrão agora, vou voltar a examinar os HDDs onde eu havia notado primeiro esse problema. Isso vai demorar, mas é bom que fique registrado aqui.
compara o MD5 dos dois arquivos para ver se esta batendo!
Nossa Jefferson, vou fazer uns testes, valeu pela dica.
Estou em campo, quando concluir os trabalhos vou pra Recife e levo os HDDs para fazer o velho "update".
Claudio, eu não entendi. Você acha que eu estou detectando diferenças como?
Eu pesquei a "comparação pelo tamanho" foi pelo comentário "(possivelmente apenas três bytes)" do texto.
Mas… quando sugeri o MD5 foi pelas facilidades de processar os hash(s) armazenados em arquivos texto. Acho isto muito útil para garantir a integridade de arquivos e sempre mando o arquivo de hash junto com arquivos transferidos.
Meu método é diferente mas também é baseado em hashs e arquivos texto. Eu não uso MD5 porque acho qualquer coisa acima de CRC32 exagerado e dispensável para o meu propósito:
https://jefferson-ryan.blogspot.com/2010/02/treediff-garantindo-integridade-dos.html
Continuo investigando o problema, mas tenho observações curiosas para adicionar. O problema tornou a acontecer com um dos HDDs de 2TB que comprei recentemente. Mas deixou de ocorrer após minha mudança de volta para o andar térreo da casa. Além da mudança de local, a única diferença é que eu voltei a ter aterramento.
E todos os problemas foram observados enquanto eu estava no primeiro andar (passei uns dois meses ou mais lá), sem aterramento.
Já copiei vários terabytes de um lado para outro, comparando o CRC32 de tudo. Absolutamente nenhuma diferença entre as cópias, como sempre deveria ter sido.
Eu continuo de olho. Ficar vigiando isso é cansativo e demorado, mas não posso me dar ao luxo de não poder confiar na integridade dos dados que passam pela minha máquina.
Em 2009 a seagate sofreu com um bug no firmware que impedia o acesso a alguns arquivos. Esse lote da Samsung pode estar sofrendo de algum problema parecido. Seria interessante dar uma olhada (pagina de firmware : http://www.samsung.com/br/support/download/supportDownloadMain.do ) ou entrar em contato com a samsung.
SÓ isso?
Depois que eu desobri que simples gritos podem afetar o desempenho de HDs, não digo mais nada…
Analista grita com HardDisk Cluster reduz desempenho
Meu problema não é de acesso. Todos os arquivos são lidos sem erro não importa quantas vezes eu teste. O problema é que eles são gravados errado. Não mais que 10 arquivos errados para cada 1.5TB gravado. Eu ainda não fiz uma comparação byte-por-byte mas confio que pela baixa frequência deva ser um mero byte errado em cada arquivo.
Eu descartei a possibilidade de que o erro esteja acontecendo na parte de leitura da operação de cópia porque ainda não consegui flagrar erros nas minhas checagens de CRC periódicas. O erro sempre aparece no "target" de uma operação de cópia.