Publicidade

Estado de Minas HISTÓRIA PRESERVADA

Especialistas se preocupam em impedir que dados armazenados na internet sejam perdidos

No mês passado, a rede mundial de computadores completou 25 anos com a triste constatação de que 25% da informação armazenada foi perdida


postado em 11/05/2014 08:00 / atualizado em 11/05/2014 08:38

(foto: Valdo Virgo/CB/D.A Press)
(foto: Valdo Virgo/CB/D.A Press)
A rede mundial de computadores completou 25 anos no mês passado com uma triste consequência do envelhecimento: desde o nascimento, a internet perdeu 25% da informação que já armazenou. Essa perda de memória apagou definitivamente incontáveis dados, que variam desde inocentes e-mails a importantes publicações científicas e sigilosas informações de empresas e organizações. O fenômeno levou especialistas a bolar um eficiente “sistema de memorização” para evitar que a internet volte a esquecer o que é importante: assim como uma pessoa que toma o cuidado de anotar um compromisso, a rede agora conta com inúmeros lembretes digitais que ficam guardados a sete chaves.

O tema dominou as discussões no 1º Seminário Internacional de Preservação Digital, promovido pela Rede Brasileira de Preservação Digital, a Rede Cariniana, ligada ao Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict). Especialistas do Brasil, dos Estados Unidos, do Canadá, do México, do Uruguai e da Espanha se reuniram em Brasília, para compartilhar casos de sucesso e aprender mais sobre essa forma tecnológica de arquivamento e preservação. O evento, que terminou sexta-feira, incluiu representantes do Instituto de Tecnologia de Massachusetts (MIT) e da agência espacial norte-americana (Nasa).

“Tudo o que for digital, livros eletrônicos, periódicos eletrônicos, tudo isso tem de passar por algum processo para ser preservado por 20, 30 ou 40 anos. E tem de ser um método seguro”, ressalta Miguel Ángel, coordenador da Rede Cariniana. Mais do que fazer becape dos documentos, as instituições precisam se certificar da segurança de acesso a eles, além de garantir a integridade física dos hard drives e a criação de um sistema de padronização para o armazenamento de arquivos que se mantenha atualizado com a tecnologia. “Muita informação digital produzida no mundo já foi perdida porque não é guardada corretamente, porque o formato é obsoleto ou porque simplesmente foi feita uma administração errada dessa informação, em um computador local”, enumera Ángel.

O professor Rubens Ribeiro, do Instituto de Ciência da Computação da Universidade Federal da Bahia (UFBA), dá como exemplo um episódio infeliz ocorrido há cinco anos na instituição de ensino, que perdeu algumas listas de contatos durante uma migração de dados para um novo sistema. “Pode ser que eu tenha no meu Internet Explorer em casa, que eu nem uso há muitos anos. Mas isso não é preservação digital. É uma forma de ter acesso a documentos”, ressalta o especialista. “Se eu não tenho no meu arquivo, no meu computador, na minha casa, aquilo fica perdido.” Ribeiro lembra que um sistema eficiente de conservação de documentos precisa contar com uma série de referências, como data de criação e registros de acesso, além de uma rede de replicação dos documentos.

Muitas cópias Um exemplo de como as instituições demoraram a atentar para a importância da preservação digital ocorreu nos anos 1980, quando a Nasa percebeu que havia perdido todas as informações das primeiras expedições espaciais, inclusive das viagens à Lua. Imagens, vídeos e bancos de dados acabaram em um verdadeiro buraco negro digital, de onde não havia caminho de volta. Para evitar que mais dados acabassem no limbo, a agência desenvolveu o próprio sistema de preservação digital, o Open Archival Information System (OAIS), que passou a ser um padrão para todo o planeta. Esse também é o método que serve como modelo para o movimento de conservação on-line de arquivos no Brasil.

A Rede Cariniana se encarrega de oferecer serviços de preservação digital e instruir instituições com grandes acervos a adotarem uma política segura de administração de arquivos. O grupo brasileiro conta com 10 parceiros integrais e é responsável pela conservação de mais de mil periódicos no país. Entre os guardiões estão instituições como a Universidade de Brasília (UnB), a Universidade de São Paulo (USP) e a Universidade Estadual de Campinas (Unicamp).

A Rede Cariniana adotou, no ano passado, um software criado pela Universidade de Stanford (EUA). O programa Lockss (sigla em inglês para muitas cópias mantêm coisas seguras) foi especialmente desenvolvido para a preservação de periódicos eletrônicos e funciona na filosofia do “quanto mais melhor”: diversas instituições guardam as chamadas “caixas”, computadores preparados exclusivamente para o armazenamento de informações próprias e de parceiros. Uma máquina mantém constante contato com outras, que partilham o mesmo arquivo em diferentes localizações, e somente usuários cadastrados têm acesso às informações guardadas. O modelo recomenda que se tenha ao menos seis cópias dos arquivos em locais separados. No Brasil, já são oito dessas caixas e planeja-se chegar, em breve, a 14.

Fukushima É possível manter mais de uma dezena de caixas em diferentes países, ligadas unicamente pela internet. Elas se encarregam de manter o grupo atualizado e recuperam os dados que se perderem em um dos computadores. “Quanto maior o número (de caixas), menor o risco”, explica Randy Kiefer, diretor da Lockss, empreendimento sem fins lucrativos que usa o sistema para armazenar dados de mais de 200 editoras de todo o mundo.

O grupo tem 12 caixas distribuídas em diversos países e deve instalar um novo computador no Brasil até outubro. “Quando a caixa de Tóquio saiu do ar por causa do acidente de Fukushima, o sistema voltou e questionou aos outros computadores: ‘Estou de volta, o que perdi?’. Ele se reconectou e caiu umas três vezes, mas, a cada vez, ele falava com o sistema e tinha outras 11 cópias para conferir”, conta Kiefer.

Os comentários não representam a opinião do jornal e são de responsabilidade do autor. As mensagens estão sujeitas a moderação prévia antes da publicação

Publicidade