NetPreserve, conserva della rete

posted in: Blog | 0

In merito al post precedente sono andato a vedermi un po’ il sito di netpreserve, questo ente che si propone munificamente di archiviare completamente il web – che noi lo vogliamo o meno.

Per cercare qualche informazione dettagliata è necessario andare a ravanare tra le mission dei singoli workgroup, il che non rientra nella mia definizione di trasparenza, ma tant’è. Il meglio viene leggendo.

The objective of the Deep Web Working Group is to identify strategies and produce tools for archiving web content which is inaccessible to crawlers.

[cut]
  • Tools for the ingestion of deposited databases and document archives into a long-term preservation format
  • The provision of access tools to search and navigate these structured data archives (which are stored as XML) via the web
  • Tools for the extraction of content from deep web sites where no contact with provider is available

Cominciamo malissimo, con questa dichiarazione esplicita di intenti di violare i mezzi esplicitamente usati dall’autore del sito per evitare il crawling e l’harvesting, peggio del peggiore spammer. Tralasciamo il proposito di “flattening” dei database e di indicizzazione dei siti nascosti.

Google this people are not.

Passiamo adesso all’Access Tool working group:

The Access Tools Working Group will focus on initiatives, procedures and tools required to provide immediate access and to preserve the future access to Internet material in a web archive.

  • Access tools required for quality control of archived internet material;
  • Access tools for the analysis of the content of the archived internet material;

Come dire, tutti i miei contenuti web sono letti, analizzati, indicizzati ed immediatamente disponibili a chiunque voglia leggerli. Il mio diritto di renderli inaccessibili, privati, o disponibili solo per un certo tempo non conta.
Su un dato minore, counter e statistiche non saranno più affidabili perché non terranno conto di chi legge dall’archivio.

Passiamo ora al gruppo interessante, quello che dovrebbe smentire le mie preoccupazioni e dirmi che i miei contenuti saranno trattati con la stessa disciplina con cui io li ho protetti, e che il mio diritto sulla copia è (se voglio) rispettato come da normative internazionali e da licenza d’uso del sito.

Content Management Working Group

Information about this working group will be provided soon.

Sorridete, siete su candid camera.

Io intanto continuo a tenere (per tutto ciò che non è distribuito sotto by-nd-nc) il mio bel disclaimer sul divieto di copia da parte di chiunque non sia un privato.
(Anche gli altri possono copiare. A pagamento.)