Fino ad agosto scorso ce n’erano 129.864.880. Per rispondere alla domanda, Google Books, che intende digitalizzare tutti i testi del mondo, si è però dovuta interrogare sulla definizione stessa di libro. I tecnici della divisione libri di Google hanno preso come punto di partenza la definizione di “tomo”. Ogni singolo tomo, infatti, può esistere in una o due copie, come per gli antichi manoscritti, oppure in milioni, come potrebbe essere per un bestseller. Un problema sorge, però, nel trattare l’edizione economica e quella rilegata: pur essendo il medesimo libro, vengono conteggiati come tomi diversi. Altra definizione su cui Google si appoggia è quella dell’International Standard Book Number, ma anche questa è incompleta: l’Isbn è relativamente nuovo (esiste dalla metà degli anni Sessanta), soltanto alcuni Paesi occidentali lo hanno adottato e, talora, assegna lo stesso numero a diversi libri, o addirittura ad oggetti diversi dai libri come Cd e magliette. Altri identificatori sono il Library of Congress Control Number e il World Cat Accession Number, che però si riferiscono a “entità bibliografiche”. Per esempio, le “Lecture Notes in Mathematics” sono una serie monografica composta da migliaia di volumi a cui è però assegnato un singolo numero Oclc. Google Books, per essere il più possibile precisa, raccoglie dati aggregati sui libri da diversi provider (circa 150). Successivamente, analizza le informazioni provenienti da fonti diverse nel tentativo di ridurre le ripetizioni. Da oltre un miliardo di segnalazioni, questo processo ha ridotto il numero di “potenziali libri” a poco meno di 600 milioni. Un’altra fase del processo di scrematura per arrivare ad identificare un libro mira ad evitare le duplicazioni di dati provenienti da uno stesso provider. Questa fase restringe ulteriormente il numero di libri, e da 600 milioni si è arrivati a 210 milioni. Al numero definitivo si arriva escludendo i registri che non corrispondono a libri, ma a registrazioni audio, video, mappe e alle magliette con numeri Isbn. Tenendo in considerazione solo oggetti che sono stampati e rilegati, si giunge a una cifra vicino ai 146 milioni. Se da questa si sottraggono i numeri seriali che, per ammissione dei suoi stessi tecnici, Google Books ancora non tratta con la doverosa attenzione, il numero finale si riduce ulteriormente, portando il totale a 129.864.880.
da notizie.virgilio.it