Il a fondé Internet Archive avec une vision utopique. Cela n’a pas changé, mais Internet a
Dans sa bibliothèque, Brewster Kahle danse. Il sourit en se déhanchant sur place, une antique Victrola remplissant le hall d’entrée de l’édifice, une ancienne église, aux airs rauques de jazz d’antan.
Il lève l’aiguille et la musique s’arrête, mais juste pour l’instant. Bientôt, son personnel convertira le record vieillissant en une chaîne de uns et de zéros qui vivra pour toujours dans le cyberespace. C’est l’Internet Archive, et c’est pourquoi Kahle, et lui, sont là : Pour rendre disponible gratuitement, en ligne, chaque bit d’information numérique ou physique qui existe.
Marcher avec Kahle à travers son temple de la connaissance à colonnes dans le district de Richmond à San Francisco, c’est comprendre l’ampleur de ce que lui et son personnel, qui compte maintenant plus de 100, ont travaillé dur pendant près de 25 ans. Dans une zone de chargement, des piles de livres donnés attendent leur tour sur une machine de numérisation spécialisée où, dissimulé derrière un rideau noir, un technicien copie minutieusement des pages interminables.
En bas, des bobines de microfiches sont converties en images informatiques qui rejoindront la quantité stupéfiante de données que les archives ont recueillies au fil des ans.
Ses serveurs contiennent plus de 70 pétaoctets de données uniques 70 millions de gigaoctets dont 65 millions de textes, films, fichiers audio, images, livres et plus encore.
La quête de Kahles pour construire ce qu’il appelle une bibliothèque d’Alexandrie pour Internet a commencé dans les années 1990 lorsqu’il a commencé à envoyer des programmes appelés crawlers pour prendre des instantanés numériques de chaque page sur le Web, dont des centaines de milliards sont accessibles à tous via les archives Wayback Machine.
Cette vision d’un accès libre et ouvert à l’information est profondément liée aux premiers idéaux de la Silicon Valley et aux origines d’Internet lui-même.
La raison d’être d’Internet et plus particulièrement du World Wide Web était de faire en sorte que tout le monde soit un éditeur et que tout le monde puisse y aller et avoir une voix, a déclaré Kahle. Pour lui, le besoin d’un nouveau type de bibliothèque pour ce nouveau système de publication, Internet, était évident.
Mais tandis que les objectifs de Kahles n’ont pas changé, Internet a changé. Cette première vision utopique des forces positives de l’interconnexion numérique est de plus en plus en contradiction avec les trésors de matériel protégé par le droit d’auteur et payant en ligne qui grandit chaque jour.
Lorsque les archives ont commencé leur collecte, la plupart des personnes en ligne accédaient à quelques pages d’accueil principales telles que Yahoo.com, a déclaré Margaret OMara, professeur à l’Université de Washington et historienne de la Silicon Valley.
Maintenant, non seulement il y a tellement plus d’informations, mais une grande partie de ces informations sont exclusives, a déclaré OMara. Il y a des questions sur le fonctionnement d’Internet et sur le fonctionnement de l’économie d’Internet auxquelles il est impossible de répondre en capturant des pages Web ou en capturant des documents ou en numérisant un magazine.
Malgré cela, elle a déclaré que les archives sont une ressource inestimable pour les chercheurs comme elle et reflètent l’idéalisme à la base du rêve de la Silicon Valley d’un monde plus ouvert, connecté et accessible.
Ils conservent le passé d’une manière qui est une chose rare à voir dans l’industrie et une communauté qui est toujours tellement concentrée sur l’avenir et concentrée sur ce qu’est la prochaine chose, a déclaré OMara.
Ce paysage en ligne changeant est dans l’esprit de Kahles alors qu’il se dirige vers le cœur battant de la salle principale caverneuse des archives. L’espace est calme. Diffusée d’une lumière dorée qui filtre à travers les fenêtres, l’ancienne nef de l’église semble encore sacrée. Peu de gens sont dans le bâtiment à cause de la pandémie, mais cette salle n’est jamais vraiment vide, ses bancs sont peuplés de statues miniatures d’employés et de bénévoles passés et présents, dont une à lunettes de Kahle lui-même.
Ici, les banques de serveurs bourdonnent et clignotent à chaque chargement et téléchargement alors que Kahle explique comment les bibliothèques, même dans le cyberespace, peuvent brûler.
À travers l’auditorium flanquant la scène principale où les numéros d’hymne étaient autrefois affichés, trois numéros sont choisis en métal: 200, 404 et 451. Les deux premiers sont des codes Internet courants indiquant lorsqu’une page est accessible avec succès ou non. Le troisième apparaît lorsque le contenu a été retiré pour des raisons légales, comme la violation du droit d’auteur.
Ce n’est pas non plus une référence au roman anti-censure Fahrenheit 451 de Ray Bradbury.
Kahle a dit dans le passé que si une bibliothèque et ses livres brûlaient, des copies vivraient probablement dans un autre espace physique. Ce n’est pas le cas sur le web, dit-il. Par exemple, si un journal se déconnecte en Turquie, toutes ses archives disparaissent. Et ce n’est pas ainsi que vous pouvez gérer une culture.
Les archives achètent et numérisent depuis des années des livres, les prêtant gratuitement via son site avec une liste d’attente comme les autres bibliothèques. Mais lorsque la pandémie de coronavirus a frappé l’année dernière et que les bibliothèques et les écoles ont fermé, les archives ont créé ce qu’elles ont appelé la Bibliothèque nationale d’urgence, une collection de 1,4 million de livres en ligne accessibles aux utilisateurs sans attendre.
Un procès intenté par quatre des plus grandes maisons d’édition du pays a rapidement suivi, l’un des nombreux défis auxquels les archives sont confrontées dans leur quête de la liberté des droits de navigation dans le cyberespace.
Kahle soutient que les lois sur le droit d’auteur n’empêchent pas les bibliothèques comme la sienne de posséder, de numériser et de prêter des livres avec certains contrôles en place.
Les smartphones et les applications propriétaires et protégées qui les remplissent constituent peut-être un obstacle encore plus important dans l’esprit de Kahle.
Ces choses regorgent d’applications qui ne sont pas ouvertes, a-t-il déclaré en levant son téléphone lors d’un récent appel Zoom. Cela signifie également que beaucoup d’entre eux sont immunisés contre ses robots et ne peuvent pas être sauvés pour la postérité. C’est un problème profondément vexant pour la mission des archives, ainsi que les paywalls, qui peuvent et bloquent les robots Kahles.
Le format Internet original des liens hypertextes encore utilisé aujourd’hui permet aux gens de tisser des connaissances ensemble, a-t-il déclaré. Mais le monde des applications est intrinsèquement cloisonné dans les produits d’entreprise. Ce n’est pas ainsi que nous allons construire une culture qui interagit, se construit les unes sur les autres et peut construire de nouvelles idées.
La carrière de Kahle dans le domaine de la technologie remonte au début des années 1980, lorsqu’il est diplômé du Massachusetts Institute of Technology, où il a étudié l’intelligence artificielle avant d’obtenir son diplôme. Il a aidé à fonder une société de superordinateurs appelée Thinking Machines avant de créer le premier système de publication d’Internet appelé Wide Area Information Server, qui a finalement été vendu à America Online.
Dans le passé, Kahle a également trouvé des moyens de gagner de l’argent avec des logiciels sans sacrifier l’idéal de l’archive. Lorsqu’il a vendu Alexa Internet, une société de recherche et d’information sur le Web qu’il a cofondée dans les années 1990, à Amazon, il a conclu un accord avec le PDG de l’époque, Jeff Bezos. Il ne vendrait le logiciel que si Bezos lui permettait de continuer à donner chaque jour une copie d’Internet à ses archives. Bezos a accepté.
L’Internet Archive, aujourd’hui, est financé par de nombreux petits dons d’une moyenne d’environ 20 $ chacun, selon Katie Barrett, responsable principale du développement des archives. Les archives gagnent également de l’argent en numérisant des livres pour les bibliothèques et reçoivent des fonds de la Kahle / Austin Foundation Foundation, qui a été fondée avec l’épouse de Kahles, Mary Austin.
Les formulaires fiscaux de 2019 montrent que les revenus des archives dépassent 36 millions de dollars pour l’année, dont près de 30 millions de dollars en contributions et subventions.
Dans sa quête d’un monde plus ouvert et accessible, l’organisation à but non lucratif travaille avec Wikipédia, corrigeant les liens et mettant à jour les pages qui renvoient à des sites qui seraient perdus si la Wayback Machine ne les avait pas sauvegardés en premier lieu. En travaillant avec les archives, Wikipedia a ajouté plus de 25 millions de pages Web archivées, principalement à partir de liens Wayback Machine, à 150 éditions linguistiques de Wikipedia.
Nous partageons une vision d’Internet où les services à but non lucratif peuvent accroître l’accès de l’humanité au savoir, a déclaré Gwadamirai Majange, porte-parole de la Fondation Wikimedia, propriétaire de Wikipédia, dans un e-mail.
L’archive s’est également associée à des groupes tels que la Digital Public Library of America, fournissant principalement du matériel imprimé numérisé à son site.
Des groupes tels que la Long Now Foundation cherchent également à favoriser ce type de réflexion à long terme à travers son horloge de 10 000 ans et un projet de création d’une bibliothèque numérique du langage humain pour les générations futures, en partie en contrepoint du court terme, du profit. modèles pilotés d’entreprises technologiques modernes.
Kalhe a également étendu ses efforts à but non lucratif en dehors du monde numérique.
Parmi ceux-ci figurait une tentative malheureuse de créer une coopérative de crédit avec 1 million de dollars provenant des archives. Une offre plus réussie l’a amené à créer une autre organisation à but non lucratif et à acheter un immeuble à proximité à San Francisco où certains de ses employés vivent à des taux inférieurs à ceux du marché.
Pour sa part, Kahle a déclaré qu’il reconnaissait les défis croissants de la mission, mais cela ne l’a pas encore arrêté. Je me réveille de différents côtés du lit en disant, vous savez, ça va marcher, et je faisais en sorte que ça marche, a-t-il dit. Et puis d’autres fois, c’est genre, il y a tellement de choses contre nous.
Malgré cela, les serveurs Kahles continuent de clignoter en bleu avec la vie dans cette grande salle silencieuse. Et tant que des millions de personnes continueront d’accéder à la collection apparemment sans fin, la Bibliothèque d’Alexandrie d’Internet vivra, longtemps après que son fondateur, comme il le dit, va à la grande archive dans le ciel.
Chase DiFeliciantonio est un écrivain du San Francisco Chronicle. Courriel : chase.difeliciantonio@sfchronicle.comTwitter : @ChaseDiFelice