The ROSETTA Project | Global Huck

Resources for Endangered Languages Through Translated Texts

About the Project

Out of the world’s 6000+ languages only a small fraction currently enjoys the benefits of modern information technologies. Languages and cultures left behind are called endangered, indigenous, or technologically low-resourced. ROSETTA is a collaborative and interdisciplinary digital humanities research project, between Stanford University and the Université de Lille and funded by the France-Stanford Center for Interdisciplinary Studies. It aims to preserve and sustain knowledge diversity and cultural heritage by combining different disciplines: Information and Communication Science, Computational Linguistics, American Literature, and Translation Studies. Much as the Rosetta stone helped decipher the demotic and hieroglyphic scripts thanks to the presence of the Greek translation, our project intends to preserve contemporary endangered languages and cultures and assist with their survival through existing transnational translated texts.

ROSETTA makes use of extant translated versions of a single text into a number of endangered and low-resourced languages. The project relies on crowdsourcing approaches as well as inclusive, interactive and collaborative user-based approaches for data and information collection. Natural Language Processing methods are then used to generate multilingual knowledge and language resources (corpora, thesauri, dictionaries, etc). We hope that eventually, during their contribution and exploration, users and scholars will have a contextualized overview about the intercultural and global circulation of a transnational text through an interactive global knowledge map.

A first experiment of ROSETTA uses extant translated versions of a single fictional text — Mark Twain’s Adventures of Huckleberry Finn — into a number of low-resourced languages spanning a period of nearly a century and a half. In the process, users and scholars will have the opportunity to gain insight into the global circulation of a transnational American novel.

"Global Huck” is a literary and cultural historical project out of which ROSETTA grew, and it involves identifying global editions of Adventures of Huckleberry Finn and having scholars contribute comments about the cultural work that each translation does in specific cultural contexts.

The project has been supported by Maison des Sciences de l’Homme et de la Société de Lille (MESHS) and is currently supported by Huma-Num, a very large research infrastructure for facilitating the digitization of research in the humanities and social sciences funded by the European Commission. At the heart of the SHS and digital humanities, Huma-Num is built on an original organization consisting of implementing a human (collective consultation) and technological (sustainable digital services) system on a national and European scale.

Please contribute information about editions on the map or any other editions here. The form accepts all alphabets and languages. We welcome all kinds of information about these translations: citations to editions, links to them, PDFs, images, bibliographic records, as well as citations to and links to scholarship about the translations.

Résumé du Projet

Sur les plus de 6000 langues parlées dans le monde, seulement une petite fraction bénéficie des technologies modernes de l’information. Les langues et cultures délaissées sont appelées indigènes ou en voie de disparition ou encore technologiquement peu dotées. ROSETTA est un projet d’humanité numérique collaboratif et interdisciplinaire qui vise à préserver le patrimoine culturel et à soutenir la diversité de connaissances en combinant plusieurs disciplines : les Sciences de l’Information et la Communication, la Linguistique Computationnelle, la Littérature Américaine et la Traductologie. Tout comme la pierre de Rosette qui a permis le déchiffrement des hiéroglyphes grâce à la présence de la traduction grecque, le projet ROSETTA vise à préserver les langues et cultures menacées de disparition et à les développer grâce à l’existence de supports langagiers traduits.

ROSETTA propose d’utiliser les traductions existantes d’un même texte dans un certain nombre de langues en danger et peu dotées. Le projet se base sur des approches de crowdsourcing ainsi que sur une approche inclusive, interactive et collaborative basée sur la contribution de l’utilisateur pour la collecte de données et d’information. Les méthodes de traitement automatique de la langue permettent ensuite de générer des ressources langagières multilingues (corpus, thésaurus, dictionnaires, etc.). Durant leurs contributions et explorations, les utilisateurs et les experts auront un aperçu contextualisé sur la circulation globale et interculturelle d’un texte transnational à travers une carte globale et interactive de connaissances.

Une première expérimentation a été réalisé en collectant les traductions existantes du roman Adventures of Huckleberry Finn dans un certain nombre de langues en danger et peu dotées couvrant une période de près d’un siècle et demi. Durant le processus, les utilisateurs et les experts pourront contextualiser et explorer la circulation globale et inter-culturelle d’une oeuvre américaine transnationale.

"Global Huck" est un projet historique littéraire et culturel à partir duquel ROSETTA a été établi. Le projet implique l'identification des éditions mondiales du roman Les Aventures de Huckleberry Finn et il permet aux chercheurs de fournir les contextes culturels spécifiques qui enrichissent chaque traduction.

Meet the Team

ROSETTA / Global Huck is a joint project between Stanford University and the Université de Lille.