“AI could play a key role in preserving indigenous languages” | Forus

2023-05-10

"L'IA pourrait jouer un rôle clé dans la préservation des langues indigènes".

L'Agence française de développement (AFD) a organisé une conférence visant à explorer les défis liés au développement de modèles et de technologies d'intelligence artificielle (IA) innovants tout en tenant compte des spécificités linguistiques des langues africaines. 

 

Les panélistes, menés par Peter Addo, responsable du laboratoire Emerging Tech à l'AFD, et les participants à l'événement en ligne, ont ainsi eu l'occasion de discuter de l'état actuel de l'IA en Afrique, en tenant compte de l'extraordinaire diversité linguistique du continent. Les défis dans le domaine de l'accès aux données dans les langues africaines ainsi que les moyens de développer l'IA de manière appropriée et adaptée dans la région ont également été discutés. 

 

Avec plus de 3 000 langues parlées en Afrique et une part importante des quelque 1,5 milliard de personnes vivant sur le continent qui ne parlent ni l'anglais ni le français, il est important que l'IA soit développée en tenant compte de cette diversité et de ces spécificités.

 

"Chat GPT, par exemple, connaît la capitale du Kenya, mais lorsqu'on lui pose une question en kinyarwanda (l'une des langues officielles du Rwanda), il ne la comprend pas. Si nous ne mettons pas en place les exigences nécessaires, nous risquons de créer un fossé énorme où les personnes du continent qui ne parlent pas de langues étrangères comme l'anglais ou le français n'auront pas accès aux services d'intelligence artificielle. 13 % des langues du continent sont en danger, et ce chiffre ne cesse de croître. À mesure que la transformation numérique s'installe en Afrique, les Africains devront s'adapter à d'autres langues pour pouvoir utiliser ces services. L'IA pourrait contribuer à réduire l'importance des langues locales pour les jeunes, par exemple, qui seront plus enclins à apprendre l'anglais ou le français. Dans 10 ou 15 ans de transformation numérique, il est possible d'assister à la suppression de plusieurs de ces langues locales, qui ne sont pas parlées dans les interactions en ligne", explique Audace Niyonkuru, PDG de Digital Umuganda, une société d'intelligence artificielle spécialisée dans la technologie linguistique pour les langues africaines, qui met l'accent sur les solutions basées sur la voix. 

 

La pratique de l'"Umuganda", une pratique communautaire visant à promouvoir la croissance sociale et environnementale, a inspiré la création de l'Umuganda numérique pour susciter une action collective.  Le mot Umuganda peut être traduit par "se rassembler dans un but commun pour atteindre un résultat". Dans la culture rwandaise traditionnelle, les membres de la communauté faisaient appel à leur famille, à leurs amis et à leurs voisins pour les aider à accomplir une tâche difficile. Aujourd'hui, au Rwanda, le dernier samedi de chaque mois, tout le monde travaille ensemble pour améliorer sa communauté dans le cadre de l'Umuganda.

 

"Nous nous sommes dit que si cela fonctionnait pour l'infrastructure physique, nous devrions l'essayer pour l'infrastructure numérique, car c'est quelque chose que tout le monde comprend. Nous avions également besoin de diversité de la part de nos contributeurs et nous avons donc cherché quelque chose qui réunisse les sphères physique et numérique. Nous avons ensuite lancé Digital Umuganda pour créer un ensemble de données ouvertes. Nous avons organisé des sessions de formation pour les contributeurs afin d'éviter les préjugés", explique Audace. 

 

"Nous avons travaillé davantage avec des communautés qui comprenaient que le résultat serait la préservation de la langue. Les contributeurs étaient intéressés par la préservation du kinyarwanda. C'était dans un cadre que les gens comprennent et auquel ils sont habitués, c'était explicite pour eux. Il s'agissait d'une contribution volontaire pour une infrastructure qui serait publique par la suite", a-t-il ajouté.

 

Les limites ou les obstacles possibles sur la voie de l'utilisation de l'IA par les locuteurs de langues africaines locales n'ont pas été ignorés lors de cette conférence, comme l'a expliqué Audace Niyonkuru. 

"L'IA pourrait être un outil de localisation", explique Audace, mais aussi un moyen de faciliter le développement socio-économique du continent en facilitant le commerce et les interactions. 

 

"Les traductions entre le wolof et le kinyarwanda pourraient faciliter le commerce entre le Sénégal et le Rwanda, par exemple, mais nous devons également comprendre que certaines langues sont parlées mais non écrites et que les langages machine sont spécifiques à un domaine. Il faudrait disposer d'un ensemble de données spécifiques de terminologies en fonction du domaine".

 

Audace a souligné l'absence de lois sur la confidentialité des données dans la plupart des pays africains, ce qui complique encore l'utilisation et le développement d'une IA "équitable" : 

"Cela pose de nombreux problèmes, car les innovateurs se voient refuser des données qui devraient être librement accessibles et les données des utilisateurs sont exploitées d'une manière qui peut être préjudiciable. Nous pouvons également causer du tort aux utilisateurs qui ont partagé les données sans leur consentement, mais les gens doivent d'abord comprendre ce consentement. La gouvernance des données doit être présente, mais la compréhension des principes de données d'une manière qui reflète la réalité du Sud, inscrite dans les cadres des droits humains, doit également être prise en compte. Il est important d'intégrer les valeurs locales dans la création des ensembles de données. Pour cela, nous avons besoin de développer les capacités des participants impliqués. Il ne s'agit pas seulement d'accéder aux machines, mais aussi de mettre un terme à la fuite des cerveaux du continent."