Deux Argentins récompensés pour la création d'un assistant virtuel destiné à améliorer la prononciation en anglais – eju.tv



[ad_1]

Ils ont reçu un prix de Google qui financera leurs recherches pendant un an. Comment cela fonctionnera et pourquoi les linguistes sont nécessaires en informatique.

Elle est titulaire d’un doctorat en ingénierie électronique de l’Université de Stanford et a travaillé pour l’institut de recherche SRI International (connu depuis longtemps sous le nom d’Institut de recherche Stanford). Là, il a étudié le traitement de la parole et marquant la prononciation, c'est-à-dire la tâche de générer des scores pour mesurer la qualité de la prononciation.

En 2014, déjà en Argentine, Luciana Ferrer a poursuivi ses travaux sur le sujet et a écrit un PICT. Il s'agit d'un projet de recherche scientifique et technologique financé par le Fonds pour la recherche scientifique et technologique (FonCyT).

Quatre ans plus tard, cette recherche a jeté les bases d’un projet qui vient d’être distingué par Google, dans le cadre de LARA 2018 (Prix ​​de recherche en Amérique latine) à Belo Horizonte, Brésil. Ce sont les prix pour la recherche scientifique délivrés par le géant technologique.

Ferrer développera, avec son équipe académique, un tuteur virtuel (un peu comme un enseignant) pour la pratique de la prononciation en anglais, destiné aux argentins. Par la technologie apprentissage automatique (apprentissage automatique), le système peut détecter des problèmes de prononciation dans cette langue.

"Les systèmes de prononciation prononciation Ils ne sont pas parfaits et il y a des choses à améliorer. Nous devons les adapter aux erreurs commises par les Argentins lorsqu'ils parlent anglais. La façon dont une personne commet des erreurs lorsqu'elle parle anglais dépend de sa langue maternelle.", Dit Ferrer en dialogue avec Infobae.

Il poursuit: "La difficulté avec la prononciation est qu’il n’ya pas d’autre moyen d’apprendre que personnellement, pour le moment. Mais ce ne peut pas être juste un programme qui reçoit des informations. Parce que vous pouvez parler à la machine pendant une heure et que vous ne saurez jamais que vous parlez mal. C'est pourquoi un projet de recherche est nécessaire. "

Collecte de données, clé

LARA a attribué 26 enquêtes aux 300 projets reçus. Chacun de ceux-ci est composé d'un couple d'universitaires. Le prix est le financement du projet pour un an, fournissant 750 USD par mois à la faculté et 1 200 USD à chaque doctorant.

Dans ce cas, le duo Ferrer est complété par le linguiste Jazmín Vidal Domínguez. Il étudie son doctorat en informatique à l’Institut d’Informatique de la Faculté d’Exact de l’Université de Buenos Aires.

Ferrer, chercheur adjoint au Conseil national de la recherche scientifique et technique (CONICET), responsable du groupe de traitement de la parole de la 1CC, supervise Vidal Domínguez dans le doctorat qu'il étudie actuellement.

Actuellement, ils progressent dans la collecte de données sur les mineurs et les adultes argentins parlant anglais. Ils le font via un site où, en créant un utilisateur, il est possible d'enregistrer différentes phrases.

"Dans un an, nous finirons les données, améliorerons le système et commencerons à le fermer à une application Web utilisable, ce serait une démonstration, un prototype.", Dit Ferrer.

Il explique qu'en outre, avant la création de cette page Web, ils devaient concevoir chaque phrase courte en anglais. "La chose la plus compliquée consiste à écrire ces données des informations collectées. Ecrire signifie considérer si chacun des phonèmes a été prononcé correctement ou incorrectement (l'unité minimale de chaque mot, du son de ces mots)"Il dit.

Continuer: "Ensuite, nous devons d’abord localiser l’emplacement de chaque phonème dans le signal audio, puis écouter chacun d’eux et dire «c’est faux». Cela doit être écrit très soigneusement, pour ensuite utiliser ces données pour former le système apprentissage automatique. Entraînez-le à l'évaluer"

Dans les systèmes d’apprentissage automatique, la précision du chargement des données est essentielle. "Le problème est que là où vous mettez des ordures, vous pouvez en avoir, ce qui peut arriver avec ces systèmes. Si vous écrivez mal, le système n'apprend rien", Explique Ferrer.

Les personnes intéressées à participer à la collection d'audios enregistrés en anglais peuvent écrire à [email protected]. La participation au niveau national est fondamentale pour le projet, pour avoir différents types de prononciation et pour former le système d’apprentissage automatique.

Comment ça va marcher?

L'application Web utilisée aujourd'hui pour collecter les données servira à l'avenir à enregistrer l'audio en anglais d'un utilisateur, à traiter ces informations dans le système et à fournir un retour d'informations sur la prononciation. "Manquant le apprentissage automatique, le système qui prédit quel phonème a été bien dit et qui ne l’était pas ", dit Ferrer.

La solution, comme indiqué dans la présentation du chercheur, s’adresse essentiellement aux étudiants des écoles publiques, où la charge d’enseignement de la langue anglaise est brève, bien qu’il y ait des exceptions, selon Ferrer. Nomination, par exemple, à l’Instituto de Enseñanza Superior Lengua Vivas.

"Quand il sera déjà utilisé, ce sera plus utile si cela se fait dans le contexte de l'école. L’idée est de contacter le ministère de l’éducation pour prendre l’initiative auprès de chaque établissement public.", Dit Ferrer.

En ce qui concerne le stade de développement, les chercheurs soulignent que cela devrait être une solution attrayante et n’excluent pas de le transformer en jeu. "Nous pourrions faire en sorte que l’utilisateur entre en concurrence avec un autre, ajoute des points. Que se passerait-il si nous mettions un score et sachions qu'il se trouvait en position 10 par rapport à ceux qui jouent cette semaine? ", Demande Ferrer.

De Google, ils admettent être fiers que la paire de Ferrer et Vidal Domínguez soit la seule intégrée dans son intégralité par les femmes de LARA.

"Il y a un autre étudiant de thèse de premier cycle qui fait partie de l'équipe. C'est bien parce qu'elle programme beaucoup de canchera. C'est le troisième qui nous a manqué ", explique Ferrer.

En revanche, il déclare: "Il y a peu d’étudiants en informatique, j'en ai trois. Il y a environ 15% de femmes parmi les étudiants. Au département d'informatique exacte, il y a des cas qui sont meilleurs. C'est quelque chose sur lequel on travaille et que l'on ne comprend pas complètement. "

"J'aime beaucoup travailler avec des enseignantes. Nous avons mis en place un groupe avec les filles de la faculté et nous avons partagé les expériences. Et beaucoup disent, je n’étais pas encouragé, je pensais ne pas pouvoir programmer ", déclare Vidal Domínguez.

Ferrer souligne que, dans les années 60, les femmes étaient majoritaires en informatique. "Ensuite, vers les années 80, vers les années 90, le mouvement a commencé à s'inverser et il semble que cela a coïncidé avec le moment où le boom du jeu vidéo a commencé."

Et cela explique: "Pour une raison quelconque, ils ont fait du marketing pour les garçons et non pour les filles, mais l’ordinateur a soudainement commencé à ressembler à un produit destiné aux enfants. C'est une théorie impossible à prouver. "

Les linguistes intéressés par l'informatique

Vidal Domínguez exprime: "En terminant Letras, j'ai commencé à étudier à Exactas. J'ai approché Ferrer et il m'a proposé ce travail ". Ferrer ajoute: "C'est le projet idéal pour un linguiste qui veut faire du calcul."

L’étudiant dit: «Pour nous, cette année, c’était très difficile d’obtenir des bourses d’études en général. Il était difficile pour moi d'obtenir une bourse d'études du CONICET. Ce qui m'arrive avec Google, c'est la validation qu'en tant que linguiste, je peux faire un travail en informatique. "

En outre, il assure qu'il y a beaucoup de gens qui veulent faire de l'informatique linguistique en Argentine. "Il existe un groupe de la Faculté des lettres qui s’associe et étudie seul. Ils font un travail incroyable. Ils étudient des statistiques par eux-mêmes, ils s'inscrivent à des cours, mais c'est très informel ", ajoute-t-il.

Ferrer dit: "C'est une race naissante, il n'y a pas de programme de linguistique informatique établi."

Vidal Domínguez dit qu'il acquiert une nouvelle façon de penser. "J'apprends la programmation, vous devez pratiquer. Dans les cours de faculté, nous utilisons les langages C ++ et Phyton ", explique-t-il.

Outre Ferrer et Vidal Domínguez, un autre duo argentin a été récompensé au LARA. Juan Pablo Galeotti et Iván Arcushin (également de 1CC) se sont distingués par leur solution appelée Evolutiz. C'est un système qui localise les erreurs dans les applications Android.

L’annonce des lauréats a eu lieu à Belo Horizonte, où l’unique centre d’ingénierie de Google est situé en Amérique latine. 130 ingénieurs de différents pays d'Amérique latine y travaillent. Comme Berthier Ribeiro Neto l’a fait remarquer à Infobae, directeur technique de Google pour l’Amérique latine, prévoit de porter ce nombre à 200 au cours de la prochaine année.

[ad_2]
Source link