Effet des langues multidialectiques sur la reconnaissance vocale Trop de choix peut faire mal
##plugins.themes.bootstrap3.article.main##
Résumé
Des recherches ont montré que les performances de la reconnaissance automatique de la parole (ASR) diminuent généralement lorsqu'elles sont évaluées sur une variation dialectale de la même langue qui n'a pas été utilisée pour entraîner ses modèles. De même, les modèles formés simultanément sur un groupe de dialectes ont tendance à être moins performants que les modèles spécifiques à un dialecte. Lorsque vous essayez de décider quel modèle spécifique au dialecte (reconnaissance) utiliser pour décoder un énoncé (par exemple, une requête de recherche vocale), les stratégies possibles incluent la détection automatique du dialecte parlé ou le suivi des préférences linguistiques de l'utilisateur telles que définies sur son téléphone portable. Dans cet article, nous observons que les requêtes de recherche vocale des utilisateurs sont généralement dirigées vers un outil de reconnaissance spécifique au dialecte qui ne correspond pas à l'emplacement actuel de l'utilisateur, et nous présentons une étude qui montre que la sélection automatique du outil de reconnaissance en fonction de l'emplacement géographique de l'utilisateur contribue à améliorer l'expérience utilisateur. expérience.
##plugins.themes.bootstrap3.article.details##
Références
M.Zissman et al. Automatic dialect identification of extemporaneous conversational.Latin American Spanish speech.ICASSP1996, pp.777-780.
W.Shen, N.Chen , and D.Reynolds.Dialect recognition using adapted phonetic models, INTERSPEECH 2008.PP.763-766.
F.Biadsy , J.Hirschberg and N.Habash, spoken Arabic Dialect Identification using phonotactic modeling. EACL 2009 WORKSHOP on computational study on hamburg and berlin german, Language and speech 45.2(2002), pp.115-138.
R.Hamdi et al . Speech timing and rhythmic structure in Arabic dialect: a comparaison of two approaches , interspeech 2004.
F.Biadsy , Automatic Dialect and accent recognition and its application to speech recognition, phd thesis, Columbia u,, 2011.
F.Biadsy , and j.Hirschberg, Using prosody and phonotatics in Arabic dialect identification, INTERSPEECH2009.
S.Ghazali, R.Hamdi, and M.Barkat, Speech rhythm variation in Arabic dialect, International conference on speech prosody,2002.
M.Belgacem ,G.Antoniadis, and L.Besacier, Automatic identification of Arabic dialects, LREC2010.
Lopez-Moreno, J.Gonzalez-Dominguez, O.plchot, D.Martinez, J.Gonzalez-Rodriguez, and P.Moreno ,Automatic language identification using long short-term memory recurrent neural networks, Interspeech 2014,pp.2155-2159.