{"id":105578,"date":"2020-11-24T05:37:58","date_gmt":"2020-11-24T10:37:58","guid":{"rendered":"https:\/\/linitiative.ca\/International\/intelligence-artificielle-tunizi-un-dataset-pour-lanalyse-du-sentiment-en-dialecte-tunisien\/"},"modified":"2020-11-24T05:37:58","modified_gmt":"2020-11-24T10:37:58","slug":"intelligence-artificielle-tunizi-un-dataset-pour-lanalyse-du-sentiment-en-dialecte-tunisien","status":"publish","type":"post","link":"https:\/\/linitiative.ca\/International\/intelligence-artificielle-tunizi-un-dataset-pour-lanalyse-du-sentiment-en-dialecte-tunisien\/","title":{"rendered":"Intelligence artificielle : \u201cTUNIZI\u201d, un dataset pour l\u2019analyse du sentiment en dialecte tunisien"},"content":{"rendered":"<p>Reconna\u00eetre vocalement un mot du dialecte tunisien comme par exemple le mot \u201c3asselama\u201d et le traduire facilement et correctement sur Google, en anglais ou en d\u2019autres langues, pourrait \u00eatre d\u00e9sormais possible.<\/p>\n<p>C\u2019est l\u2019un des objectifs du projet de \u201cdataset\u201d baptis\u00e9 \u201cTunizi\u201d, et d\u00e9velopp\u00e9 par la start-up tunisienne iCompass, sp\u00e9cialis\u00e9e dans l\u2019intelligence artificielle, plus particuli\u00e8rement dans le domaine du traitement du langage naturel (TLN).<\/p>\n<p>Il s\u2019agit d\u2019une base de donn\u00e9es qui comporte 9 000 phrases \u00e9crites en dialecte tunisien et qui regroupe le premier grand ensemble de donn\u00e9es d\u2019analyse du sentiment, utilis\u00e9 sur les r\u00e9seaux sociaux.<\/p>\n<p>La finalit\u00e9 du projet et bien d\u2019autres en voie de d\u00e9veloppement en Afrique et dans le monde arabe est de cr\u00e9er des bases de donn\u00e9es annot\u00e9es et d\u00e9velopper et soumettre des ensembles de donn\u00e9es de tout dialecte sous-desservi et sous-repr\u00e9sent\u00e9 en vue de les utiliser dans les futures applications de NLP comme la traduction automatique, les agents conversationnels (Chatbot) ou la reconnaissance vocale.<\/p>\n<p>Pour l\u2019intelligence artificielle, cette d\u00e9marche est n\u00e9cessaire parce que les ensembles de donn\u00e9es annot\u00e9s conditionnent d\u00e9sormais la r\u00e9ussite des algorithmes utilis\u00e9s comme base d\u2019apprentissage.<\/p>\n<p><strong>De l\u2019Arabizi \u00e0 \u201cTunizi\u201d<\/strong><\/p>\n<p>En effet, les internautes adeptes des r\u00e9seaux sociaux et du \u201cchat\u201d dans le monde arabe ont tendance \u00e0 s\u2019exprimer, dans leurs dialectes locaux, auxquels les \u00e9gyptiens ont choisi le nom \u201d Arabizi \u201c, un mot prononc\u00e9 en arabe en mixant arabe et anglais (\u00c7\u00e4\u00cc\u00e1\u00ed\u00d2\u00ed+\u00da\u00d1\u00c8\u00ed) .<\/p>\n<p>Les \u00e9tudes analytiques cherchent \u00e0 explorer et \u00e0 reconna\u00eetre les opinions en ligne dans le but de les exploiter \u00e0 des fins de planification et de pr\u00e9diction telles que la mesure de la satisfaction du client et l\u2019\u00e9tablissement de strat\u00e9gies de vente et de marketing. Cependant, ces \u00e9tudes bas\u00e9es sur le Deep Learning sont gourmandes en donn\u00e9es.<\/p>\n<p>Or, les langues et dialectes africains y compris le dialecte tunisien, sont consid\u00e9r\u00e9s comme des langues \u00e0 faibles ressources.<\/p>\n<p>Jusqu\u2019\u00e0 ce jour, il n\u2019existe aucun ensemble de donn\u00e9es de taille significative annot\u00e9es sur le dialecte tunisien, selon iCompass.<\/p>\n<p>Dans une enqu\u00eate r\u00e9alis\u00e9e en 2018 pour \u00e9valuer la disponibilit\u00e9 des ensembles de donn\u00e9es du dialecte tunisien, cit\u00e9e par iCompass, les auteurs ont conclu que tous les ensembles de donn\u00e9es tunisiens existants utilisent des lettres arabes et qu\u2019il y a un manque d\u2019ensembles de donn\u00e9es annot\u00e9s sur l\u2019Arabizi tunisien.<\/p>\n<p>En 2014, un recueil multidialectal de cinq dialectes arabes (\u00e9gyptien, tunisien, jordanien, palestinien et syrien) afin d\u2019identifier les similitudes et les diff\u00e9rences possibles entre eux, les r\u00e9sultats ont r\u00e9v\u00e9l\u00e9 que le dialecte tunisien a le moins de ressources et qu\u2019il est n\u00e9cessaire de cr\u00e9er des ensembles de donn\u00e9es tunisiens pour des \u00e9tudes analytiques.<\/p>\n<p><strong>Rendre le dialecte tunisien assimilable par les syst\u00e8mes informatiques<\/strong><\/p>\n<p>Concr\u00e8tement, iCompass a proc\u00e9d\u00e9 \u00e0 la collecte de donn\u00e9es \u00e0 partir des commentaires sur le r\u00e9seau social Youtube.<\/p>\n<p>Les vid\u00e9os choisies comprenaient des sports, de la politique, de la com\u00e9die, des \u00e9missions de t\u00e9l\u00e9vision, des s\u00e9ries t\u00e9l\u00e9vis\u00e9es, des arts et des vid\u00e9os musicales tunisiennes de sorte que l\u2019ensemble de donn\u00e9es soit repr\u00e9sentatif et contienne diff\u00e9rents types d\u2019\u00e2ge, de formation, d\u2019\u00e9criture, etc.<\/p>\n<p>Selon Ahmed Nouisser, co-fondateur et CEO d\u2019iCompass, \u201cle principe g\u00e9n\u00e9ral est d\u2019offrir \u00e0 l\u2019\u00e9cosyst\u00e8me tunisien, maghr\u00e9bin et africain plus de datas annot\u00e9s, appel\u00e9s \u201cdatasets\u201d, pour les exploiter dans le d\u00e9veloppement des recherches (sociales, scientifiques, humaines et autres\u2026) \u201c.<\/p>\n<p>\u201d Notre r\u00f4le est de travailler sur les langues et dialectes en Afrique pour rapprocher les peuples du continent \u00e0 l\u2019\u00e9volution technologique et \u00e0 l\u2019innovation \u201c, a-t-il dit.<\/p>\n<p>Il a expliqu\u00e9 \u00e0 TAP, que l\u2019intelligence artificielle ne peut se d\u00e9velopper que s\u2019il existe des datas annot\u00e9es d\u2019une taille significative, organis\u00e9es et pr\u00e9cises.<\/p>\n<p>La start-up tunisienne \u0153uvre, \u00e0 cet effet, \u00e0 d\u00e9velopper Tunizi pour le rendre un tr\u00e8s large Dataset annot\u00e9 et le mettre \u00e0 la disposition des chercheurs, des universit\u00e9s et d\u2019autres structures d\u2019analyses \u00e0 travers les syst\u00e8mes informatiques et l\u2019intelligence artificielle, a encore indiqu\u00e9 Ahmed Nouisser.<\/p>\n<div class=\"wp-post-author-wrap wp-post-author-shortcode left\">\n<h3 class=\"awpa-title\"\/>\n<div class=\"wp-post-author\">\n<div class=\"awpa-img awpa-author-block square\"><a href=\"http:\/\/lexpertjournal.net\/fr\/?author=5\"><img loading=\"lazy\" decoding=\"async\" alt=\"\" src=\"http:\/\/0.gravatar.com\/avatar\/97f8e10a1c1125ba104a76514ee07b16?s=150&amp;d=mm&amp;r=g\" srcset=\"http:\/\/0.gravatar.com\/avatar\/97f8e10a1c1125ba104a76514ee07b16?s=300&amp;d=mm&amp;r=g 2x\" class=\"avatar avatar-150 photo\" height=\"150\" width=\"150\"\/><\/a><\/div>\n<\/div>\n<\/div>\n<aside class=\"mashsb-container mashsb-main mashsb-stretched\">\n<\/aside>\n<p>Auteur: L&rsquo;expert<br \/>\n<a href=\"http:\/\/lexpertjournal.net\/fr\/?p=17354\">Cliquez ici pour lire l&rsquo;article depuis sa source.<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Reconna\u00eetre vocalement un mot du dialecte tunisien comme par exemple le mot \u201c3asselama\u201d et le traduire facilement et correctement sur Google, en anglais ou en d\u2019autres langues, pourrait \u00eatre d\u00e9sormais possible. C\u2019est l\u2019un des objectifs du projet de \u201cdataset\u201d baptis\u00e9 \u201cTunizi\u201d, et d\u00e9velopp\u00e9 par la start-up tunisienne iCompass, sp\u00e9cialis\u00e9e dans l\u2019intelligence artificielle, plus particuli\u00e8rement dans [&hellip;]<\/p>\n","protected":false},"author":1775,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"fifu_image_url":"","fifu_image_alt":"","footnotes":""},"categories":[78,55],"tags":[],"class_list":["post-105578","post","type-post","status-publish","format-standard","hentry","category-economie","category-tunisie"],"_links":{"self":[{"href":"https:\/\/linitiative.ca\/International\/wp-json\/wp\/v2\/posts\/105578","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/linitiative.ca\/International\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/linitiative.ca\/International\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/linitiative.ca\/International\/wp-json\/wp\/v2\/users\/1775"}],"replies":[{"embeddable":true,"href":"https:\/\/linitiative.ca\/International\/wp-json\/wp\/v2\/comments?post=105578"}],"version-history":[{"count":0,"href":"https:\/\/linitiative.ca\/International\/wp-json\/wp\/v2\/posts\/105578\/revisions"}],"wp:attachment":[{"href":"https:\/\/linitiative.ca\/International\/wp-json\/wp\/v2\/media?parent=105578"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/linitiative.ca\/International\/wp-json\/wp\/v2\/categories?post=105578"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/linitiative.ca\/International\/wp-json\/wp\/v2\/tags?post=105578"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}