Subventions et des contributions :
Subvention ou bourse octroyée s'appliquant à plus d'un exercice financier. (2017-2018 à 2018-2019)
ZEROSPAM est une compagnie montréalaise spécialisée dans le filtrage de courriel. De façon très spécifique,x000D
la compagnie offre un service de gestion des courriels entrants permettant de filtrer les pourriels. Il faut savoirx000D
qu'aujourd'hui le pourcentage de courriel indésirable approche le 90%. Pour effectuer le filtrage ZEROSPAMx000D
utilise en ce moment les métadonnées et une approche générique pour analyser le contenu des courriels.x000D
L'objectif de ce projet est d'augmenter significativement la qualité de la détection basée sur le contenu.x000D
La classification de texte court comme les courriels et les microbillets est un domaine de recherche actif enx000D
traitement des langages naturels. Le défi principal et propre au pourriel consiste en un contexte adversériel. Lesx000D
producteurs de pourriel sont au fait des approches naïves qui permettent d'éliminer leurs messages et lesx000D
systèmes de classification doivent de ce fait, être de plus en plus raffinés.x000D
L'approche que nous allons utiliser repose sur des techniques de pointe en apprentissage profond. Lesx000D
techniques connexionnistes ont obtenu de très bons résultats au niveau de la modélisation du langage et dansx000D
des tâches concrètes comme la traduction automatique. L'approche que nous préconisons est basée sur lesx000D
plongements vectoriels. Cette approche est basée sur une représentation vectorielle du vocabulaire ou la notionx000D
de distance est à la fois euclidienne et sémantique. Les techniques que nous allons développer ont le potentielx000D
d'être utiles pour toute sorte de problèmes de classification comme l'analyse de sentiment, la classification parx000D
thème, à la fois dans les courriels, les bulletins de nouvelles et les micros billets.