Titre :
Apprentissage par renforcement avec actions, temps et espace d’état continus
Numéro de l’entente :
962712
Valeur d'entente :
199 870,00 $
Date d'entente :
17 déc. 2020 - 1 sept. 2024
Description :
La capacité d’un système autonome à s’adapter et à apprendre en ligne de manière utile est un objectif souhaitable pour tout projet de véhicule autonome, en particulier en ce qui concerne le transport autonome de marchandises à l’aide de l’intelligence artificielle (IA) dans des environnements qui comportent de nombreux obstacles. Par ailleurs, tout objectif de projet d’autonomie requiert des systèmes décisionnels qui exploitent cette information visuelle. Ce projet permettra d’étudier, de développer et de démontrer des algorithmes et des systèmes décisionnels basés sur des véhicules autonomes qui pourraient être déployés entre autres sur des systèmes d’avions sans pilote. Bien qu’il existe des algorithmes de prise de décision autonome et d’apprentissage de renforcement en cours de développement actif dans la communauté de recherche, il y a deux raisons d’entreprendre ce projet particulier. Premièrement, le nouveau système de représentation temporelle des unités de mémoire de Legendre (LMU) n’a jamais été appliqué à cette tâche, et il a été démontré que la LMU produit des ordres de grandeur d’amélioration par rapport aux méthodes traditionnelles. Deuxièmement, le système de calcul résultant de ces méthodes pourrait probablement être efficacement mis en œuvre dans le matériel moderne, y compris les processus graphiques (GPU), les unités de traitement de tenseur (TPU) et le calcul neuromorphique.
Organisation :
Conseil national de recherches Canada
Résultats prévus :
À court terme, les résultats prévus seront des collaborations renforcées entre l'industrie, le milieu universitaire et le gouvernement pour soutenir l'excellence en recherche. À moyen terme, les résultats attendus seront le développement de nouvelles technologies potentiellement perturbatrices avec des collaborateurs. À long terme, trouver des solutions collaboratives aux défis des politiques publiques et créer des systèmes d'innovation plus solides.
Location :
Waterloo, Ontario, CA N2L 3G1
Numéro de référence :
172-2020-2021-Q3-962712
Type d'entente :
subvention
Type de rapport :
Subventions et des contributions
Numéro d'entreprise du bénéficiaire :
119260685
Recipient Type:
établissement universitaire et institution publique
Informations supplémentaires :
Cet accord a été modifié 1 fois. La date de fin du présent accord a été changé de 365 jours.
Date de modification
17 août 2023
Nom légal du bénéficiaire :
University of Waterloo
Circonscription fédérale :
Waterloo
Numéro de la circonscription fédérale :
35112
Programme :
Programme de collaboration en science, en technologie et en innovation - Initiatives de collaboration en R-D
But du programme :
Collaborer à des programmes multipartites de recherche-développement dans le but de profiter de la synergie entre la recherche transformatrice à haut risque et à haut rendement et le potentiel de découvertes scientifiques et de percées technologiques révolutionnaires dans des secteurs d’intervention prioritaires.
Identificateur du SCIAN :
541710