EN FR

Gestion des données océanographiques de prochaine génération et analytique de données massives

Les chercheurs en science océanique se fient de plus en plus à l’analyse évoluée des données dans le cadre de leurs pratiques de recherches au quotidien. Les données océanographiques posent généralement tous les défis liés aux caractéristiques des données massives, c.-à-d. le volume, la vélocité, la variété et la véracité. Il en résulte également des enjeux supplémentaires relativement aux hauts niveaux de bruit et de manipulation humaine des données, à la dispersion spatio-temporelle dans certaines régions clés du globe et à la difficulté d’intégrer les données en longue série chronologique. Nous proposons un programme de recherche qui abordera certains défis dans l’analytique des données et la gestion des données pour deux types importants de données océanographiques. Nous nous fonderons sur l’expertise collective et les ressources des candidats en analytique de données, en apprentissage machine et en gestion de données ainsi que sur l’expertise de leurs collaborateurs en sciences océanographiques de plusieurs laboratoires gouvernementaux et universitaires. Tout d’abord, nous adapterons un algorithme d’apprentissage machine de pointe à l’analyse des données du SIA, comme le regroupement de la trajectoire, la classification, la prédiction et la segmentation (des navires). Ensuite, nous élaborerons des algorithmes d’apprentissage machine de pointe afin de traiter les données génomiques des océans. Enfin, nous ferons avancer l’état de la gestion des données en matière de recherche et surtout les méthodes d’intégration des données pour appuyer la recherche proposée plus haut quant à l’analytique des données.

Chercheur Principal

Stan Matwin, Chaire de recherche du Canada en analyse des textes visuels, Dalhousie University