Dans le monde médical, l'accident vasculaire cérébral (AVC) est l'une des principales maladies qui menacent la vie humaine. Les causes de décès les plus courantes dans le monde sont les accidents vasculaires cérébraux, les maladies cardiaques et le cancer. Heureusement, les accidents vasculaires cérébraux peuvent être évités si les patients à haut risque sont identifiés avant la survenue d'un accident vasculaire cérébral. Un diagnostic médical pour la prédiction d'un accident vasculaire cérébral est un processus complexe. Toutefois, des algorithmes d'apprentissage automatique peuvent être utilisés pour faciliter la prédiction de l'AVC dans les premiers stades. La performance des algorithmes de classification dépend d'un ensemble de données équilibré. Cette étude vise donc à mettre en oeuvre des techniques de données déséquilibrées telles que le sous-échantillonnage, le suréchantillonnage et des techniques hybrides pour améliorer la performance des modèles de classification.