Projet d'Apprentissage Machine sur la base de donnée de biodégradation de QSAR
https://docs.google.com/document/d/1H8C6HbhIP9fU857YAoo-OSMsLzaYUhloz6EanyzS8AU/edit
stats descriptives basiques : Tue, correction : Khoi et Thang
Réponse aux analyses exploratoires des données : Khoi (attention : l’importance des variables sont pour interpréter pour les paragraphes suivantes)
un modèle de régression logistique avec sélection de variables avec/sans pénalisation : Thai
un modèle de régression logistique sans sélection de variables avec/sans pénalisation : Thai
un SVM : Thang
un arbre optimal : khoi
une forêt aléatoire : khoi
boosting : Thang
réseaux de neurones : Thai
Comparer les modèles : Tue (déjà code de base cf Thang)
Comme livrable, vous rendrez un rapport au format pdf ne dépassant pas 30 pages. Il doit comprendre une introduction, une description succincte des algorithmes utilisés, une interprétation des résultats, une conclusion, etc. De plus, vous rendrez deux notebooks Jupyter, un en R et un en Python, incluant les sorties des codes.
N’oubliez pas de commenter votre code.
MAIN (avec analyses preliminaires et premiers variables) :
Khoi : Thang : Thai : Tue :