Session MA10 - Exploitation de données / Data-Mining
Day Monday, May 7, 2007 Room Demers Beaulne Chair Gilles Caporossi
Presentations
10h30 AM- 10h55 AM |
Arbre multivarié pour variables de réponses mixtes |
Abdessamad Dine, HEC Montréal Denis Larocque, GERAD et HEC Montréal, Méthodes quantitatives de gestion François Bellavance, GERAD et HEC Montréal, 3000, chemin de la Côte-Ste-Catherine, Montréal, Québec, Canada, H3T 2A7 Les méthodes de construction d’arbres de régression ou de classification multivariées existantes peuvent traiter un seul type de variable réponse à la fois, soit elles sont toutes continues (ordinales), soit toutes nominales. Nous présenterons une méthode de construction d’arbres multivariés adaptée à la situation où un mélange de variables réponses continues et nominales est présent. Le critère de séparation adopté est basé sur le modèle général de location (GLOM). Nous présenterons les résultats d’une analyse par simulation ainsi que des exemples avec des données réelles. |
10h55 AM- 11h20 AM |
Arbres de régression pour données longitudinales |
Saad-Ellah SE. Berhili, HEC Montréal, Méthodes quantitatives de gestion, 3000, chemin de la Côte-Sainte-Catherine, Montréal, Québec, Canada, H3T 2A7 François Bellavance, GERAD et HEC Montréal, 3000, chemin de la Côte-Ste-Catherine, Montréal, Québec, Canada, H3T 2A7 Une nouvelle méthode de classification des données longitudinales par arbre est présentée. Non seulement elle traite le cas où le vecteur des variables dépendantes est continu mais aussi le cas discret (binaire, compte). Cette méthode combine les avantages des modèles paramétriques (GEE) à ceux des arbres de régression (RECPAM). Une comparaison avec des techniques similaires antérieures (Segal, 1992) sera aussi présentée. |
11h20 AM- 11h45 AM |
Exact Methods for Minimum Sum-of-Squares Clustering: A Survey |
Daniel Aloise, GERAD et École Polytechnique de Montréal, Mathématiques et génie Industriel, C.P. 6079, Succ. Centre-Ville, Montréal, Québec, Canada, H3C 3A7 Pierre Hansen, GERAD et HEC Montréal, Méthodes quantitatives de gestion, 3000, chemin de la Côte-Sainte-Catherine, Montréal, Québec, Canada, H3T 2A7 Minimum sum-of-squares clustering consists in partitioning a given set of N entities into M clusters in order to minimize the sum of squared distances from the entities to the centroid of their cluster. We present a survey, with some new results, of the state-of-art and quite diverse exact methods for solving this problem. |
11h45 AM- 12h10 PM |
Forecasting Rail Transportation Demand Using Artificial Neural Networks |
Shadi Sharif Azadeh, École Polytechnique de Montréal, Applied mathematics and industrial engineering, Montréal, Québec, Canada Richard Labib, École Polytechnique de Montréal, Applied mathematics and industrial engineering, Montreal, Quebec, Canada Gilles Savard, GERAD et École Polytechnique de Montréal, Mathématiques et génie industriel, C.P. 6079, Succ. Centre-ville, Montréal, Québec, Canada, H3C 3A7 We consider in this talk the forecasting of the demand for a major rail operator. A supervised artificial neural network, namely a Multi-Layer Perceptron (MLP), is used along with the backpropagation learning algorithm. Significant data pre-processing is achieved in order to incorporate feed-forward inputs such as time of purchase, date of departure, prices, products and physical classes. Numerical results show good generalization since the predictions are within 8% of the targeted values. |