|
|
|
Session MA11 - Exploration de données I / Data mining I
Day |
Monday, May 09, 2005 |
Location |
Van Houtte |
Chair |
François Bellavance |
Presentations
10h30 AM |
Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit
|
|
Adil Belhouari, HEC Montréal
Avec l’évolution et les changements qui ont caractérisé le contexte économique, financier et juridique, nous avons remarqué q’au cours des cinq dernières années, la mesure et la gestion du risque de défaut ont pris de plus en plus d'importance dans l'industrie bancaire, suscitant le développement de nouveaux outils et moyens permettant de minimiser les pertes. L’objectif principal de notre étude est d'évaluer, dans une optique comparative, la performance prédictive d’un ensemble de méthodes de prévision de types paramétrique et non paramétrique pour modéliser et prédire le phénomène de faillite des entreprises. Ainsi, notre hypothèse de base est que, globalement, les méthodes non paramétriques performent mieux que celles paramétriques en matière de prédiction. Notre recherche se démarque, donc, des travaux qui ont précédé par l’utilisation de nouvelles techniques appelées méthodes d’ensemble telles le Bagging et le Boosting. En définitive, les résultats des différents modèles développés confirment parfaitement nos hypothèses de départ. Ainsi, les résultats obtenus ont présenté, généralement, une très bonne qualité de prédiction à travers des taux de bonne classification dépassant 90% dans la plupart des cas. Ils ont démontré, aussi, une sensitivité plus élevée chez les méthodes d’ensemble basées sur le Bagging et sur le Boosting.
|
10h55 AM |
Prédiction des absences pour troubles de santé mentale : le cas d’une grande entreprise québécoise |
|
Annie Simard, HEC Montréal
Il est communément admis que l'absentéisme au travail, principalement les invalidités pourvues d'un diagnostic médical, constitue l'un des enjeux majeurs auxquels sont confrontées les organisations, notamment en raison des lourdes conséquences qu'il occasionne en terme de productivité et de qualité du travail. L’objectif de cette recherche est d’obtenir un modèle de prédiction des absences avec un diagnostic de troubles de santé mentale à l'aide de données administratives objectives. Les analyses menées à partir des banques de données des ressources humaines d’une grande entreprise de plus de 20 000 employés nous amènent à conclure qu'un des facteurs prédominants des absences pour troubles de santé mentale sont les antécédents d'absentéisme dans l’année précédente ainsi que la fréquence d'absences sans diagnostic. Des variables liées aux mesures administratives telles que le nombre d’affectations différentes, la présence d'une rétrogradation ou d'une promotion obtenue au cours de l'année précédente ainsi que certaines variables socio-démographiques tels que le sexe, les funérailles d’un proche, un retour prématuré d’un congé de maternité ou d’un congé sans traitement et l’ancienneté sont également liées à la probabilité de s’absenter pour troubles de santé mentale. Finalement, le dernier type de poste occupé interagit avec le sexe et la présence d’une promotion pour prédire l'apparition d'absentéisme ultérieur pour cause de santé mentale.
|
11h20 AM |
Modélisation de la gravité des blessures des occupants des véhicules impliqués dans une collision latérale |
|
Younes Draoui, HEC Montréal
Les collisions latérales sont moins étudiées que les collisions frontales. De plus, des mesures de protection latérale des passagers dans les véhicules sont en développement et leur efficacité n’est pas encore bien analysée. Aucune étude populationnelle portant sur les collisions latérales n’a eu lieu au Canada et Transports Canada ainsi que la Société de l’assurance automobile du Québec sont très intéressé par ce genre de recherche. Cette étude consiste à appliquer des techniques du data mining, à savoir les arbres de classification, sur un ensemble des collisions latérales survenues au Québec lors de l’année 2002 et impliquant deux véhicules passagers ou camions légers. L'objectif est d'évaluer les effets des dispositifs de sécurité, comme la ceinture de sécurité et les sacs gonflables, sur la sécurité des passagers, tout en tenant compte des facteurs externes qui peuvent affecter la sévérité d’une collision. Plus spécifiquement, ce travail vise l’atteinte de deux objectifs principaux concernant les victimes des véhicules percutés : 1) la modélisation de la gravité des blessures liées aux collisions latérales ; 2) la prédiction de la région anatomique de la blessure la plus grave pour les victimes impliquées dans une collision latérale.
|
11h45 AM |
Étude des exécutions et des annulations des commandes dans le système Island |
|
Abdessamad Dine, HEC Montréal
La présente recherche étudie les effets des caractéristiques des commandes à cours limité et les conditions du marché d’abord sur leur probabilité d’exécution et ensuite sur leurs risques d’exécution et d’annulation. Pour ce faire, différentes méthodes statistiques sont utilisées et les modèles obtenus servent de base à l’interprétation. Les données proviennent du système Island, un des réseaux de communication électronique qui en 2000 ont exécuté plus de 25,8% des transactions du marché Nasdaq. Ces données qui s’étalent de janvier 1999 à octobre 2002, comptent toutes les commandes à cours limité placées, leurs exécutions et leurs annulations. Ainsi un modèle de régression logistique à été ajusté pour prédire la probabilité d’exécution des commandes à cours limité étant données les caractéristiques des commandes qui sont le prix, la taille, le type de transaction (achat ou vente) et les conditions du marché au moment du placement de la commande à savoir la fourchette des prix qui est l’écart entre l’offre la plus basse et la demande la plus élevée et la volatilité précédant le placement de la commande. Ensuite un modèle d’analyse de la durée de vie à risques compétitifs a été développé pour étudier le risque d’exécution et le risque d’annulation de la commande à cours limité sachant les mêmes facteurs précédemment cités.
Ainsi nous avons pu établir avec le modèle LOGIT que lorsque le cours limité s’éloigne du cours opposé, la probabilité d’exécution d’une commande à cours limité baisse. Nous avons également établi que lorsque la volatilité s’intensifie, ses chances d’exécution augmentent. Nous avons par ailleurs trouvé que l’élargissement de la fourchette des prix a un effet négatif sur la probabilité d’exécution des commandes à cours limité. Enfin nous avons pu établir que tous ces effets s’amplifient quand il s’agit de grandes commandes en comparaisons aux petites commandes. Quant aux résultats de l’analyse de la durée de vie à risques compétitifs à savoir le risque d’exécution et le risque d’annulation, ils sont venus confirmer ce qui a été obtenu par le modèle LOGIT et ils se présentent comme suit : les petites commandes ont des risques plus élevés d’exécution et d’annulation que les grandes commandes. En plus, plus le cours limité s’approche du cours opposé, plus les risques d’exécution et d’annulation augmentent. L’élargissement de l’écart entre l’offre la plus basse et la demande la plus élevée (fourchette des prix) fait que le risque d’exécution baisse tandis que celui d’annulation augmente. Enfin nous avons trouvé que lorsqu’il existe beaucoup de fluctuations (volatilité), les risques d’exécution et d’annulation des commandes augmentent.
|
|