Quelles difficultés d’accès des ménages les plus pauvres au parc social ?
Synthèse du Rapport au Défenseur des droits
Résumé : les ménages modestes sont désavantagés dans l’accès au logement social
Cette étude s’inscrit à la fois dans une réflexion de long terme menée par le Défenseur des droits sur le processus d’attribution des logements sociaux et également dans le prolongement d’un certain nombre de recherches ayant révélé les difficultés d’accès au parc social des ménages les plus modestes. Nous y exploitons une version inédite des données du Système national d’enregistrement de la demande (SNE), une reconstruction de l’offre disponible ainsi que des techniques économétriques avancées basées sur le machine learning et le ré-échantillonnage, afin de qualifier et de quantifier l’impact du niveau de ressources des ménages sur leur probabilité d’accéder au parc social.
Si les demandeur·euse·s les plus pauvres ont bien accès à un parc de logements plus réduit, notamment en zones tendues, cela ne suffit à expliquer leur plus faible probabilité d’attribution.
Une fois contrôlée de l’offre disponible mais aussi des caractéristiques des ménages (composition familiale, motif, priorisation, nombre d’enfants, nationalité, statut vis à vis de l’emploi, localisation de la demande…), les chances d’obtenir un logement social ont tendance à croître avec le niveau de vie. Autrement dit, toutes choses égales par ailleurs, plus les demandeur·euse·s sont pauvres moins ils ou elles ont de chance d’accéder au logement et ce indépendamment de leurs autres caractéristiques. Les difficultés sont particulièrement grandes pour les ménages déclarant moins de 800 euros de niveau de vie et encore plus importantes pour les ménages déclarant moins de 500 euros de niveau de vie.
En outre, les disparités territoriales sont importantes et nos résultats, appuyés par les entretiens menés auprès de certains acteurs du système d’attribution des logements, mettent en lumière d’importantes différences dans les choix d’attribution locaux.
Sans surprise, le niveau de tension locale et donc l’offre de logements disponibles déterminent en partie les choix opérés par les acteurs lors des attributions. La hiérarchisation de la demande apparaît également comme un facteur déterminant et ce en défaveur des ménages les plus précaires. Nous menons également une analyse par cas type afin de quantifier l’écart entre probabilité théorique et probabilité effective d’attribution. Ces résultats mettent en évidence la place importante dans le processus de désignation des candidats à un logmeent de la priorisation de la demande ainsi que des logiques de peuplement (présence d’enfants, différences territoriales, rôle de la nationalité…).
1 Introduction
Cette étude s’inscrit dans une réflexion de long terme menée par le Défenseur des droits sur le processus d’attribution des logements sociaux. Le décret n° 2011-176 du 15 février 2011 relatif à la procédure d’attribution des logements sociaux et au droit au logement opposable prévoit notamment qu’une convention de réservation doit être signée entre les réservataires1 et les bailleurs pour fixer les modalités pratiques des réservations. Il prévoit également que le contingent préfectoral intègre les bénéficiaires du DALO dans les publics cibles des accords collectifs intercommunaux ou départementaux d’attribution, de réviser à la hausse leurs objectifs et de relancer les plans départementaux d’actions pour le logement des personnes défavorisées, à l’occasion de l’intégration des plans départementaux d’accueil, d’hébergement et d’insertion des personnes sans domicile. Parallèlement, la loi du 25 mars 2009 instaure une obligation de relogement des salarié·e·s et des demandeur·euse·s d’emploi reconnu·e·s prioritaires par les commissions de médiation, à hauteur du quart des attributions effectuées sur le contingent des associés collecteurs. L’instauration de la transparence dans la gestion de la demande de logements sociaux contribue à améliorer le système des attributions : le système d’enregistrement des demandes de logement locatif social « numéro unique » a fait l’objet d’une réforme importante, par l’article 117 de la loi du 25 mars 2009 de mobilisation pour le logement et la lutte contre l’exclusion, modifiée par le décret du 29 avril 2010.
1 Les réservataires sont les partenaires de la construction des logements sociaux. Ils obtiennent en contrepartie une priorité de présentation de candidats pour le logement social.
Le nouveau système est entré en application le 28 mars 2011, comme le prévoyait la loi. Un formulaire national de demande de logement social est entré en vigueur le 1er octobre 2010. Cette réforme a consisté à mettre en place dans chaque département, ou dans la région Île-de-France, un nouveau dispositif informatique d’enregistrement des demandes qui s’est substitué à l’application « numéro unique ». Cette réforme avait pour but de simplifier les démarches du demandeur de logement et d’améliorer la transparence du processus d’attribution. Elle permet aujourd’hui de mieux quantifier et de mieux qualifier la demande de logement social.
Au 1er janvier 2022, la France comptait 5,3 millions de logements sociaux soit 700 000 logements de plus que 10 ans auparavant. Sur longue période, on observe une paupérisation importante des locataires du parc social. Un tiers des locataires en place vivent sous le seuil de pauvreté, proportion deux fois plus importante que celle observée pour la population générale. En outre, la part des ménages du 1er quartile de niveau de vie y a doublé en 40 ans. Cette paupérisation est alimentée à la fois par une plus grande précarité des ménages en place mais également par l’arrivée de nouveaux locataires plus modestes.
C’est pour mieux orienter les attributions de logement vers les ménages les plus modestes que la loi « Égalité et citoyenneté » impose un même quota d’attribution aux ménages reconnus prioritaires au titre du DALO à l’ensemble des contingents des collectivités territoriales et des bailleurs sociaux, mais aussi un quota d’attribution de logements sociaux de 25 % pour les ménages appartenant au premier quartile de revenu par UC des demandeur·euse·s (Q1) et pour les ménages relogés dans le cadre du Programme National de Rénovation Urbaine (PNRU). Dans un objectif de rééquilibrage territorial et de mixité sociale, ces attributions doivent être faites hors des Quartiers prioritaires de la Politique de la Ville (QPV) et hors Quartiers de Veille Active (QVA).
Pour autant, de nombreuses études ont mis en évidence un accès difficile des ménages modestes au parc social. En 2012, Liliane Bonnal et ses coauteurs ont mis en évidence des durées d’attente plus longues pour les ménages modestes (Bonnal, Boumahdi et Favard, 2012). En 2017, la Cour des comptes notait qu’en moyenne les demandeur·euse·s de logements sociaux avaient une chance sur 3,91 d’obtenir un logement alors que pour les ménages sous le seuil de pauvreté ce ratio de chance était d’un sur 4,25 et pour les ménages en grande précarité de logement celui-ci atteignait de un sur 5,92 (Cour des Comptes, 2017). En 2018, la Fondation Abbé Pierre pointait qu’alors que les demandeur·euse·s déclarant moins de 500€/mois de niveau de vie2 représentaient 15% des demandeur·euse·s, ces dernier·es ne pesaient que 10% des attributions de logement (Fondation Abbé Pierre, 2018). Ce décalage entre le profil des demandeur·euse·s et celui des attributaires était également mis en lumière par l’ANCOLS3 en 2022 qui notait qu’alors que les ressources des demandeur·euse·s se situaient majoritairement sous les plafonds PLAI4 les logements attribués se situaient eux en majorité à des niveaux de financements de type PLUS5 (Ancols, 2022). En 2020, une recherche menée par un groupe inter-associatif et appuyée par des chercheur·e·s a tenté d’objectiver et de caractériser les mécanismes d’exclusion, à l’œuvre dans le système d’attribution des logements du parc social, qui en bloquent l’accès aux ménages à faibles ressources (Portefaix et al., 2020). Notre analyse s’inscrit dans le prolongement de ces travaux.
2 Le niveau de vie est défini comme le revenu disponible (après impôt et en incluant les prestations sociales) divisé par les unités de consommation. Les unités de consommation suivent l’échelle d’équivalence et attribue 1 au premier adulte, 0.5 par adulte suivant et 0.3 par enfant de moins de 16 ans.
3 Agence Nationale de Contrôle du Logement Social, www.ancols.fr
4 logements donc la construction est financée par le Prêt locatif Aidé d’Intégration destiné aux locataires en grande précarité.
5 Logements dont la construction est financée par le Prêt Locatif à Usage Social, les locations Habitation à Loyer Modéré (HLM).
2 Méthodologie
L’objectif est à la fois de mettre à jour les résultats quantitatifs mis en lumière mais surtout de les étayer à travers notamment l’exploitation d’informations complémentaires sur les demandeur·euse·s. Pour ce faire, nous mobilisons une version non exploitée jusqu’à maintenant des données du système national d’enregistrement de la demande de la logement social (SNE) (voir encadré).
3 Les données du SNE
Le Système national d’enregistrement de la demande (SNE) centralise l’ensemble de la demande de logement social et ses caractéristiques ainsi que l’ensemble des attributions réalisées au cours de l’année précédente et les caractéristiques des ménages demandeur·euse·s. Dans le cadre de cette étude, nous avons eu accès à la base de données « exhaustive » du SNE rassemblant l’ensemble des demandes et l’ensemble des attributions de logement social sur longue période. Cette base regroupe l’ensemble des caractéristiques des demandeur·euse·s en mars 2022, telles qu’accessibles par les organismes décisionnaires de l’attribution de logement.
Nous limitons notre analyse à la période allant de mars 2021 à mars 2022, date de l’extraction de la base de données, afin de limiter la taille de notre population d’analyse et de conserver une cohérence des données entrées dans le SNE. En effet, le SNE est mis à jour au fur et à mesure des nouveaux dossiers ou de leur modification, sans qu’une archive ne soit conservée. Pour la période retenue, la base de donnée compte 3,4 millions de demandes de logement social. Parmi ces demandes, 2 288 679 sont toujours actives en mars 2022. Au cours des 12 mois écoulés, 47 840 demandeur·euse·s ont abandonné leur demande, 717 374 ne l’ont pas renouvelée et 391 484 attributions de logements ont été réalisées. Par la suite, nous comparerons ces demandeur·euse·s, appelé.e.s « attributaires », aux 3 millions de demandeur·euse·s étant « passé·e·s » par le SNE entre mars 2021 et mars 2022 mais auxquels aucun logement n’a été attribué sur la période.
Il est à noter qu’un consensus global a émané de l’ensemble des entretiens menés (voir Annexes méthodologiques) quant aux limites du SNE. D’une part, les acteurs et actrices du logement interrogé.e.s ont tous insisté sur le fait que les informations contenues dans le SNE étaient pour la plupart purement déclaratives. Dès lors, les erreurs ou les omissions peuvent être nombreuses. Certain·e·s demandeur·euse·s déclarent ainsi des revenus extravagants en raison d’erreurs de saisie et, en l’absence de vérification, ces demandes ne seront jamais examinées. Inversement, certains ménages déclarent des revenus très faibles (inférieurs au RSA), en raison d’erreurs de saisie, de complexité de leur situation financière et d’autres biais déclaratifs.
Il est ainsi plus que probable que certains ménages aux niveaux de vie très faible (inférieur au RSA) soit le fruit d’erreur de déclaration ou que, plus globalement, il existe à biais déclaratif concernant les revenus (corrigés ex post par les acteurs ou actrices au moment de la commission d’attribution). La complexité de l’inscription et de la mise à jour des informations a également été pointée, expliquant potentiellement la part importante de demande non renouvelées, observées dans le SNE, complexité qui est à même d’impacter plus spécifiquement les ménages les plus fragiles.
En outre, des doublons, très difficilement identifiables, peuvent persister malgré la mise en place du numéro unique de la demande en 2011. Ainsi, par exemple, il est possible, cela nous a été confirmé, que des demandeur.se.s ayant omis de renouveler leur demande soient réinscrit avec un nouveau numéro de demande et un nouveau numéro unique alors que leurs caractéristiques n’ont pas évolué. Dès lors nous observons plusieurs fois un même ménage sans le savoir. De même, lorsque plusieurs membres d’un même foyer dépose une demande nous ne sommes pas en capacité de le savoir. Si cette pratique est en théorie rare elle est parfois observée notamment dans le cas d’une mise en couple par exemple. Il est de même possible, malgré la mise en place du numéro unique, que des demandeur.se.s continuent de déposer des demandes lorsque par exemple ils ou elles souhaitent accéder au logement dans différentes villes. De surcroît, les responsables interrogés ont pointé du doigt le fait qu’il pouvait exister une forte hétérogénéité dans le profil des demandeur·euse·s inscrit·e·s au SNE, notamment avant la mise en place de la loi ALUR en 2014. A titre d’exemple, la métropole de Rennes citait les ménages à droits incomplets, un temps inscrits au SNE afin qu’ils puissent « capitaliser » leur durée d’attente. Cette pratique n’étant pas partagée par l’ensemble des collectivités, la comparaison entre territoires peut être perturbée.
Enfin, une autre limite du SNE a été mise en exergue par Paris habitat : l’existence, au sein des attributions, de ménages ayant obtenu un logement n’entrant pas tout à fait dans le champs du logement social et notamment des logements dits « intermédiaires » accordés par Action Logement. Ces logements, et les ménages qui y prétendent, ne peuvent être identifiés clairement dans les données mobilisées et constituent donc de potentiels doublons.
Outre les limites précitées, nous observons pour certain.e.s demandeur.se.s des durées d’attente extrêmement courtes. Les métropoles lyonnaises et parisiennes avancent plusieurs éléments pouvant expliquer ces temps d’attente en apparence très courts. D’une part, il semblerait que certain.e.s demandeur.se.s DALO soient désigné.e.s à l’attribution une fois leur demande expirée (i.e. non renouvelée). Dès lors, leur demande est alors « réactivée » pour l’attribution. Ce phénomène est à même d’expliquer les durées très courtes observées notamment pour certains ménages aux niveaux de vie très faibles. C’est également le cas des Accords collectifs départementaux, filière de priorisation des publics « prioritaires » qui visent à « accélérer » l’accès des ménages les plus fragiles. Pour les ménages moins précaires, les attributions réalisées au titre d’Action Logement sont à même d’être réalisées relativement rapidement. L’existence de ces mécanismes, et des limites décrites précédemment, rend complexe l’interprétation des durées d’attente observées dans le SNE. C’est en partie pourquoi cette analyse a été réalisée en parallèle de cette étude.
Afin de mettre en évidence les difficultés d’accès spécifiques aux ménages modestes, nous procéderons en quatre temps.
Nous analysons de façon purement descriptive les différences de niveaux de vie entre ménages demandeurs et ménages attributaires. L’avantage de cette première approche est qu’elle permet une vision d’ensemble et sans a priori quant à l’accès des ménages les plus pauvres au parc social. L’un des inconvénients à cette approche réside en l’absence de contrôle de l’effet des autres variables pouvant avoir une influence sur la probabilité d’accès au parc. C’est le cas des caractéristiques propres aux ménages (motif de la demande, composition familiale, …) mais également des caractéristiques locales de la demande.
Nous construisons un indicateur de tension pour chaque demandeur en comparant le nombre de logements auquel il peut prétendre – fonction de la taille de logement demandé, de sa catégorie de revenus et de la commune visée – au nombre de candidats demandant les mêmes logements – qui peuvent avoir des caractéristiques différentes. Ceci permet de définir une probabilité théorique, c’est-à-dire ignorant les caractéristiques des demandeur·euse·s hormis la taille de l’appartement, les dispositifs de plafonnement des loyers et la commune.
Nous proposons ensuite une modélisation de la probabilité d’accès au parc social, par tranche de niveau de vie. Cette méthode permet un raisonnement toutes choses égales par ailleurs. Il est en effet probable que des taux d’attribution plus bas dans le bas de la distribution soient en réalité révélateurs de caractéristiques différentes des demandeur·euse·s. Si par exemple les familles monoparentales sont sur-représentées au sein des ménages modestes et que ces dernières éprouvent des difficultés particulières à accéder au parc, nous devrions y observer des taux d’attribution plus bas alors même que la faiblesse du niveau de vie n’est ici pas en cause. Par contre, cette première phase économétrique ne renseigne que de façon imparfaite les interactions possibles entre variables. Pour reprendre notre illustration précédente, si ce n’est pas le fait d’être « pauvre » ou « une famille monoparentale » qui dégrade la probabilité d’accès au parc mais le fait de cumuler ces deux caractéristiques, le modèle linéaire mobilisé (logit linéaire) ne le met pas en évidence.
Afin de mettre en évidence ces possibles interactions nous mettons en œuvre une modélisation non linéaire de la probabilité d’attribution en utilisant un algorithme de machine learning. Cette méthode permet à la fois de révéler des effets marginaux « ignorés » par l’approche linéaire mais également d’intégrer plus de variables explicatives à notre modèle.
4 Les ménages les plus modestes sous représentés dans les attributions
Il ressort des premiers résultats descriptifs que les demandeur·euse·s déclarant moins de 600 euros de niveaux de vie sont sous représenté·e·s chez les attributaires par rapport à la place qu’ils ou elles occupent au sein de la demande. Alors qu’elles représentent 16,6% des demandes sur la période, elles se pèsent que 12,6% des attributions réalisées. A contrario, les niveaux de vie entre 600 et 750 euros et entre 1 000 et 1 500 euros semblent sur représentés au sein des attributaires (30,7% des demandeur·euse·s mais 34,5% des attributaires). Ce diagnostic, posé à l’échelle nationale, s’observe, de façon plus ou moins marqué, à l’échelle intercommunale .
L’analyse des taux d’attribution par tranche de niveau de vie confirme les difficultés d’accès des ménages les plus modestes. Au niveau national, les ménages déclarant moins de 500 euros par mois et par unité de consommation sont ceux connaissant le taux d’attribution le plus faible (inférieur à 12%). Ceux déclarant entre 500 et 600 euros de niveau de vie enregistrent un taux d’attribution (rapport du nombre d’attributaires et du nombre de demandeur·euse·s ayant connu une inscription au SNE au cours des 12 mois étudiés) de l’ordre de 15%. Les tranches de niveaux de vie supérieures voient eux leurs taux d’attribution osciller entre 17% et 19%. Bien que les hétérogénéités territoriales soient importantes, ces difficultés particulières des ménages modestes à accéder au parc social émergent dans l’ensemble des territoires analysés qu’ils connaissent des taux d’attribution globalement faibles (Paris, Lyon, Métropole du Grand Paris, Métropole de Nice) ou plus élevés (Métropole de Rouen, de Lille ou encore de Strasbourg) (Figure 1).
En moyenne, le taux d’attribution dans la métropole du Grand Paris (hors Paris et Plaine Commune) est de 8%. Celui des demandeur·euse·s ayant un niveau de vie de moins de 600 euros est inférieur à 5%. Dans la métropole de Rouen, qui enregistre un taux d’attribution moyen bien plus élevé (20%), les ménages ayant un niveau de vie inférieur à 600 euros accusent eux un taux d’attribution plus faible (17%).
Ces premiers résultats territorialisés battent en brèche l’idée que les demandeur·euse·s les plus modestes seraient concentré·e·s dans les zones les plus en tension ce qui, de fait, réduirait leur chance d’accéder au parc social. Néanmoins, il reste possible que les demandeur·euse·s du bas de la distribution des niveaux de vie soient très différents des autres demandeur·euse·s, en termes de composition familiale, de motif de la demande ou encore du statut résidentiel (plus de locataire du parc social par exemple). Pour contrôler de ces effets, il convient d’adopter une approche « toutes choses égales par ailleurs ».
4.1 Des résultats confirmés « toutes choses égales par ailleurs »
L’une des limites de l’analyse descriptive réside dans le fait que nous n’isolons pas spécifiquement un possible effet de la composition du parc de logements au niveau des communes. Autrement dit, ils ne disent rien sur le nombre de logements disponibles à l’échelle communale ni sur de possibles tensions spécifiques liées à la structure du parc de logements disponibles. Par exemple, il est possible que dans certaines communes, le parc de logement « très » sociaux disponibles soit insuffisant pour accueillir les demandeur·euse·s les plus modestes. Soit du fait d’un taux de rotation trop faible sur ce type de logement soit du fait d’un production insuffisante. Dès lors, les difficultés d’accès que nous mesurons seraient liées à une « incapacité » locale à loger les ménages les plus pauvres.
Afin de mieux appréhender ces possibles spécificités locales nous construisons un « indicateur de tension » pour chaque logement et chaque demande de logement de la période retenue (Section 8.2).
Pour l’estimer nous listons dans un premier temps pour chaque bien disponible les demandeur·euse·s éligibles. Dans notre cas, cela suppose d’apparier les demandes et les offres de logements sociaux en fonction des critères d’éligibilité généralement appliqués par les organismes. Il est alors possible d’estimer une probabilité « brute » ou « théorique » de se voir attribuer un logement social, en mettant toutes les demandes au même niveau, en posant un « voile d’ignorance » sur les caractéristiques des demandeur·euse·s. La carte suivante (Figure 2) présente la tension estimée par commune.
Une fois calculé pour chaque demande, l’indicateur est introduit dans un modèle linéaire (?@sec-le-modele-lineaire) en classant les individus par quantile des 5% d’individus ayant le moins de chance théorique d’obtenir un logement aux 5% d’individus ayant, en théorie, le plus de chance. Même en « contrôlant » du flux de logements disponibles à la location et accessible aux ménages, de la composition familiale, du motif de la demande et de l’EPCI qui accueille cette demande, les niveaux de vie les plus bas continuent d’avoir des probabilités d’attribution significativement plus faibles. Pire, la probabilité d’attribution estimée par le modèle est globalement croissante avec le niveau de vie.
A composition familiale, motif, localisation, et niveau de tension équivalents, les demandeur·euse·s déclarant un niveau de vie inférieur à 600 euros ont 8% de chances de se voir attribuer un logement social. Celles et ceux déclarant entre 600 et 900 euros ont eux 9% de chances. Après, la probabilité d’attribution a tendance à croître d’environ 1 point de pourcentage par tranche de 100 euros de niveau de vie (Figure 3) .
Ces résultats s’observent dans la plupart des EPCI. Néanmoins, à niveau de tension donné, l’effet du niveau de vie diffère sensiblement entre les territoires. A titre d’exemple, dans la Métropole de Bordeaux, il semble exister deux paliers. Les demandeur·euse·s au niveau de vie inférieur à 1 000 euros ont aux alentours de 8% de chance de se voir attribuer un logement soit 2 points de moins que ceux déclarant plus de 1 000 euros de niveau de vie. Dans les métropoles d’Aix-Marseille, de Lyon ou encore de Rennes, la probabilité d’attribution croit progressivement avec le niveau de vie.
A cette étape, nous pouvons conclure à l’existence de difficultés particulières des ménages modestes à accéder au parc social. Difficulté que le manque d’offre abordable, s’il est bien réel, ne suffit à expliquer. Pour un logement disponible à l’attribution, les ménages les plus pauvres ne sont non seulement pas « privilégiés » mais semblent même pénalisés.
5 La durée d’attente, des résultats mais des limites
Malgré les limites pointées des données du SNE (voir encadré données du SNE), nous avons procédé à l’exploitation des durées de demande recensées dans le SNE, identifiées par un numéro de demande et dont l’issu peut être une attribution ou bien un abandon ou non renouvellement. Nous exploitons ainsi toutes les demandes ayant été introduites à partir de janvier 2020. Pour celles ci, trois cas de figure se présentent : les demandes aboutissent à l’issue d’une certaine durée, les demandes sont toujours en cours, ou alors les demandes n’ont pas été satisfaites et ont été interrompues (pour des motifs d’abandon, de non renouvellement,…)
Ces deux derniers cas de figure sont considérées et traités comme des données « censurées », c’est à dire des demandes pour lesquelles une attribution de logement, évènement hypothétique, ne pourrait survenir qu’au-delà de la dernière ancienneté recensée, sans que l’on sache le moment exact, ni même si cela peut arriver un jour.
L’analyse de durées mobilise des modèles économétriques où la durée avant l’attribution d’un logement est « expliquée » selon une analyse « toutes choses égales par ailleurs ». Elle présente l’avantage d’évaluer la dépendance des taux d’attribution vis-à-vis des mois écoulés d’attente depuis le début de la demande. On retient ici les modèles à risques proportionnels exponentiel par morceaux qui proposent une flexibilité intéressante dans la manière dont les taux d’attribution évoluent avec l’ancienneté. Pour mettre en évidence des mécanismes spécifiques dans le traitement des demandes selon les niveaux de revenu, ces modèles ont été estimés sur chaque tranche de niveau de vie.
Les taux d’attribution progressent les tous premiers mois puis décroissent après les 4 premiers mois continûment avant un sursaut autour d’un an d’ancienneté de la demande et ce pour l’ensemble des tranches de niveau de vie (Figure 4). Il y a donc un mécanisme d’attribution profitant prioritairement aux nouvelles demandes : tout se passe comme si les nouvelles demandes qui arrivent au fil de l’eau évinçaient les demandes plus anciennes. Autrement dit, en moyenne, il n’y a pas de prime donnée à la file d’attente tout au moins au cours de la première année.
Une autre interprétation de cet effet croissant au cours des tous premiers mois pourraient provenir d’un effet de tri et de sélection issu d’un mécanisme attribuant un logement aux « meilleurs » dossiers, identifiés dès le départ comme étant les plus prioritaires – il est d’ailleurs possible qu’il s’agisse en fait d’anciennes demandes « réactivées » et réintroduites comme une « nouvelle demande ». Finalement le sursaut des taux observés après un an d’ancienneté pourrait lui provenir des mécanismes de cotation évoqués en encadré (Durée d'attente) où l’ancienneté de la demande peut au-delà d’une certaine période devenir un critère important. C’est néanmoins difficile de le confirmer.
Si les taux d’attribution pour les plus pauvres (moins de 500 euros) sont au départ au dessus des autres au cours des tous premiers mois, l’évolution de leurs taux les relèguent très vite et radicalement dans les derniers rangs après 4 mois d’ancienneté. En revanche, la tranche juste au dessus (celle des 500 à 700 euros) montre des taux d’attribution dominer les taux des autres niveaux de vie.
L’estimation des durées moyennes pour différents profils individuels selon différents niveaux de vie et dans différentes situations de tension montre des niveaux élevés de temps d’attente avant que la demande puisse être satisfaite. Nous isolons ici 3 profils :
profil 1 : Famille monoparentale avec 3 enfants, déjà assisté dans son logement actuel, la personne demandeuse étant une femme, inactive. Sa demande est motivée par une absence de logement, et sollicite un T5 ou plus
profil 2 : Couple avec 2 enfants, habitant en HLM, la personne demandeuse étant un homme, exerçant un emploi indépendant ou étant en CDD. Le motif de la demande est qu’il occupe un logement trop petit, et sollicite un T4.
profil 3 : Couple sans enfant, habitant en logement privé, la personne demandeuse étant un homme, exerçant un emploi en CDI. Le motif de la demande est pour raisons professionnelles, et sollicite un T3.
Sans tension | Tension moyenne | Tension forte | |||||||
---|---|---|---|---|---|---|---|---|---|
P.1 | P.2 | P.3 | P.1 | P.2 | P.3 | P.1 | P.2 | P.3 | |
Moins de 500€ | 19 | 34 | 28 | 27 | 41 | 36 | 44 | 52 | 49 |
Entre 500€ et 700€ | 10 | 22 | 22 | 21 | 36 | 36 | 37 | 48 | 48 |
Entre 700€ et 1000€ | 13 | 20 | 26 | 26 | 35 | 40 | 39 | 46 | 49 |
Entre 1000€ et 1150€ | 17 | 18 | 20 | 33 | 34 | 36 | 50 | 50 | 51 |
Entre 1150€ et 1500€ | 17 | 19 | 18 | 33 | 35 | 34 | 48 | 49 | 49 |
Entre 1500€ et 2000€ | 16 | 18 | 17 | 30 | 32 | 32 | 42 | 44 | 44 |
Entre 2000€ et 2400€ | 21 | 22 | 18 | 37 | 38 | 33 | 46 | 46 | 43 |
Plus de 2400€ | 23 | 21 | 23 | 37 | 35 | 37 | 49 | 48 | 49 |
Pour le profil 1 la durée moyenne la plus faible est de 10 mois et estimée dans la zone où la tension est la plus faible. Pour les deux autres profils en conservant la même configuration d’offre la plus favorable, on trouve même des prédictions de temps d’attente qui atteignent 1,5 ans au mieux dans selon des niveaux de vie échelonnés entre 1000 et 2000 euros.
Insistons sur le fait qu’il s’agit bien de temps d’attente prédites, calculées en moyenne pour les demandeur·euse·s. Le niveau élevé de ces durées est dû à la fois aux taux de base par mois très faibles et décroissants et au fait que – dans les données du moins - au-delà de 14 mois, si les demandes n’ont jusque là pas aboutie, on observe à la fois un très grand nombre de demandes se terminant entre le 14ième et le 16ième mois pour motif d’abandon (ces données sont alors « traitées» dans la modélisation comme des données « censurées ») et une baisse très nette d’attributions pour les demandes les plus anciennes.
Les principaux résultats de l’étude sont retrouvés ici avec notamment l’importance des configurations familiales ou encore du nombre d’enfants à charge. Les effets de ces facteurs néanmoins ne jouent pas forcément de la même façon selon les niveaux de revenu – rappelons que ces modèles et les prédictions qui en sont issues ont fait l’objet d’une estimation séparée pour chaque tranche de niveau de vie.
Les résultats confirment le rôle des conditions de marché dans les chances de réussite de la demande de logement: la dégradation de ces dernières – avec des offres de logement disponibles insuffisantes créant une tension d’autant plus importante sur le marché du logement social – accroissent fortement les durées moyennes d’attente, autour de 3 ans sur un marché moyennement tendu, et 4 ans ou plus dans les situations les plus tendues. Cela nivelle de fait les différences de prédictions de ces durées selon les niveaux de vie (et même selon les profils individuels).
Ces résultats sont en réalité peu étonnants. D’une part parce qu’ils ont déjà été en partie mis en évidence par des études antérieures, peut être moins documentées mais dont les résultats peuvent être jugés comme robustes. D’autres part parce que dans le système d’attribution, le critère du niveau de vie des demandeur·euse·s n’est au final que peu pris en compte. Pire, lorsqu’il l’est c’est le plus souvent dans le but d’exclure les plus modestes du fait de leur insolvabilité présumée ou de l’appréciation du risque d’insolvabilité. En outre, les ménages les plus pauvres sont le plus souvent mis en « concurrence » avec des ménages, moins pauvres, mais cumulant d’autres critères de précarité. Les acteurs de terrain rencontrés (Section 8.5) nous ont fait part de « tentatives de diversifier le peuplement d’un territoire fragile ». Ces choix politiques sont à mettre au regard de la situation locale. Sur le territoire de Plaine Commune, le revenu médian atteint la moitié du revenu médian de la ville de Paris. De ce fait, les importantes restructurations du parc existant, notamment en lien avec l’ANRU et la lutte contre l’habitat indigne, ainsi que la rotation interne au parc social, ont pour principaux bénéficiaires les ménages les plus fragiles, déjà présent dans le parc social. Dès lors, la politique de « diversification » du peuplement ne peut s’opérer que sur les nouveaux entrant et les attributions hors parc social. Dans un contexte de production contrainte et de sorties du parc social peu nombreuses, cela se traduit par des taux d’accès au parc social plus faible pour les ménages les plus pauvres.
Pour la ville de Paris et les métropole de Rennes et de Lyon, la volonté de garder un parc social à destination des « classes moyennes » ou des « travailleurs essentiels » a été réaffirmée. Cette volonté politique de poursuivre l’un des objectifs du modèle de logement social « à la française », la mixité sociale et la lutte contre la ségrégation urbaine, ne peut être que saluée. Néanmoins, il est évident que dans un contexte où l’offre de logements sociaux est contrainte, cette volonté se traduit là encore par un accès au logement plus restreint des ménages les plus modestes (voir l’encadré cotation de la demande).
6 La cotation de la demande : une solution ?
Afin d’objectiver les critères de sélection de demandeur.se.s pour leur présentation ou non en Commission d’attribution de Logement, un certain nombre de collectivité ont recours à la cotation. Parmi les territoires interrogés, la métropole de Rennes et la Ville de Paris pratiquaient déjà une cotation de la demande sur la période étudiée. Plaine Commune l’a quant à elle mise en place en avril 2023.
Selon nos interlocutrices, à Rennes, elle se fait en fonction de critères économiques (prend en compte les ménages les plus pauvres) et sociaux (absence de logement). Ce qui priorise le plus c’est l’absence de logement. Depuis la création de la cotation, les critères économiques ont été modifiés afin de redonner un peu de poids aux revenus salariaux et donc privilégier les travailleur.se.s. Le rôle de l’ancienneté de la demande est également prépondérant. Au delà d’une durée jugée « anormalement longue » (30 mois pour Rennes) les ménages n’ayant pas eu de proposition voient leur nombre de points significativement augmentée. De fait, si la « hiérarchisation de la demande » à l’œuvre dans le métropole de Rennes permet dans un premier temps de prioriser les ménages les plus fragiles, elle privilégie aussi, à termes, des ménages, plus aisés, présents depuis longtemps dans la file d’attente.
Concernant Paris Habitat, le bailleur ne hiérarchise pas la demande au moment du dépôt, du fait du nombre trop important de demandeur·euse·s. Deuxièmement, le poids de la durée d’attente dans la cotation est marginal dans la cotation. D’une part elle « rapporte » très peu de points mais surtout n’en procure qu’à partir du moment où la demande est présente dans le SNE depuis plus de 5 ans (deux fois la durée « anormalement longue » de la Métropole de Rennes). L’une des raisons énoncées par le bailleur interrogé est l’existence de situation « d’optimisation » de la part de certain.e.s demandeur.se.s, citant comme exemple « un nombre conséquent de demandeur·euse·s font leur demande à 18 ans en espérant en obtenir un logement social à 28 ans ». Si la cotation parisienne regroupe un nombre important de critères, ceux spécifiquement liés aux revenus sont peu nombreux et leur poids reste faible rapporté au nombre global de points « disponibles ». A titre purement illustratif, sur les plus de 200 points « potentiels » attribués par la cotation parisien, moins de 20 points peuvent l’être au titre d’un critère purement économique (taux d’effort élevé et reste à vivre faible). La cotation parisienne illustre clairement les mécanismes de « concurrence » entre les différentes demandes. Toutes choses égales par ailleurs, un ménage ayant un reste pour vivre inférieur à 7 euros par jour et par personne compte un nombre de points identiques à un ménage ayant un reste pour vivre compris entre 10 et 15 euros mais habitant aujourd’hui à Paris, y travaillant et attendant un logement social depuis plus de 12 à 15 ans…
Cette situation n’est évidemment pas propre à la capitale et ne vise pas à remettre en cause le principe d’une hiérarchisation de la demande, d’autant plus dans un contexte tendu ou une filière « spécifique » pour les plus fragiles existe. Elle illustre néanmoins le faible poids des critères purement économiques dans le processus d’attribution de la filière « générale ». Cette assertion étant bien évidemment à relaviser puisque les autres critères de cotations peuvent être très liés au niveau de vie des ménages (sur-occupation, situation de logement, …). En outre, selon les acteurs et actrices rencontré·e·s, la généralisation de la cotation soulève un certain nombre d’interrogation : comment harmoniser les pratiques entre les acteurs pour apprécier la solvabilisation des ménages (calcul du reste à vivre et niveau du taux d’effort) ? comment rendre plus transparents le processus d’attribution en CALEOL qui ne respecte pas forcément l’ordre des candidat·e·s proposé par les réservataires ?
Dès lors, la question de « l’interaction » entre les variables semble cruciale. Si « en moyenne », « toutes choses égales par ailleurs », les ménages les plus modestes connaissent des difficultés d’accès, nos résultats ne disent que peu de choses sur les interactions entre les variables. Il est ainsi possible que ces résultats soient le fait d’interaction très négatives entre le niveau de vie des ménages et d’autres variables impactant leur probabilité d’accès (motif de la demande, priorisation de celle ci, composition familiale, …). Pour mettre en lumière ces possibles interactions, il convient de modéliser la probabilité d’attribution de façon plus « complexe ».
6.1 Le machine learning et les interactions entre facteurs
Les résultats du modèle non linéaire par apprentissage (Section 8.3) étendent ceux issus du modèle linéaire. Déclarer un niveau de vie inférieur à 800 euros par unité de consommation réduit significativement la probabilité de se voir attribuer un logement tout comme appartenir à un centile de tension élevé. En moyenne, demander un logement dans sa commune de résidence actuelle accroît la probabilité d’attribution. En moyenne, le fait de résider déjà dans le parc social réduit la probabilité d’attribution. Par contre le fait d’être déclarer « prioritaire » augmente de 10 points cette probabilité.
La modélisation proposée permet également de mettre en évidence les effets des interactions entre certaines variables du modèle et le niveau de vie des ménages (Figure 5). Concernant le niveau de tension, son impact apparaît relativement homogène selon les différents niveaux de vie. Les effets du mode de logement actuel sont significativement différents selon le niveau de vie considéré. Dans le bas de la distribution des niveaux de vie, les locataires semblent plutôt privilégiés par rapport aux autres statuts d’occupation. A contrario, les demandeur·euse·s logé·e·s chez des tiers sont pénalisé·e·s en deçà de 1 000 euros de niveau de vie, toutes autres caractéristiques égales par ailleurs. La priorisation de la demande joue positivement pour les ménages déclarant moins de 800 euros de niveau de vie tout comme le fait de demander un logement dans sa commune de résidence. En outre les ménages les plus jeunes apparaissent pénalisés lorsqu’ils déclarent des revenus faibles tout comme les demandeur·euse·s de nationalités extérieuress à l’Union Européenne.
S’il est possible de représenter aisément l’interaction entre 2 variables du modèle, il est plus complexe de rendre compte de l’ensemble des interactions de celui-ci. Pour se faire, nous construisons un certain nombre de cas-type combinant l’ensemble des variables du modèle. Pour chacun de ces cas-type, il est possible d’estimer le niveau de tension qu’il subit à l’échelle des EPCI (probabilité théorique d’attribution) ainsi que sa probabilité de se voir attribuer un logement (probabilité effective d’attribution).
Il est possible de comparer ces deux probabilités entres elles sous la forme par exemple d’odd ratio c’est-à-dire sous la forme de rapport de chances. Pour un cas type donné et dans un EPCI donné, un odd ratio supérieur à 1 signifie que le cas type en question a significativement plus de chance de se voir attribuer un logement social que ce que pourrait laisser penser le niveau de tension de local. Autrement dit, il est plutôt favorisé dans la procédure de désignation.
A contrario, un rapport de chance inférieur à 1 signifie que sa probabilité d’accès effective au parc social est inférieure à sa probabilité théorique. Il est donc discriminé dans son accès.
La combinaison des principales valeurs (celles qui ne sont pas des sous cas trop peu nombreux) avec les localisations fines et les différents niveau de vie possible conduit au calcul d’une centaine de millions de cas. Cette information très riche peut alors être synthétisée dans des tableaux et des graphiques et est présentée dans une application interactive permettant de relater nos différents résultats (Section 8.4). Nous détaillons ici les résultats pour 3 cas types :
Cas type n°1 : une famille monoparentale de 40 ans avec 2 enfants, en CDI, non prioritaire, de nationalité française, et éprouvant des difficultés financières en étant logé dans le parc privé au sein de la commune demandée.
Cas type n°2 : Une personne seule de 50 ans, non prioritaire, au chômage, de nationalité hors européenne et éprouvant des difficultés financières en étant logé dans le parc privé au sein de la commune demandée.
Cas type n°3 : Un couple avec 2 enfants, en CDI, de nationalité française, vivant dans un logement inadapté du parc locatif privé, et souhaitant changer de commune.
6.2 Cas Type n°1: une famille monoparentale
Dans l’ensemble des EPCI étudiés, cette demande a une probabilité effective d’attribution inférieure à sa probabilité théorique et ce quelque soit le niveau de vie considéré (Figure 6).
En théorie, à Paris, pour un niveau de vie de 1 200 euros par mois et par unité de consommation (soit 1 800 euros de ressources mensuelles dans le cas présent), cette demande a 5.1% de chance d’aboutir à une attribution. Dans les faits, notre modèle estime que la probabilité effective est de 7.7%. Pour un niveau de vie de 500 euros (soit 750 euros de ressources mensuelles), la probabilité effective chute à 2.4% alors que la probabilité théorique s’établit elle à 3.5%.
Si ce cas type apparaît pénalisé lors de l’attribution il l’est d’autant plus lorsque son niveau de vie est plus faible. L’examen des contributions permet de comprendre quels sont les facteurs qui ont joués en faveur ou en défaveur d’une attribution pour ce cas-type. Ainsi, à Paris, les demandeur·euse·s ayant un niveau de vie de 500 euros ont des chances réduites d’accéder à un logement social en raison, essentiellement, de leur faible niveau de vie, du fait de ne pas être reconnu comme prioritaire (DALO, art. 441) et, enfin, du fait du contexte très tendu de l’offre. Les demandeur·euse·s ayant un niveau de vie de 1200 euros ne sont pas pénalisé·e·s pour leur niveau de vie. Leurs chances sont réduites avant tout en raison d’une offre tendue (quoique dans une moindre mesure que pour le cas précédent), du fait également de ne pas être jugé prioritaire et du fait d’une spécificité parisienne, qui tient probablement à l’intervention de nombreux réservataires et conduit à limiter encore plus l’offre pour les demandeur·euse·s non prioritaires. En revanche, le fait d’être mono-parent semble plutôt jouer en faveur d’une attribution.
Considérons maintenant un EPCI très détendu comme celle de la métropole de Rouen-Normandie. Comme on peut le constater, quel que soit le niveau de vie, la tension joue cette fois en faveur d’une attribution et le fait de ne pas être prioritaire est à peine un handicap. Les demandeur·euse·s ayant un niveau de vie de 500 euros sont toujours, néanmoins, pénalisé·e·s en raison de ce niveau de vie tandis que celles et ceux qui ont un niveau de vie de 1200 euros obtiennent plutôt un léger bonus en raison de ce niveau de vie.
6.3 Cas Type n°2 : une personne seule
Dans l’ensemble des EPCI étudiés, ce cas type semble extrèmement pénalisé lorsque son niveau de vie est faible. Il semble dans un premier temps pénalisé par une offre de logements accessibles plus que réduite. Les acteurs de terrains rencontrés nous l’ont confirmé : les petits logements ne sont pas légions au sein des attributions (Figure 7).
En théorie, ni le niveau de vie ni l’EPCI de la demande n’apparaissent discriminants. Autrement dit, quelques soit le niveau de vie ou l’EPCI considéré, la probabilité d’attribution théorique est stable aux alentours de 10%. Elle est même légèrement décroissante au delà de 1000 euros de niveau de vie.
Dans les faits, la probabilité estimée d’attribution est bien plus faible et croissante avec le niveau de vie dans l’ensemble des EPCI. Dans les EPCI les plus tendus, celle ci avoisine les 1% pour les ménages les plus modestes et atteint difficilement pour ces derniers les 4% dans les EPCI les moins tendus.
En plus des difficultés liées à l’offre de logements disponibles, les personnes seules, qui représentent pourtant près de la moitié des demandeur·euse·s de logements sociaux, ont le plus grand mal à accéder au parc, d’autant plus quand ils déclarent des niveaux de vie faibles.
Si le fait d’être prioritaire facilite (là encore) l’accès dans les EPCI moins sujets à la tension du marché, ce critère ne suffit pas à annuler l’écart entre probabilité théorique et estimée dans la plupart des EPCI. Cela laisse à penser que c’est l’interaction « Bas revenu + Prioritaire + Présence d’enfant » qui accroît la chance de la demande d’aboutir plutôt que la seule interaction « Bas revenu + Prioritaire ».
6.4 Cas Type n°3 : un couple actif avec enfants
Les couples actifs avec enfants ont, contrairement aux autres cas types, des chances de se voir attribuer un logement relativement proche de leurs chances « théoriques » et ce même pour les niveaux de vie les plus faibles et même sans être prioritaires. La probabilité estimée d’attribution reste malgré tout croissante avec le niveau de vie donc les ménages les plus modestes restent, toutes choses égales par ailleurs, pénalisés par rapport aux plus aisés.
A Paris, par exemple, du fait d’une parc abordable réduit pour les familles modestes avec 2 enfants, les probabilités d’attribution théoriques et estimées sont toutes deux de 5% pour les ménages au niveau de vie proche de 600€. En théorie, les ménages à 1200€ de niveau de vie ont autant de chance d’obtenir un logement social. Dans les faits, nous estimons qu’ils ont près de 4 fois plus de chance … A Plaine Commune, les probabilités estimées sont proches de celles de Paris alors même que les chances théoriques ont tendance à décroître à partir de 1 000 euros de niveau de vie. Ces résultats, s’ils confirment les politiques de peuplement à l’œuvre sur le territoire francilien (voir encadré priorisation), sont observés dans la plupart des territoires. La stabilité des ressources et l’insertion sur le marché du travail semble ici jouer en faveur des ménages, même au niveau de vie faible.
7 La priorisation joue un rôle important
La web application xgblogsoc permet également de comparer les cas types entre eux et de faire apparaître des interactions entre variables. Le caractère prioritaire ou non de la demande est un critère prégnant dans la probabilité d’attribution. Afin de mettre ces effets en lumière il est possible de considérer un cas type aux même caractéristiques que celles précitées mais dont la demande a été jugée prioritaire. Cela ne modifie en rien les résultats obtenus en termes de probabilités théoriques, prioritaires ou non, les demandeur.se.s ont en théorie accès aux mêmes logements. En revanche, les probabilités effectives sont largement modifiées.
Pour reprendre l’exemple de Paris, la priorisation « lisse » l’effet du niveau de vie : les probabilités effectives d’attribution sont identiques à 500 euros et 1 200 euros de niveau de vie.
Sur certains territoires comme la Métropole de Nice par exemple, la priorisation permet aux demandes à niveau de vie les plus faible d’enregistrer une probabilité effective supérieure à la probabilité théorique (courbe pleine au dessus de la courbe pointillée). Alors qu’en théorie, dans la Métropole de Nice, notre cas type prioritaire aurait 11% de chance de se voir attribuer un logement s’il déclare un niveau de vie de 500 euros, on estime que sa probabilité effective est de 25%.
La richesse de l’analyse rend complexe la description de l’ensemble des résultats produits. Néanmoins de grandes tendances semblent émerger :
Globalement, quelques soient le niveau de tension locale et les autres caractéristiques des ménages, lorsqu’ils ne sont pas prioritaires, les ménages à faibles ressources sont pénalisées dans le système d’attribution par rapport aux ménages plus riches (ou moins pauvres).
La priorisation de la demande permet dans la plupart des territoires de compenser, en partie, cet effet négatif du niveau de vie.
Les niveaux de tension diffèrent énormément entre territoires : à 500 euros de niveau de vie le cas type décrit a, en théorie, 3 fois plus de chance de se voir attribuer un logement s’il dépose sa demande dans la Métropole de Toulouse plutôt que dans celle d’Aix-Marseille.
Les probabilités effectives d’attribution diffèrent également beaucoup selon les territoires considérés : nous estimons qu’à 500 euros de niveau de vie, le cas type décrit a 5 fois plus de chance de se voir attribuer un logement social dans la Métropole de Rouen que dans l’EPCI Paris-Est-Marne et bois par exemple.
Les rapports de chance diffèrent sensiblement à la fois en fonction du niveau de vie et des territoires considérés : pour le cas type n°1 nous estimons un rapport de chance de 0.17 à Paris pour un niveau de vie de 500 euros et de 0.44 pour un niveau de vie à 1200 euros. Ces odds ratio sont respectivement de 0.31 et 0.82 à Béziers.
8 Conclusion
Existe-t-il une discrimination lors de l’attribution des logements sociaux en raison de la précarité économique, supposée ou réelle, des demandeur·euse·s ? En moyenne, les ménages les plus pauvres ont plus de difficultés que les autres à accéder au parc social. Si les contraintes liées à l’offre de logements accessibles sont réelles, elles ne suffisent pas à expliquer ces difficultés d’accès. En théorie, dans les territoires les plus tendus, les ménages à très faibles ressources (moins de 600 euros de niveau de vie) ont en effet accès à un nombre de logements plus restreints. Néanmoins, en pratique, nous estimons que leurs chances d’accès à ces logements sont encore plus faibles que leurs chances théoriques. Lorsqu’un logement est proposé à l’attribution, il est le plus souvent attribué à un ménage moins fragile financièrement.
Sauf si la demande est jugée prioritaire ou qu’elle a été déposée dans un territoire moins tendu, nos résultats tendent à confirmer l’existence de « barrière à l’entrée » dans le parc social pour les ménages les plus fragiles économiquement. Ces difficultés s’expliquent pour partie. La contrainte qui pèse sur l’offre de logements disponibles à l’attribution entraîne une mise en concurrence accrue des demandeur·euse·s de logements. Celle ci, à l’image de celle à l’œuvre dans le parc locatif privé pénalise fortement les ménages les plus modestes. A l’échelle des territoires, les logiques de peuplement ou de « diversification » des attributions se font elles aussi le plus souvent au détriment des ménages modestes.
Notre étude met néanmoins en lumière la relative efficacité du système de priorisation. A caractéristiques équivalentes, les ménages prioritaires sont « avantagés » dans le processus d’attribution. Lorsqu’ils sont prioritaires, les ménages les plus pauvres voient leurs chances d’accéder au parc augmenter de façon très significatives et les « barrières » mentionnées précédemment semblent se lever quelque peu. Cette « filière » prioritaire apparait comme la principale chance des ménages pauvres d’accéder au parc social, ce qui pose question puisque le critère du niveau de vie ne constitue pas en tant que tel un critère de priorisation de la demande.
Annexes méthodologiques
8.1 Le modèle linéaire
Dans le cas présent, la variable à expliquer étant binaire (se voir attribuer un logement ou non) nous mettons en place une régression de type logistique (logit) en transformant la probabilité d’attribution en chance d’attribution ( p/(1-p) ) et en considérant les chances comme multiplicatives (ou additives en prenant le logarithme de la chance, c’est-à-dire le logit de la probabilité d’attribution).
La régression logistique permet d’inclure plusieurs variables explicatives dans le modèle. Ici, nous définissons comme variables explicative de la probabilité d’attribution (p_{attrib}) : le niveau de vie en tranche (ndv~tr), le motif de la demande (motif), l’EPCI de la demande (EPCI), la composition familiale (compo) et le mode de logement actuel (modelog). Le modèle peut être écrit de la forme suivante (i désigne les demandeur·euse·s, u_i est un bruit normal) : \begin{split} logit(p_{attrib, i}) =& β₀ + β₁.ndv~tr_i + β₂.motif_i + β₃.epci_i + \\& β₄.compo_i + β₅ . mode~log_i + u_i \end{split}
L’effet du niveau de vie sur la probabilité d’attribution est donné par le cœfficient \beta_1. Le modèle permet de calculer, par tranche de niveau de vie, la probabilité d’attribution moyenne, c’est à dire celle qui correspond à une composition familiale « moyenne », un motif « moyen », etc.
8.2 Contruction d’un indicateur de tension
Etape 1 : L’appariement
L’étape de l’appariement est plus délicate qu’il n’y paraît au premier abord car il ne s’agit pas simplement de compter les demandes valides pour un bien donné au temps t. Il faut s’abstraire de la distribution des logements sociaux qui a été effectuée sur une période donnée en définissant un ensemble d’autres possibilités de distribution.
Soyons plus explicite : considérons le cas d’un·e demandeur·euse qui s’est vu attribuer un logement très rapidement au début de la période d’étude. Ce cas se produit lorsque la demande est enregistrée alors qu’un logement est déjà « en vue » (voir plus loin). Si l’on effectue un appariement sur la base de ce qui s’est effectivement passé, cette demande n’apparaîtra pas comme demande pour tous les biens attribués après la date où celle-ci aura été satisfaite puisque, bien entendu, celle ci n’était effectivement plus active.
Mais un tel appariement ne va pas nous permettre de comprendre pourquoi cette demande a été satisfaite alors qu’elle n’apparaît éligible qu’à très peu de biens. Le problème est que l’on s’efforce de brosser des scénarios alternatifs de distribution et qu’il faut procéder à un appariement qui ouvre un espace pour d’autre possibles.
C’est pourquoi nous avons pris le parti de ne pas tenir compte de la dimension temporelle. Nous apparions toutes les demandes valides à un moment donné après le 1er mars 2021 avec tous les logements attribués au cours de la période située entre mars 2021 et mars 2022.
Une autre difficulté de cette étape d’appariement tient à la grande disparité entre les demandes : certaines semblent prêtes à accepter à peu près tout, n’importe où, tandis que d’autres posent des attentes précises et fortement sectorisées. Faut-il adopter ces critères subjectifs pour conduire l’appariement ? Probablement pas. Une famille qui, en détresse, se dit prête à accepter un studio ne se verra pas attribuer un simple studio par les organismes HLM ou les délégataires.
Le calcul que nous proposons de la tension s’appuie sur des attributions certes fictives, mais qui doivent rester pertinentes. Nous avons donc conservé des demandes qui apparaissait en général pertinentes aux yeux des organismes HLM. Nous avons ainsi construit une grille de correspondance entre la composition familiale et le logement attribué à partir de ce que l’on constate le plus fréquemment.
Nous avons également retenu un reste à vivre minimal (12 euros par jour et par unité de consommation) comme seuil au-delà duquel les demandes ne sont plus considérées comme solvables. Ce reste à vivre est calculé après versement des aides personnelles au logement que nous estimons par un mécanisme de maximisation c’est-à-dire que nous modélisons le loyer permettant à la fois de maximiser le montant d’aides personnelles perçues et de minimiser le taux d’effort des ménages.
La réglementation impose de ne pas considérer le reste à vivre mais de prendre en compte un taux d’effort. Cependant, un taux d’effort adapté à chaque niveau de vie revient à un reste à vivre qui nous paraît plus à même de décrire la prise en compte du niveau de vie. Enfin, nous avons décidé de limiter la demande à la première commune demandée, même s’il est possible de demander un logement social sur plusieurs communes en même temps.
Ce choix méthodologique tient d’abord au constat que ceux qui demandent plus de communes n’ont pas plus de chances de se voir attribuer un logement. Mais surtout, notre objectif est d’estimer une tension et il nous semblait plus pertinent d’estimer celle-ci sur la demande principale, en négligeant les seconds choix. Bien entendu, il arrive qu’une demande soit satisfaite dans une commune qui n’était pas le premier choix.
De même, certain·e·s demandeur·euse·s peuvent obtenir des logements plus grands que ceux accordés habituellement, tout simplement parce qu’ils se trouvent dans une zone peu tendue sans demandeur·se plus « pertinent·e·s » qu’eux. De notre point de vue, ces cas particuliers ne suffisent pas à remettre en cause les critères que nous avons adoptés pour apparier l’offre et la demande.
En effet, ces critères nous servent à identifier un ensemble de demandes concurrentes pour un même bien, de manière à calculer une tension. Le fait que l’on observe ensuite des demandes satisfaites qui soient hors de nos critères signifie simplement qu’il y a des attributions à des demandeur·euse·s qui ne constituaient pas le cœur de cible du logement considéré.
Empiriquement, nous nous attendons à ce que ces attributions « excentriques » se produisent avant tout lorsque la tension est faible et que l’on ne trouve pas de demandeur·euse·s identifié·e·s comme « cœur de cible ».
Etape 2 : La probabilité d’attribution
L’appariement précédent conduit à représenter l’état de l’offre et de la demande de logements sociaux comme un réseau bipartite (2013) avec, d’un côté, des demandeur·euse·s et, de l’autre, des logements disponibles. L’appariement permet de construire les arêtes du réseau. Chaque arête correspond à une option posée par un demandeur pertinent pour un logement donné. Sur la période d’étude, on compte 3 124 869 demandes, 392 841 logements sociaux à attribuer et environ 450 millions d’arêtes.
La procédure consiste alors à accorder, pour chaque logement, la même chance d’attribution à chaque demande pertinente. Si un logement fait l’objet de n demandes alors chaque demandeur a une probabilité de 1/n de se voir attribuer ce logement. Au final, chaque demandeur accumule des chances de se voir attribuer un des logements qu’il a demandés. Il reste alors à déduire de cet ensemble de probabilités la probabilité d’un demandeur d’obtenir un et un seul de ces logements (probabilité que l’on note Pr_i). Soit p_{ij} la probabilité du demandeur i d’obtenir le logement j, on calcule une probabilité « brute » au sens où l’on fait comme si les attributions étaient indépendantes.
Dans ce cas, on a pour un demandeur i face à une offre de n logements :
Pr_i=p_{i1}+(1-p_{i1}).p_{i2}+...+ \prod_{j=1}^{n-1}(1-p_{ij}).p_{in} On fait comme si le demandeur parcourait successivement tous les logements, tant qu’il n’en obtient pas un, jusqu’à éventuellement tous les parcourir.
On notera que ce calcul ne dépend pas de l’ordre dans lequel les logements sont parcourus. Cette probabilité « brute » néglige toutefois les interdépendances entre les demandes. Ce n’est pas entièrement satisfaisant. On peut s’en rendre compte en comparant l’espérance de logements (soit, dans chaque commune, la somme des probabilités) avec le nombre effectif d’attribution sur la période.
On observe un décalage entre ce qui est prédit par les probabilités « brutes » et ce qui s’est passé. C’est pourquoi une procédure de correction a été ajoutée. Le problème de négliger l’interdépendance est que l’on ne distingue pas entre les cas où un logement est demandé par des demandeur·euse·s qui ont de nombreux « plans B » et un logement où les demandeur·euse·s, au contraire, misent tout sur ce logement. Or, dans le premier cas, on peut s’attendre à ce que certaines demandes « s’évaporent » car le demandeur a pris un des « plans B ».
La concurrence pour le logement est donc en réalité un peu plus faible que ce qui paraît au premier abord dans le premier cas, tandis qu’elle est aussi dure que prévue dans le second cas. Or, notre calcul de la probabilité « brute » nous dit quelque chose sur les chances qu’une partie de la concurrence s’évapore, ou pas. Nous allons donc nous servir de cette information pour calculer plus finement les probabilités d’attributions.
L’idée est simple : pour un logement x donné, on sait quelle est la probabilité d’un demandeur d’obtenir ce logement et la probabilité de ce même demandeur d’obtenir un autre logement social. On a donc une estimation de l’évaporation : c’est la probabilité qu’il obtienne cet autre logement avant le logement x.
En première approximation, nous considérons qu’il y a une chance sur deux que l’attribution alternative se produise avant l’attribution de x. Nous nous servons de cette information en considérant que le poids de la demande est diminué de cette probabilité d’évaporation, autrement dit :
poids_{ij} = 1-\frac{(Pr_i - 1/n_j)}{2}
avec les notations précédentes et n_j le nombre de demandeur·euse·s du logement j. On se sert alors de ces poids pour recalculer les probabilités p_{ij} comme suit :
p_{ij} = \frac{1}{\sum_i{poids_{ij}}}
Ces nouvelles probabilités p_{ij} ont donc été légèrement réévaluées à la hausse, pour tenir compte de l’évaporation. A partir de là, il suffit d’appliquer à nouveau la formule précédente de composition des probabilités pour avoir un calcul plus fin de Pr_i .
On notera que, cette fois, l’espérance de logement calculée à partir de ces nouvelles valeurs de Pr_i est très proche du nombre effectif d’attribution.
Nous avons néanmoins procédé à un calage des valeurs pour que l’espérance soit égale à l’effective. Finalement, nous avons défini la tension comme l’opposé de la probabilité d’attribution, soit :
tension = 1-Pr_i
8.3 Le modèle Xgboost
L’approche en machine learning avec (Chen et al., 2023) permet d’estimer le modèle logit avec les mêmes variables mais dans une approche non-paramétrique. Au lieu d’un cœfficient moyen par variable, on a une partition du domaine de chaque variable et une estimation d’un paramètre pour chaque combinaison de toutes ces partitions.
L’algorithme détermine une partition globale parcimonieuse (pas trop de catégories) et pertinente (les catégories améliorent l’ajustement). L’approche non linéaire permet de mettre en évidence les interactions entre variables et de révéler des effets marginaux « ignorés » par l’approche linéaire. Elle permet également d’intégrer plus de variables explicatives à notre modèle.
De plus, l’algorithme XGBoost
est utilisé en introduisant une régularisation, afin de limiter le sur ajustement et en procédant à un rééchantillonage et une estimation sur de nombreux échantillon. Cette approche de bootstrap à la Efron (Efron et Tibshirani, 1993) permet à la fois de compenser le sur-ajustement (par un vote médian des estimateurs sur les échantillons) et d’évaluer des intervalles de confiance pour les prédicteurs retenus.
Nous construisons un modèle prédisant la probabilité d’attribution en fonction du niveau de vie, du fait d’être ou non en couple, du nombre d’enfant(s), du fait d’être en garde partagée ou non, de demander un logement dans sa commune actuelle de résidence, d’être ou non déclaré « prioritaire », du statut vis à vis à vis de l’emploi, de la tension localisée, de l’EPCI ou encore du mode de logement actuel.
8.4 L’application xgblogsoc
L’application créée dans le cadre de ce rapport fournit les informations sous 4 formes différentes :
Le premier onglet (« Attribution ») présente sous forme graphique, par EPCI, les probabilités théoriques et effectives d’attribution selon le niveau de vie. Il fournit également pour 2 niveaux de vie (500 euros et 1200 euros) les probabilités estimées ainsi que les intervalles de confiance associés.
Le deuxième onglet (« Contribution ») présente sous forme graphique, par EPCI, la contribution des différentes variables du modèle à la probabilité d’attribution. Il fournit également pour 2 niveaux de vie (500 euros et 1200 euros) les contributions respectivement du niveau de vie et du niveau de tension ainsi que les intervalles de confiance associés.
Le troisième onglet (« Odd ratio (carte) ») présente, sous forme de cartes et pour les 100 EPCI comptant le plus de demandeur.se.s, le rapport de chance (l’Odd ratio) entre probabilité effective et probabilité théorique (voir supra) ainsi que les résultats de l’onglet « Attribution » pour chaque EPCI.
Le quatrième onglet (« Attribution (carte) ») présente lui les probabilités effectives d’attribution pour les 100 EPCI comptant le plus de demandeur.se.s.
8.5 Les entretiens
Pour ce rapport, nous avons mené 6 entretiens pour un total d’une vingtaine de personnes interrogées :
- Agglomération de Lyon
- Bailleurs sociaux : Grand Lyon Habitat, Office Public de l’Habitat (OPH) qui possède le parc le plus important sur la ville de Lyon avec plus de 26 000 logements sociaux en gestion et Lyon Métropole Habitat, Office Public de l’Habitat (OPH) qui possède le parc le plus important sur l’agglomération lyonnaise avec 32 650 logements sociaux dans cinquante-sept communes.
- Réservataires : La métropole de Lyon ou Grand Lyon, collectivité territoriale qui exerce à la fois les compétences d’un département et celles d’une métropole, pour les cinquante-neuf communes.
- Agglomération de Rennes
- Réservataires : Métropole de Rennes, collectivité territoriale qui exerce à la fois les compétences d’un département et celles d’une métropole
- Agglomération de Paris
- Bailleurs sociaux : Paris habitat, Office Public de l’Habitat (OPH), présent dans 54 communes, à Paris et dans sa métropole, le groupe Paris Habitat loge plus de 281 100 habitants et gère un patrimoine de plus de 125 800 logements (logeant ainsi 1 Parisien sur 9).
- Réservataires : la Direction du Logement et de l’Habitat de la ville de Paris, en charge de l’ensemble des actions menées par la ville de Paris dans le domaine du logement et responsable de la désignation des candidats sur le contingent de la mairie centrale de la ville
- Plaine Commune
- Bailleurs sociaux : Plaine Commune habitat, Office Public de l’Habitat (OPH) créée en 2005. Aujourd’hui, l’Office public gère un parc de plus de 20 000 logements répartis sur 8 communes : Saint-Denis, Villetaneuse, Pierrefitte-sur-Seine, L’Ile Saint-Denis, La Courneuve, Epinay-sur-Seine, Aubervilliers et Stains. L’organisme loge, ainsi, 1 habitant sur 7 sur l’ensemble de l’Agglomération Plaine Commune dont 1 habitant sur 3 sur la ville de Saint-Denis.
- Réservataires : l’établissement public territorial (EPT) Plaine Commune, structure intercommunale crée en 2016 et située dans le département de la Seine-Saint-Denis. L’EPT comprend neuf communes à savoir Aubervilliers, La Courneuve, Epinay-sur-Seine, L’île-Saint-Denis, Pierrefitte-sur-Seine, Saint- Denis, Saint-Ouen-sur-Seine, Stains et Villetaneuse. L’EPT pilote La Conférence Intercommunale du Logement (CIL) qui a pour objectif de définir la politique intercommunale d’attribution de logements au sein du parc locatif social, de développer la mixité sociale, de favoriser la coopération entre les bailleurs et les réservataires, et d’améliorer la transparence du dispositif pour les demandeur·euse·s
Une fois présentés les résultats préliminaires du rapport, les échanges ont porté sur les données mobilisées et les pratiques locales.
Références
Réutilisation
Citation
@misc{madec2023,
author = {Madec, Pierre and Parodi, Maxime and Timbeau, Xavier and
Joutard, Xavier and Portefaix, Pauline and Aubisse, Edgar},
title = {Quelles difficultés d’accès des ménages les plus pauvres au
parc social\,?},
date = {2023-06-27},
url = {https://ofce.github.io/xgblogsoc},
langid = {fr}
}