Une plateforme d’observation des locations Airbnb en Île-de-France

Données, outils, résultats

Louis Laurian

UAR RIATE

Le projet

Louis Laurian, Ronan Ysebaert

Marianne Guérois

Malika Madelin
  • Thématique : diffusion spatio-temporelle des locations meublées touristiques au-delà de Paris intra-muros, évolution des catégories d’annonces, pression sur le parc de logements. Travaux dans la continuité des projets Grandes métropoles CIST 2016-2019 ; ANR WisDHoM 2020-2023.

  • Méthodologique : nouvelle source de données multidimensionnelle (spatiale x temporelle x thématique) = grand intérêt analytique et exploratoire. Documentation du protocole de recherche dans un souci de science ouverte (cf. site web produit par RIATE à l’issue de l’ANR WisDHom)

  • Politique : face aux difficultés d’accès aux données et aux enjeux socio-politiques de leur ouverture, un prototype de site web pour servir de levier à la mutualisation des données et au partage d’indicateurs et de visualisations utiles à la prise de décision dans la durée. Collaboration avec APUR et J. Richon (Eirest/Lab’Urba).

Contexte

France : deuxième marché Airbnb dans le monde (130M de nuitées réservées en 2022), Paris 1ère ville

Rapport Oxfam : une absence de régulation des acteurs privés, Airbnb comme niche fiscale

Effet de pression sur l’accès au logement

Trouillard E., 2021, Les locations saisonnières en Île-de-France, État des lieux d’avant crise, L’Institut Paris Région, p.52

  • 1. Quelles données pour observer le phénomène Airbnb ? A quelle échelle spatio-temporelle ? Quelle diffusion ?


    1. Les outils : du traitement à la représentation de données non libres


    1. Résultats : une plateforme de visualisation


    1. Suite du projet

InsideAirbnb

  • Une plateforme de données en libre accès

  • Données mises à jour régulièrement

  • Mais limitée aux communes centres

  • Données webscrapées

  • Murray Cox, “Community artist, data activist and technologist”

Capture d’écran InsideAirbnb, Paris

Une démarche militante qui a pour but de fournir des données sur l’impact d’Airbnb sur le parc de logement

Des données utiles à des fins de recherche (partenariats), mais pour l’instant limitées aux informations rendues disponibles par le site Airbnb

A quoi ressemblent les données

  • 1 fichier + 3 archives disponibles

  • 75 variables x 68.000 lignes pour Paris (1 ligne par annonce)

  • Disponibilité et activité des logements, informations sur les hôtes, type de logement

  • Faire une requête à Murray Cox pour les données antérieures

AirDNA

  • Un site orienté vers l’investissement immobilier

  • Profondeur temporelle : depuis 2014

  • Couverture spatiale : Commune(s) au choix

  • Indicateurs sur l’activité et les revenus des logements

  • Payant

  • Méthodologie peu claire (rétroaction sur les données ?) et liens flous avec Airbnb

Capture d’écran AirDNA, Paris

Données payantes et clause de contrat interdisant la rediffusion du produit brut

Problème pour les communes avec peu de locations Airbnb (secret statistique)

Protection des données personnelles sur certaines variables

Un fichier dit “individuel”

  • 443 000 lignes et 70 variables pour l’IDF

  • 1 ligne = 1 annonce

  • Résumé sur l’année passée (LTM = Last Twelve Months)

Un fichier dit “mensuel”

  • 13 millions de lignes et 29 variables descriptives pour l’IDF

  • 1 ligne = 1 mois x 1 annonce

  • Indicateurs de revenus générés et de nuitées réservées

Représenter des données ponctuelles

Indicateurs clés : onglets par thématique

  • Annonces et réservations : nombre d’annonces / de nuitées réservées, taux d’occupation…

  • Type de réservations : type de logements, part de logements entiers, saisonnalité, prix par personne…

  • Pression sur marché du logement, professionnalisation : nombre de locations pour 1000 résidences principales, part de locations «permanentes» (>120 nuitées), part de locations détenues par multiloueurs, revenus générés…

Choix méthodologiques pour la visualisation

  • Série temporelles (2016-2022)

  • Choix cartographiques (discrétisation, seuils)

  • Multi-visualisations : 3 espaces d’étude,
    3 niveaux d’observation

A la commune / IRIS

Représenter des données ponctuelles

Indicateurs clés : onglets par thématique

  • Annonces et réservations : nombre d’annonces / de nuitées réservées, taux d’occupation…

  • Type de réservations : type de logements, part de logements entiers, saisonnalité, prix par personne…

  • Pression sur marché du logement, professionnalisation : nombre de locations pour 1000 résidences principales, part de locations «permanentes» (>120 nuitées), part de locations détenues par multiloueurs, revenus générés…

Choix méthodologiques pour la visualisation

  • Série temporelles (2016-2022)

  • Choix cartographiques (discrétisation, seuils)

  • Multi-visualisations : 3 espaces d’étude,
    3 niveaux d’observation

A la grille (1000m / 200m)

Représenter des données ponctuelles

Indicateurs clés : onglets par thématique

  • Annonces et réservations : nombre d’annonces / de nuitées réservées, taux d’occupation…

  • Type de réservations : type de logements, part de logements entiers, saisonnalité, prix par personne…

  • Pression sur marché du logement, professionnalisation : nombre de locations pour 1000 résidences principales, part de locations «permanentes» (>120 nuitées), part de locations détenues par multiloueurs, revenus générés…

Choix méthodologiques pour la visualisation

  • Série temporelles (2016-2022)

  • Choix cartographiques (discrétisation, seuils)

  • Multi-visualisations : 3 espaces d’étude,
    3 niveaux d’observation

Carte lissée

    1. Quelles données pour observer le phénomène Airbnb ? A quelle échelle spatio-temporelle ? Quelle diffusion ?


  • 2. Les outils : du stockage à la représentation de données non libres


    1. Résultats : une plateforme de visualisation


    1. Suite du projet

Stockage, traitements, mise en ligne

Dans une optique de science ouverte et reproductible :

  • R : Traitement des données (des données brutes aux données consolidées) et construction des 3000+ cartes et figures

    • Scripts documentés et accessibles sur un dépôt Zenodo
    • Licence CC-BY-SA
  • Observable JavaScript (OJS) : Sélecteurs interactifs, visualisations dynamiques

  • Quarto : Construction et mise en ligne du site internet, travail éditorial

  • Dépôts GitLab Huma-Num partagé entre les 4 membres du projet

    • Premier dépôt (privé) : données brutes, scripts, sorties PNG

    • Second dépôt (public) : données agrégées, architecture du site web (intégration CD/CI)

Des possibilités de géovisualisation différentes selon les données

OJS dans Quarto : une certaine interactivité

    1. Quelles données pour observer le phénomène Airbnb ? A quelle échelle spatio-temporelle ? Quelle diffusion ?


    1. Les outils : du stockage à la représentation de données non libres


  • 3. Résultats : une plateforme de visualisation


    1. Suite du projet

Pour représenter les 3000+ cartes et graphiques : 4 onglets thématiques commentés (chiffres clés),
2 zooms indicateurs / communes

Infos : Données et méthodes, choix de multireprésentation, références bibliographiques

Offres et réservation

  • 110 000 annonces ouvertes à la réservation au moins un jour dans l’année (2022).

  • 7,5 millions de nuitées réservées en 2022. Une forte progression jusqu’en 2019 (+60%), surtout visible en grande couronne. Vers un rattrapage des niveaux d’avant pandémie Covid-19 en 2022.

  • Paris : 81% des nuitées réservées en IDF en 2016; 54% en 2022.

Offres et réservation

  • 110 000 annonces ouvertes à la réservation au moins un jour dans l’année (2022).

  • 7,5 millions de nuitées réservées en 2022. Une forte progression jusqu’en 2019 (+60%), surtout visible en grande couronne. Vers un rattrapage des niveaux d’avant pandémie Covid-19 en 2022.

  • Paris : 81% des nuitées réservées en IDF en 2016; 54% en 2022.

Offres et réservation

Saisonnalité - un pas de temps plus fin pour détecter des comportements périodiques

  • 2017 : premières restrictions à Paris

  • 2017-2019 : baisse des nuitées disponibles, stagnation des nuitées réservées

  • 2020-2022 : stagnation des nuitées disponibles, hausse des nuitées réservées

  • En grande couronne : crise du Covid-19 très ponctuelle

  • Des niveaux d’activité records en 2022



Offres et réservation

Saisonnalité - un pas de temps plus fin pour détecter des comportements périodiques

  • A Paris et en petite couronne, une alternance haute saison / basse saison plus marquée

  • Moins d’annonces actives, mais un taux d’annonces réservées plus élevé

  • Derniers chiffres en date : quantités d’annonces plus élevées en décembre 2022 en Seine-et-Marne (5228) que dans le Val-de-Marne (4523)

Types de locations

En 2022, 21% des annonces sont louées plus de 4 mois dans l’année.

Une tendance qui s’accentue. Des spécificités locales sont à noter (Disneyland, Fontainebleau) et près des pôles aéroportuaires.

Types de locations

En combinant type d’hébergement, nombre de nuitées réservées et appartenance à des multiloueurs, 3 catégories d’annonces se distinguent : occasionnelles, semi-commerciales et commerciales

  • Les annonces occasionnelles étaient dominantes en 2016 (40%), seulement 25% en 2022.

  • Les annonces commerciales ont suivi une trajectoire inverse : 24% en 2016, 42% en 2022.

2022


Logements entiers





Chambres privées

Types de locations

En combinant type d’hébergement, nombre de nuitées réservées et appartenance à des multiloueurs, 3 catégories d’annonces se distinguent : occasionnelles, semi-commerciales et commerciales

  • Les annonces occasionnelles étaient dominantes en 2016 (40%), seulement 25% en 2022.

  • Les annonces commerciales ont suivi une trajectoire inverse : 24% en 2016, 42% en 2022.

2016

Types de locations

En combinant type d’hébergement, nombre de nuitées réservées et appartenance à des multiloueurs, 3 catégories d’annonces se distinguent : occasionnelles, semi-commerciales et commerciales

  • Les annonces occasionnelles étaient dominantes en 2016 (40%), seulement 25% en 2022.

  • Les annonces commerciales ont suivi une trajectoire inverse : 24% en 2016, 42% en 2022.

2019

Types de locations

En combinant type d’hébergement, nombre de nuitées réservées et appartenance à des multiloueurs, 3 catégories d’annonces se distinguent : occasionnelles, semi-commerciales et commerciales

  • Les annonces occasionnelles étaient dominantes en 2016 (40%), seulement 25% en 2022.

  • Les annonces commerciales ont suivi une trajectoire inverse : 24% en 2016, 42% en 2022.

2022

Types de locations

Profils communaux en 2022

  • Typologie établie à l’aide d’une classification statistique : cinq profils distincts

  • Des spécialisations communales : un gradient plus fin à Paris

Prix et revenus

Le prix médian d’une nuitée par personne s’élève à 40$ en 2022. La location coûte 1,7 fois plus cher à Paris qu’en petite couronne (31$) et presque deux fois plus qu’en grande couronne (27$).

En moyenne, ces prix ont augmenté de 36% depuis 2016. C’est à Paris que cette progression a été la plus forte (+63%).



Prix et revenus

  • Les annonces parisiennes en 2016 concentraient 88% de l’ensemble des revenus et 70% en 2022. 1,2 milliard de $ de revenus générés en 2022.

  • À Paris en 2022, 10% des hôtes Airbnb concentrent 57% des nuitées et 72% des revenus générés. Ces parts s’élevaient à 45% (nuitées) et 56% (revenus) en 2016.

Focus commune

Pour chaque commune parmi les 30 les plus fréquentées sur la période 2016-2022 :

  • Cartes infra-communales pour 13 indicateurs-clés,

  • Comparaison contexte territorial

  • Tendances et 3 indicateurs de saisonnalité

Focus commune

Pour chaque commune parmi les 30 les plus fréquentées sur la période 2016-2022 :

  • Cartes infra-communales pour 13 indicateurs-clés,

  • Comparaison contexte territorial

  • Tendances et 3 indicateurs de saisonnalité

Indicateurs-clés

A l’échelle départementale, une sélection d’indicateurs

Indicateurs-clés

Comparaison entre départements

    1. Quelles données pour observer le phénomène Airbnb ? A quelle échelle spatio-temporelle ? Quelle diffusion ?


    1. Les outils : du stockage à la représentation de données non libres


    1. Résultats : une plateforme de visualisation


  • 4. Suite du projet

Suite du projet


  • Et après

    • Transposition vers les données InsideAirbnb (stage) :

      • Intérêt : plus d’ouverture des données, projets pédagogiques

      • Enjeux méthodologiques :

        – Concordance des indicateurs entre les 2 bases de données

        – Pas de temps différent : mensuel vs trimestriel

        – Représentations différentes : permises par des données libres, échelon communal

    • Article en préparation sur la diffusion spatio-temporelle des annonces commerciales en IDF

    • Data Paper en préparation sur la question de diffusion de données non libres

Merci









Marianne Guérois (UAR RIATE, UMR Géographie-cités)

Louis Laurian, Ronan Ysebaert (UAR RIATE)

Malika Madelin (UMR PRODIG)