Données, outils, résultats
UAR RIATE
Thématique : diffusion spatio-temporelle des locations meublées touristiques au-delà de Paris intra-muros, évolution des catégories d’annonces, pression sur le parc de logements. Travaux dans la continuité des projets Grandes métropoles CIST 2016-2019 ; ANR WisDHoM 2020-2023.
Méthodologique : nouvelle source de données multidimensionnelle (spatiale x temporelle x thématique) = grand intérêt analytique et exploratoire. Documentation du protocole de recherche dans un souci de science ouverte (cf. site web produit par RIATE à l’issue de l’ANR WisDHom)
Politique : face aux difficultés d’accès aux données et aux enjeux socio-politiques de leur ouverture, un prototype de site web pour servir de levier à la mutualisation des données et au partage d’indicateurs et de visualisations utiles à la prise de décision dans la durée. Collaboration avec APUR et J. Richon (Eirest/Lab’Urba).
France : deuxième marché Airbnb dans le monde (130M de nuitées réservées en 2022), Paris 1ère ville
Rapport Oxfam : une absence de régulation des acteurs privés, Airbnb comme niche fiscale
Effet de pression sur l’accès au logement
Trouillard E., 2021, Les locations saisonnières en Île-de-France, État des lieux d’avant crise, L’Institut Paris Région, p.52
Une plateforme de données en libre accès
Données mises à jour régulièrement
Mais limitée aux communes centres
Données webscrapées
Murray Cox, “Community artist, data activist and technologist”
Une démarche militante qui a pour but de fournir des données sur l’impact d’Airbnb sur le parc de logement
Des données utiles à des fins de recherche (partenariats), mais pour l’instant limitées aux informations rendues disponibles par le site Airbnb
1 fichier + 3 archives disponibles
75 variables x 68.000 lignes pour Paris (1 ligne par annonce)
Disponibilité et activité des logements, informations sur les hôtes, type de logement
Faire une requête à Murray Cox pour les données antérieures
Un site orienté vers l’investissement immobilier
Profondeur temporelle : depuis 2014
Couverture spatiale : Commune(s) au choix
Indicateurs sur l’activité et les revenus des logements
Payant
Méthodologie peu claire (rétroaction sur les données ?) et liens flous avec Airbnb
Données payantes et clause de contrat interdisant la rediffusion du produit brut
Problème pour les communes avec peu de locations Airbnb (secret statistique)
Protection des données personnelles sur certaines variables
Un fichier dit “individuel”
443 000 lignes et 70 variables pour l’IDF
1 ligne = 1 annonce
Résumé sur l’année passée (LTM = Last Twelve Months)
Un fichier dit “mensuel”
13 millions de lignes et 29 variables descriptives pour l’IDF
1 ligne = 1 mois x 1 annonce
Indicateurs de revenus générés et de nuitées réservées
Indicateurs clés : onglets par thématique
Annonces et réservations : nombre d’annonces / de nuitées réservées, taux d’occupation…
Type de réservations : type de logements, part de logements entiers, saisonnalité, prix par personne…
Pression sur marché du logement, professionnalisation : nombre de locations pour 1000 résidences principales, part de locations «permanentes» (>120 nuitées), part de locations détenues par multiloueurs, revenus générés…
Choix méthodologiques pour la visualisation
Série temporelles (2016-2022)
Choix cartographiques (discrétisation, seuils)
Multi-visualisations : 3 espaces d’étude,
3 niveaux d’observation
A la commune / IRIS
Indicateurs clés : onglets par thématique
Annonces et réservations : nombre d’annonces / de nuitées réservées, taux d’occupation…
Type de réservations : type de logements, part de logements entiers, saisonnalité, prix par personne…
Pression sur marché du logement, professionnalisation : nombre de locations pour 1000 résidences principales, part de locations «permanentes» (>120 nuitées), part de locations détenues par multiloueurs, revenus générés…
Choix méthodologiques pour la visualisation
Série temporelles (2016-2022)
Choix cartographiques (discrétisation, seuils)
Multi-visualisations : 3 espaces d’étude,
3 niveaux d’observation
A la grille (1000m / 200m)
Indicateurs clés : onglets par thématique
Annonces et réservations : nombre d’annonces / de nuitées réservées, taux d’occupation…
Type de réservations : type de logements, part de logements entiers, saisonnalité, prix par personne…
Pression sur marché du logement, professionnalisation : nombre de locations pour 1000 résidences principales, part de locations «permanentes» (>120 nuitées), part de locations détenues par multiloueurs, revenus générés…
Choix méthodologiques pour la visualisation
Série temporelles (2016-2022)
Choix cartographiques (discrétisation, seuils)
Multi-visualisations : 3 espaces d’étude,
3 niveaux d’observation
Carte lissée
Dans une optique de science ouverte et reproductible :
R : Traitement des données (des données brutes aux données consolidées) et construction des 3000+ cartes et figures
Observable JavaScript (OJS) : Sélecteurs interactifs, visualisations dynamiques
Quarto : Construction et mise en ligne du site internet, travail éditorial
Dépôts GitLab Huma-Num partagé entre les 4 membres du projet
Premier dépôt (privé) : données brutes, scripts, sorties PNG
Second dépôt (public) : données agrégées, architecture du site web (intégration CD/CI)
viewof indic = Inputs.radio(inds, {label: "Indicateur :", value: "Part de locations Airbnb pour 1000 résidences principales"})
viewof maillaj = Inputs.radio(maillage, {label: "Maillage :", value: "Carte lissée"})
viewof years = Inputs.range([2016,2022], {label: "Année:", value: 2022, step: 1})Pour représenter les 3000+ cartes et graphiques : 4 onglets thématiques commentés (chiffres clés),
2 zooms indicateurs / communes
Infos : Données et méthodes, choix de multireprésentation, références bibliographiques
110 000 annonces ouvertes à la réservation au moins un jour dans l’année (2022).
7,5 millions de nuitées réservées en 2022. Une forte progression jusqu’en 2019 (+60%), surtout visible en grande couronne. Vers un rattrapage des niveaux d’avant pandémie Covid-19 en 2022.
Paris : 81% des nuitées réservées en IDF en 2016; 54% en 2022.
110 000 annonces ouvertes à la réservation au moins un jour dans l’année (2022).
7,5 millions de nuitées réservées en 2022. Une forte progression jusqu’en 2019 (+60%), surtout visible en grande couronne. Vers un rattrapage des niveaux d’avant pandémie Covid-19 en 2022.
Paris : 81% des nuitées réservées en IDF en 2016; 54% en 2022.
2017 : premières restrictions à Paris
2017-2019 : baisse des nuitées disponibles, stagnation des nuitées réservées
2020-2022 : stagnation des nuitées disponibles, hausse des nuitées réservées
En grande couronne : crise du Covid-19 très ponctuelle
Des niveaux d’activité records en 2022
A Paris et en petite couronne, une alternance haute saison / basse saison plus marquée
Moins d’annonces actives, mais un taux d’annonces réservées plus élevé
Derniers chiffres en date : quantités d’annonces plus élevées en décembre 2022 en Seine-et-Marne (5228) que dans le Val-de-Marne (4523)
En 2022, 21% des annonces sont louées plus de 4 mois dans l’année.
Une tendance qui s’accentue. Des spécificités locales sont à noter (Disneyland, Fontainebleau) et près des pôles aéroportuaires.
En combinant type d’hébergement, nombre de nuitées réservées et appartenance à des multiloueurs, 3 catégories d’annonces se distinguent : occasionnelles, semi-commerciales et commerciales
Les annonces occasionnelles étaient dominantes en 2016 (40%), seulement 25% en 2022.
Les annonces commerciales ont suivi une trajectoire inverse : 24% en 2016, 42% en 2022.
2022
Logements entiers
Chambres privées
En combinant type d’hébergement, nombre de nuitées réservées et appartenance à des multiloueurs, 3 catégories d’annonces se distinguent : occasionnelles, semi-commerciales et commerciales
Les annonces occasionnelles étaient dominantes en 2016 (40%), seulement 25% en 2022.
Les annonces commerciales ont suivi une trajectoire inverse : 24% en 2016, 42% en 2022.
2016
En combinant type d’hébergement, nombre de nuitées réservées et appartenance à des multiloueurs, 3 catégories d’annonces se distinguent : occasionnelles, semi-commerciales et commerciales
Les annonces occasionnelles étaient dominantes en 2016 (40%), seulement 25% en 2022.
Les annonces commerciales ont suivi une trajectoire inverse : 24% en 2016, 42% en 2022.
2019
En combinant type d’hébergement, nombre de nuitées réservées et appartenance à des multiloueurs, 3 catégories d’annonces se distinguent : occasionnelles, semi-commerciales et commerciales
Les annonces occasionnelles étaient dominantes en 2016 (40%), seulement 25% en 2022.
Les annonces commerciales ont suivi une trajectoire inverse : 24% en 2016, 42% en 2022.
2022
Typologie établie à l’aide d’une classification statistique : cinq profils distincts
Des spécialisations communales : un gradient plus fin à Paris
Le prix médian d’une nuitée par personne s’élève à 40$ en 2022. La location coûte 1,7 fois plus cher à Paris qu’en petite couronne (31$) et presque deux fois plus qu’en grande couronne (27$).
En moyenne, ces prix ont augmenté de 36% depuis 2016. C’est à Paris que cette progression a été la plus forte (+63%).
Les annonces parisiennes en 2016 concentraient 88% de l’ensemble des revenus et 70% en 2022. 1,2 milliard de $ de revenus générés en 2022.
À Paris en 2022, 10% des hôtes Airbnb concentrent 57% des nuitées et 72% des revenus générés. Ces parts s’élevaient à 45% (nuitées) et 56% (revenus) en 2016.
viewof conc1_dep = Inputs.radio(["annonces", "loueurs"], {value: "loueurs", label : "Combien les"})
viewof conc2_dep = Inputs.radio(["nuitées", "revenus"], {value: "nuitées", label : "concentrent de"})
viewof dep_ = Inputs.select(["Paris (75)", "Seine-et-Marne (77)", "Yvelines (78)", "Essonne (91)", "Hauts-de-Seine (92)",
"Seine-Saint-Denis (93)", "Val-de-Marne (94)", "Val d'Oise (95)"],
{value: "Paris (75)", label: "dans le département"})
viewof annee_dep = Inputs.select(["2016", "2017", "2018", "2019", "2020", "2021", "2022"],
{value: "2022", label: "en"})
newtab_dep_ = cum_dep.filter(d => d.DEP == dep_ && d.annee == annee_dep && d.conc1 == conc1_dep && d.conc2 == conc2_dep)
viewof k_dep = Inputs.range([0, newtab_dep_.length -1], {step: 1, format: (x) => newtab_dep_[x].Concentreur, value: 10, label: "Curseur"})k2_dep = newtab_dep_.filter(d => d.Concentreur === newtab_dep_[k_dep].Concentreur)
md` ${k2_dep[0].Concentreur}% des ${k2_dep[0].conc1} concentrent ${k2_dep[0].Concentré}% des ${k2_dep[0].conc2}.`addTooltips(
Plot.plot({
width: 470,
y: {label: k2_dep[0].conc2},
x: {label: k2_dep[0].conc1},
marks: [
Plot.line(newtab_dep_, {
x: "Concentreur",
y: "Concentré",
stroke: "lightgrey",
title: (d) =>
`${d.Concentreur} % des ${d.conc1} concentrent ${d.Concentré} % des ${d.conc2}.`
}),
Plot.dot(k2_dep, {x: "Concentreur", y: "Concentré",
title: (d) =>
`${d.Concentreur} % des ${d.conc1} concentrent ${d.Concentré} % des ${d.conc2}.`})
]
}),
{
stroke: "steelblue"
}
)Pour chaque commune parmi les 30 les plus fréquentées sur la période 2016-2022 :
Cartes infra-communales pour 13 indicateurs-clés,
Comparaison contexte territorial
Tendances et 3 indicateurs de saisonnalité
Pour chaque commune parmi les 30 les plus fréquentées sur la période 2016-2022 :
Cartes infra-communales pour 13 indicateurs-clés,
Comparaison contexte territorial
Tendances et 3 indicateurs de saisonnalité
A l’échelle départementale, une sélection d’indicateurs
Comparaison entre départements
viewof ind_dep = Inputs.select(indics, {value: "Nombre d'annonces actives" ,label: "Indicateur :"})
viewof deps = Inputs.checkbox(DEP, {label: "Département(s) :", multiple: true, value: ["Paris (75)",
"Hauts-de-Seine (92)"]})colors = ["#66c2a5", "#fc8d62", "#8da0cb", "#e78ac3", "#a6d854", "#ffd92f", "#e5c494", "#b3b3b3"]
colorbydep = new Map(DEP.map((d, i) => [d, colors[i]]))
Plot.plot({
y: {
grid: true,
label : ind_dep
},
marginRight: 100,
marginLeft: 100,
marks: [
Plot.axisX({ticks: ["2015", "2016", "2017", "2018", "2019", "2020", "2021", "2022"], tickFormat: ""}),
Plot.line(newtab_depp, {x: "Année", y: "tot", z: "DEP", stroke: d => colorbydep.get(d.DEP)}),
Plot.text(newtab_depp, Plot.selectLast({x: "Année", y: "tot", z: "DEP", text: "DEP",
textAnchor: "start", dx : 3}))
]
})Jusqu’ici
Un prototype de site web qui n’a pas vocation à être mis à jour
Plateforme présentée lors d’un colloque co-organisé par le RIATE et l’APUR, le 29/09/2023
En lien avec d’autres projets de recherche
Et après
Transposition vers les données InsideAirbnb (stage) :
Intérêt : plus d’ouverture des données, projets pédagogiques
Enjeux méthodologiques :
– Concordance des indicateurs entre les 2 bases de données
– Pas de temps différent : mensuel vs trimestriel
– Représentations différentes : permises par des données libres, échelon communal
Article en préparation sur la diffusion spatio-temporelle des annonces commerciales en IDF
Data Paper en préparation sur la question de diffusion de données non libres
Merci
Marianne Guérois (UAR RIATE, UMR Géographie-cités)
Louis Laurian, Ronan Ysebaert (UAR RIATE)
Malika Madelin (UMR PRODIG)
Midis de Géotéca - 14/12/2023