L'open data au service de l'analyse immobilière
L'ouverture des données de transactions immobilières a profondément transformé la manière dont les professionnels et les particuliers analysent le marché immobilier en France. Grâce aux Demandes de Valeurs Foncières (DVF), il est désormais possible de réaliser des analyses de marché approfondies sans avoir recours à des sources payantes.
Avant 2019, seuls les notaires et quelques acteurs institutionnels disposaient d'une vision précise des prix de vente réels. Aujourd'hui, n'importe qui peut accéder aux données de plus de 25 millions de transactions réalisées depuis 2014 sur l'ensemble du territoire français (hors Alsace-Moselle et Mayotte). Pour une présentation complète des données DVF, consultez notre article Qu'est-ce que le DVF ?
Méthodologie d'analyse des prix immobiliers
Définir le périmètre d'analyse
Avant toute analyse, il est crucial de bien définir votre périmètre. Un périmètre trop large dilue les signaux, tandis qu'un périmètre trop étroit ne fournit pas suffisamment de données pour être statistiquement significatif. Visez un minimum de 30 transactions pour obtenir des indicateurs fiables.
- Zone géographique : commune, quartier, code postal ou département. Pour une analyse fine, privilégiez le niveau commune ou code postal. A l'échelle d'un département entier, les écarts entre zones rurales et urbaines rendent les moyennes peu significatives
- Période temporelle : les tendances se dégagent mieux sur des périodes de 3 à 5 ans. Pour une estimation ponctuelle, 12 à 24 mois suffisent. Au-delà de 5 ans, les données les plus anciennes peuvent ne plus refléter les conditions actuelles du marché
- Type de bien : les dynamiques diffèrent entre appartements, maisons et terrains. Ne mélangez jamais ces catégories dans une même analyse de prix au m2
- Segment de marché : surface, nombre de pièces, gamme de prix. Un studio de 20 m2 et un 5 pièces de 120 m2 dans la même commune ont des prix au m2 très différents (le prix au m2 diminue généralement avec la surface)
Nettoyer les données
Les données brutes du DVF, disponibles en téléchargement sur data.gouv.fr, nécessitent un travail de nettoyage pour obtenir des analyses fiables :
- Exclure les valeurs aberrantes : transactions a 1 euro (donations déguisées ou cessions à titre quasi-gratuit), prix extrêmement élevés qui correspondent souvent à des transactions portant sur plusieurs biens regroupés
- Filtrer les mutations complexes : certaines transactions portent sur plusieurs lots (appartement + cave + parking), rendant le calcul du prix au m2 du logement seul impossible sans ventilation manuelle. Le champ
nombre_lotspermet d'identifier ces cas - Vérifier la cohérence surface/prix : un prix au m2 inférieur a 500 euros ou supérieur a 25 000 euros est généralement suspect (hors cas très spécifiques comme des biens de prestige à Paris 6e ou des ventes en zone rurale très reculée)
- Distinguer les types de mutations : ventes classiques vs VEFA vs adjudications. Les VEFA (Ventes en l'État Futur d'Achèvement) concernent le neuf et leurs prix sont naturellement plus élevés. Les adjudications (ventes aux enchères) peuvent au contraire se situer en dessous du marché
- Exclure les transactions familiales : les ventes entre apparentés se font souvent à prix réduit. Malheureusement, le DVF ne contient pas d'indicateur direct pour les identifier, mais un prix nettement inférieur au marché dans un secteur donné constitue un signal
Calculer les indicateurs pertinents
Plusieurs indicateurs permettent de caractériser un marché immobilier :
- Prix médian au m2 : plus robuste que la moyenne, moins sensible aux valeurs extrêmes. C'est l'indicateur de référence utilisé par les notaires et l'INSEE
- Volume de transactions : indicateur de la dynamique du marché. Un volume en baisse peut signaler un retournement avant même que les prix ne baissent
- Évolution annuelle : taux de variation des prix sur 12 mois, glissant ou calendaire. Attention aux effets de base : une hausse de 10 % après une baisse de 10 % ne ramène pas au niveau initial
- Délai de rotation : temps moyen entre deux ventes d'un même bien (identifiable par la parcelle cadastrale). Un délai court (inférieur à 3 ans) peut indiquer une activité spéculative
- Dispersion des prix : écart-type ou écart interquartile pour mesurer l'hétérogénéité du marché. Un marché très dispersé est plus difficile à estimer
L'endpoint /v1/stats d'Immo API fournit directement plusieurs de ces indicateurs (prix médian, prix moyen, volume, évolution annuelle) sans avoir à les calculer vous-même. Pour les analyses plus poussées, récupérez les données brutes via /v1/mutations et effectuez vos propres calculs.
Outils et technologies pour l'analyse
Accès aux données via API
L'utilisation d'une API de transactions immobilières est la méthode la plus efficace pour accéder aux données. Immo API permet de récupérer les données filtrées directement au format JSON, prêtes pour l'analyse. L'authentification se fait par Bearer token, et les réponses sont paginées pour gérer efficacement les grands volumes.
Pour les développeurs, notre guide technique explique en détail comment intégrer l'API dans vos projets d'analyse, avec des exemples de code en JavaScript, Python et cURL.
Analyse avec Python
Python, avec ses bibliothèques pandas, numpy et matplotlib, est l'outil de prédilection pour l'analyse de données immobilières. Voici un exemple complet d'analyse des prix parisiens :
import os
import pandas as pd
import requests
API_KEY = os.environ['IMMO_API_KEY']
# Recuperer les donnees via l'API
response = requests.get(
'https://immoapi.app/v1/mutations',
params={
'code_departement': '75',
'type_local': 'Appartement',
'annee': 2024,
'per_page': 100
},
headers={'Authorization': f'Bearer {API_KEY}'}
)
data = response.json()['mutations']
df = pd.DataFrame(data)
# Calculer le prix au m2
df['prix_m2'] = df['valeur_fonciere'] / df['surface_reelle_bati']
# Exclure les valeurs aberrantes
df = df[(df['prix_m2'] > 2000) & (df['prix_m2'] < 25000)]
# Statistiques descriptives
print(df['prix_m2'].describe())
# Evolution mensuelle
df['mois'] = pd.to_datetime(df['date_mutation']).dt.to_period('M')
evolution = df.groupby('mois')['prix_m2'].median()
print(evolution)
Pour une analyse plus complète, utilisez la pagination pour récupérer l'ensemble des transactions (voir notre guide développeur).
Visualisation avec des outils BI
Les données DVF se prêtent particulièrement bien a la visualisation. Voici les types de graphiques les plus pertinents :
- Cartes de chaleur (heatmaps) : représentation spatiale des prix au m2. En utilisant les coordonnées GPS fournies par la version DVF+ du Cerema ou l'endpoint
/v1/mutations/nearbyd'Immo API, vous pouvez créer des cartes interactives montrant les variations de prix au sein d'une même ville - Graphiques temporels (line charts) : évolution des prix médians et des volumes mois par mois. Superposez prix et volumes pour détecter les divergences (prix qui montent alors que les volumes baissent, signal classique de fin de cycle haussier)
- Diagrammes de dispersion (scatter plots) : relation prix/surface, idéal pour repérer les bonnes affaires (points sous la droite de tendance) et les biens surévalués (points au-dessus)
- Histogrammes et boxplots : distribution des prix par type de bien, par arrondissement ou par nombre de pièces. Les boxplots sont particulièrement utiles pour visualiser la dispersion et les valeurs aberrantes
Des outils comme Tableau, Power BI, Metabase ou même Google Sheets (avec l'extension Charts) peuvent consommer directement les données JSON de l'API pour alimenter des tableaux de bord actualisés automatiquement.
Analyses types et insights
Analyse par commune
Comparer les prix entre communes permet d'identifier les zones les plus attractives et les opportunités d'investissement. Les écarts de prix entre communes limitrophes peuvent révéler des dynamiques intéressantes. Par exemple, en 2024, le prix médian au m2 à Montreuil (93100) était environ 40 % inférieur à celui du 20e arrondissement de Paris, pourtant situé juste de l'autre côté du périphérique. Ce type d'analyse se réalise facilement en interrogeant l'endpoint /v1/stats d'Immo API pour chaque commune.
Autre exemple révélateur : dans la métropole lyonnaise, les prix varient du simple au triple entre Villeurbanne (environ 3 500 euros/m2) et le 6e arrondissement de Lyon (plus de 6 000 euros/m2), alors que ces zones sont séparées de seulement quelques rues.
Analyse temporelle
L'analyse de l'évolution des prix dans le temps permet de détecter les cycles du marché, les effets saisonniers et les tendances de fond. Les données DVF, disponibles depuis 2014, offrent un recul suffisant pour identifier ces patterns. On observe par exemple un effet saisonnier marqué : les volumes de transactions sont généralement plus élevés au printemps (mars-juin) et en automne (septembre-novembre), avec un creux estival et hivernal. Les prix suivent une dynamique similaire mais plus atténuée.
Sur la période 2014-2024, les données DVF révèlent des tendances contrastées selon les territoires : forte hausse à Bordeaux et Nantes (plus de 50 % en 10 ans), stagnation à Paris intra-muros depuis 2020 après une décennie de hausse continue, et reprise dans certaines villes moyennes post-Covid (Angers, Tours, Limoges).
Segmentation par type de bien
Les dynamiques de prix diffèrent significativement entre les types de biens. Les studios dans les villes étudiantes (Rennes, Montpellier, Toulouse) ont un prix au m2 supérieur de 20 à 30 % aux grands appartements dans les mêmes zones. Les maisons familiales en grande couronne parisienne ont connu une hausse spectaculaire post-Covid (2020-2022), liée au télétravail et à la recherche d'espace extérieur. Les terrains constructibles suivent des logiques encore différentes, fortement influencées par les PLU (Plans Locaux d'Urbanisme) et les ZAC (Zones d'Aménagement Concerté).
Analyse croisée avec les données socio-économiques
En combinant les données DVF avec les données socio-économiques de l'INSEE, on peut calculer des indicateurs d'accessibilité au logement. Par exemple, le ratio prix médian / revenu médian annuel donne le nombre d'années de revenu nécessaires pour acheter un bien. A Paris, ce ratio dépasse 15 ans pour un appartement moyen, contre 5 à 7 ans dans la plupart des villes moyennes. Ce type d'analyse est précieux pour les collectivités qui définissent leurs politiques de logement.
Limites de l'analyse basée sur le DVF
Il est important de garder a l'esprit certaines limites pour éviter des conclusions erronées :
- Absence de données qualitatives : les données ne reflètent pas l'état du bien au moment de la vente. Un appartement rénové et un appartement à rénover au même étage du même immeuble apparaîtront de la même manière dans le DVF, alors que leurs prix peuvent varier de 20 à 40 %
- Prix affichés vs prix de vente : le DVF enregistre les prix de vente réels (issus des actes notariés), qui sont souvent inférieurs aux prix affichés sur les portails d'annonces. La négociation moyenne se situe entre 3 et 7 % selon les marchés
- Marché locatif exclu : le DVF ne couvre que les ventes, pas les locations. Pour une analyse du marché locatif, il faut se tourner vers d'autres sources (observatoires des loyers, données ANIL)
- Transactions familiales : les ventes entre membres d'une même famille peuvent biaiser les statistiques vers le bas, car elles se font souvent à prix réduit
- Décalage de publication : les données sont mises à jour en avril et en octobre, avec un décalage d'environ 6 mois. Une vente signée en janvier ne sera visible qu'à partir de juillet environ. Cela limite l'analyse « en temps réel » du marché
- Couverture incomplète : l'Alsace (Bas-Rhin, Haut-Rhin), la Moselle et Mayotte ne sont pas couvertes. Pour ces territoires, consultez le site DVF d'Etalab qui peut fournir des informations complémentaires pour certaines zones
Perspectives et évolutions
L'analyse immobilière basée sur les données ouvertes continue d'évoluer rapidement :
- Intelligence artificielle : les modèles de machine learning (gradient boosting, réseaux de neurones) permettent des estimations de plus en plus précises en combinant les données DVF avec des features dérivées (proximité des transports, commerces, écoles). Des marges d'erreur inférieures à 10 % sont désormais atteignables sur les marchés les plus liquides
- Croisement de données : enrichissement avec les données INSEE (revenus, démographie), cadastrales (parcelles, bâtiments), environnementales (DPE, risques naturels) et de mobilité (transports en commun). Le croisement DVF + DPE (Diagnostic de Performance Énergétique) est particulièrement prometteur pour mesurer l'impact de la performance énergétique sur les prix, un sujet de plus en plus prégnant avec les réglementations sur les passoires thermiques
- Temps réel : réduction progressive du décalage de publication. La tendance est à une mise à disposition plus rapide des données, même si le délai lié à l'enregistrement notarial constitue un plancher incompressible
- Granularité : amélioration de la géolocalisation et des métadonnées, notamment grâce à la version DVF+ du Cerema qui fournit des coordonnées GPS précises pour chaque transaction
Conclusion
Les données ouvertes DVF ont démocratisé l'analyse du marché immobilier en France. Combinées a des outils modernes et des API performantes comme Immo API, elles permettent a quiconque de réaliser des analyses de marché professionnelles. Que vous soyez investisseur, agent immobilier, développeur ou chercheur, ces données constituent une ressource précieuse pour comprendre et anticiper les dynamiques du marché immobilier français.
Pour aller plus loin, créez un compte sur immoapi.app et exploitez les endpoints /v1/mutations, /v1/mutations/nearby et /v1/stats pour alimenter vos analyses. Le plan Starter à 29 euros/mois (1 000 requêtes/jour) est suffisant pour la plupart des projets d'analyse, et le plan Pro à 49 euros/mois (requêtes illimitées) convient aux applications en production. Consultez notre guide développeur pour les exemples de code et les bonnes pratiques d'intégration.