Le web scraping – de quoi parle-t-on ?
Le web scraping est aussi appelé « screen scraping », ou « harvesting ». Ces termes recouvrent l’ensemble des techniques consistant de récupérer le contenu d’un site web, pour les intégrer dans un autre.
Il s’agit d’une pratique fréquente. Elle permet de « nourrir » avec du contenu un site internet nouvellement lancé, afin qu’il soit immédiatement attractif aux visiteurs. Le scraping permet d’éviter la collecte des données à afficher, pratique fastidieuse qui risquerait autrement de ralentir l’offre de services. On trouve des illustrations de web scraping dans tous les domaines : site de voyage, comparateurs de prix, petites annonces, informations financières, etc.
Le droit n’est pas encore arrivé à maturité. La jurisprudence tantôt autorise, tantôt condamne le web scraping.
Le web scraping est licite
Un arrêt français rendu dans l’affaire Ryanair contre Opodo illustre la tendance la plus libérale de la jurisprudence. Ryanair poursuivait le comparateur de prix Opodo pour avoir publié seulement une partie de ses tarifs. En conséquence, les offres paraissaient peu attrayantes. En France, Ryanair fut débouté. Selon la Cour, Ryanair ne démontrait pas avoir fait des investissements suffisants dans la présentation de sa grille de prix. Le transporteur ne pouvait donc pas se prévaloir d’une protection par le droit des bases de données. Par ailleurs, la violation des conditions générales n’était pas plus efficace : ces conditions n’étaient applicables qu’à l’achat d’un billet d’avion, et non pour toute visite du site internet.
D’autres arguments existent. Parmi ceux-ci, certains web scrapers font habituellement valoir le caractère public des informations disponibles en ligne. D’autres se réfugient derrière un cadre réglementaire sectoriel propre, tel que celui prévu en matière d’informations financières, en vue de permettre l’agrégation de données de plusieurs comptes avec l’accord de leur titulaire, afin de permettre l’utilisation d’une seule et même interface pour toutes les données de paiement – un avantage précieux pour les fintech.
Le web scarping est illicite
En sens inverse, de nombreux arguments commandent la prudence. D’abord, le scraping pourrait être considéré comme une pratique déloyale parasitaire. Ceci est particulièrement vrai lorsque le scraping est le fait d’un concurrent (cas où un site immobilier duplique les annonces postées sur un autre, par opposition à un comparateur de prix qui redirige les consommateurs vers la meilleure offre).
Ensuite, il est rare que le site copié ne parvienne pas à prouver avoir réalisé un investissement substantiel dans sa base de données. Un tel investissement permet habituellement de se prévaloir d’un droit de propriété intellectuelle. Cela dépend toutefois du type d’utilisation qu’en fait le scraper. Ainsi, dans l’affaire Innoweb la Cour de justice a pu décider qu’un comparateur de prix était illégal lorsqu’il avait pour effet d’utiliser « en direct » le moteur de recherche natif et d’en reproduire les résultats dans la fenêtre du comparateur.
Les conditions d’utilisation du site copié doivent être étudiées. Le droit pénal de la contrefaçon pourrait même s’en mêler.
Notre conseil :
Le scraping est une pratique terriblement efficace pour les opérateurs qui souhaitent s’en prévaloir. Sa légalité est cependant douteuse.
Il convient donc d’en apprécier attentivement la validité. Les titulaires de base de données veilleront à faire l’audit de leurs droits de propriété intellectuelle. Ils vérifieront également l’efficacité des conditions d’utilisation de leur site internet.
Les candidats scrapers évalueront plutôt deux fois qu’une la légalité de l’utilisation qu’ils souhaitent faire des données copiées. Par ailleurs, tous les gérants de bases de données ne sont pas contraires à la réutilisation de leurs données. (Notamment, être répertorié sur un comparateur de prix peut être dans l’intérêt du titulaire des données). Le cas échéant, les scrapers veilleront à négocier des contrats d’échanges d’informations pour rester dans la légalité.