Le scraping est-il légal ? Découvrez vos droits ici !

Le web scraping – de quoi parle-t-on ?

Le web scraping est aussi appelé « screen scraping », ou « harvesting ». Ces termes recouvrent l’ensemble des techniques consistant de récupérer le contenu d’un site web, pour les intégrer dans un autre.

Il s’agit d’une pratique fréquente. Elle permet de « nourrir » avec du contenu un site internet nouvellement lancé, afin qu’il soit immédiatement attractif aux visiteurs. Le scraping permet d’éviter la collecte des données à afficher, pratique fastidieuse qui risquerait autrement de ralentir l’offre de services. On trouve des illustrations de web scraping dans tous les domaines : site de voyage, comparateurs de prix, petites annonces, informations financières, etc.

Le droit n’est pas encore arrivé à maturité. La jurisprudence tantôt autorise, tantôt condamne le web scraping.

Le web scraping est licite

Un arrêt français rendu dans l’affaire Ryanair contre Opodo illustre la tendance la plus libérale de la jurisprudence. Ryanair poursuivait le comparateur de prix Opodo pour avoir publié seulement une partie de ses tarifs. En conséquence, les offres paraissaient peu attrayantes. En France, Ryanair fut débouté. Selon la Cour, Ryanair ne démontrait pas avoir fait des investissements suffisants dans la présentation de sa grille de prix. Le transporteur ne pouvait donc pas se prévaloir d’une protection par le droit des bases de données. Par ailleurs, la violation des conditions générales n’était pas plus efficace : ces conditions n’étaient applicables qu’à l’achat d’un billet d’avion, et non pour toute visite du site internet.

D’autres arguments existent. Parmi ceux-ci, certains web scrapers font habituellement valoir le caractère public des informations disponibles en ligne. D’autres se réfugient derrière un cadre réglementaire sectoriel propre, tel que celui prévu en matière d’informations financières, en vue de permettre l’agrégation de données de plusieurs comptes avec l’accord de leur titulaire, afin de permettre l’utilisation d’une seule et même interface pour toutes les données de paiement – un avantage précieux pour les fintech.

Le web scarping est illicite

En sens inverse, de nombreux arguments commandent la prudence. D’abord, le scraping pourrait être considéré comme une pratique déloyale parasitaire. Ceci est particulièrement vrai lorsque le scraping est le fait d’un concurrent (cas où un site immobilier duplique les annonces postées sur un autre, par opposition à un comparateur de prix qui redirige les consommateurs vers la meilleure offre).

Ensuite, il est rare que le site copié ne parvienne pas à prouver avoir réalisé un investissement substantiel dans sa base de données. Un tel investissement permet habituellement de se prévaloir d’un droit de propriété intellectuelle. Cela dépend toutefois du type d’utilisation qu’en fait le scraper. Ainsi, dans l’affaire Innoweb la Cour de justice a pu décider qu’un comparateur de prix était illégal lorsqu’il avait pour effet d’utiliser « en direct » le moteur de recherche natif et d’en reproduire les résultats dans la fenêtre du comparateur.

Les conditions d’utilisation du site copié doivent être étudiées. Le droit pénal de la contrefaçon pourrait même s’en mêler.

Ons advies:

Le scraping est une pratique terriblement efficace pour les opérateurs qui souhaitent s’en prévaloir. Sa légalité est cependant douteuse.

Il convient donc d’en apprécier attentivement la validité. Les titulaires de base de données veilleront à faire l’audit de leurs droits de propriété intellectuelle. Ils vérifieront également l’efficacité des conditions d’utilisation de leur site internet.

Les candidats scrapers évalueront plutôt deux fois qu’une la légalité de l’utilisation qu’ils souhaitent faire des données copiées. Par ailleurs, tous les gérants de bases de données ne sont pas contraires à la réutilisation de leurs données. (Notamment, être répertorié sur un comparateur de prix peut être dans l’intérêt du titulaire des données). Le cas échéant, les scrapers veilleront à négocier des contrats d’échanges d’informations pour rester dans la légalité.

Afdrukken
Delen

Cookie	Type	Looptijd	Omschrijving
_wpas_session	session	30 minutes	This cookie is used by Awesome Support (online consultation / SOS) to keep track of website state between page loads and to store temporary information essential to the website's ability to work properly.More info: https://getawesomesupport.com/documentation/awesome-support/cookies/
cookielawinfo-checkbox-necessary	persistent	11 months	This cookie is set by GDPR Cookie Consent plugin. The purpose of this cookie is to check whether or not the user has given the consent to the usage of cookies under the category 'Necessary'.
cookielawinfo-checkbox-non-necessary	persistent	11 months	This cookie is set by GDPR Cookie Consent plugin. The purpose of this cookie is to check whether or not the user has given their consent to the usage of cookies under the category 'Non-Necessary'.
PHPSESSID	session		This cookie is native to PHP applications. The cookie is used to store and identify a users' unique session ID for the purpose of managing user session on the website. The cookie is a session cookie and is deleted when all the browser windows are closed.
pll_language	persistent	1 year	This cookie is set by Polylang and is used to remember the language selected by the user when he comes back to visit again the website. This cookie is also used to get the language information when not available in another way. Examples are ajax requests or the login page.More info: https://polylang.pro/doc/is-polylang-compatible-with-the-eu-cookie-law/
viewed_cookie_policy	persistent	1 hour	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.
woocommerce_cart_hash	session		This cookie is set by WooCommerce and is used to help WooCommerce determine when cart contents/data changes.More info: https://docs.woocommerce.com/document/woocommerce-cookies/
woocommerce_items_in_cart_	session		This cookie is set by WooCommerce and is used to help WooCommerce determine when cart contents/data changes.More info: https://docs.woocommerce.com/document/woocommerce-cookies/
wordpress_[hash]	session		This cookie is set by Wordpress and is used to store the authentication details on login. The authentication details include the username and double hashed copy of the password. However, this usage of the cookie is limited to the admin console area, the backend dashboard of the website.Here [hash] represents the value that is obtained by applying a specific mathematical formula applied to the username and password. It is to ensure that the input values are safe, and no one can access these data using the cookies as it is difficult to ‘unhash’ the hashed data.More info : https://wordpress.org/support/article/cookies/
wordpress_logged_in_[hash]	persistent	14 days	This cookie is set by Wordpress and is used to indicate when you are logged in, and who you are. This cookie is maintained on the front-end of the website as well when logged in.More info: https://wordpress.org/support/article/cookies/
wordpress_test_cookie	session		This cookie is set by Wordpress and is used to store the authentication details on login. The authentication details include the username and double hashed copy of the password. However, this usage of the cookie is limited to the admin console area, the backend dashboard of the website.Here [hash] represents the value that is obtained by applying a specific mathematical formula applied to the username and password. It is to ensure that the input values are safe, and no one can access these data using the cookies as it is difficult to ‘unhash’ the hashed data.More info: https://wordpress.org/support/article/cookies/
wp_woocommerce_session_	persistent	2 days	This cookie is set by WooCommerce. It contains a unique code for each customer so that it knows where to find the cart data in the database for each Customer.More info: https://docs.woocommerce.com/document/woocommerce-cookies/
wp-settings-{time}-[UID]	persistent	1 year	This cookie is set by Wordpress and is used to customize the view of your admin interface and the front-end of the website. The value represented by [UID] is the individual user ID of the user as given to them in the users' database table.More info: https://wordpress.org/support/article/cookies/

Cookie	Type	Looptijd	Omschrijving
_ga	third party	2 years	This cookie is installed by Google Analytics 4. The cookie is used to distinguish users for the site's analytics report.Opt-out: https://tools.google.com/dlpage/gaoptout/More info: https://developers.google.com/analytics/devguides/collection/analyticsjs/cookie-usage
_ga_	third party	2 years	This cookie is installed by Google Universal Analytics to persist session state.Opt-out: https://tools.google.com/dlpage/gaoptout/More info: https://developers.google.com/analytics/devguides/collection/analyticsjs/cookie-usage

Cookie	Type	Looptijd	Omschrijving
GPS	third party	30 minutes	This cookie is set by YouTube and registers a unique ID for tracking users based on their geographical locationMore info: https://policies.google.com/technologies/types?hl=en
IDE	third party	2 years	Used by Google DoubleClick and stores information about how the user uses the website and any other advertisement before visiting the website. This is used to present users with ads that are relevant to them according to the user profile.More info: https://policies.google.com/technologies/types?hl=en
VISITOR_INFO1_LIVE	third party	5 months	This cookie is set by YouTube. Used to track the information of the embedded YouTube videos on a website.More info: https://policies.google.com/technologies/types?hl=en
YSC	third party		This cookie is set by YouTube and is used to track the views of embedded videos.More info: https://policies.google.com/technologies/types?hl=en