Le sujet de la fouille de données (ou data mining) dans les bases d'archivage d'articles des groupes d'édition scientifique soulève de vifs débats avec la communauté des chercheurs scientifiques qui rédigent ces articles, et souhaitent parfois conduire des études dont le corpus est précisément ce contenu, afin de déterminer des tendances, faire apparaître des centres d'intérêt, des évolutions dans les travaux, etc.
Ces échanges se sont intensifiés autour du projet de loi pour une République numérique. Alors que le gouvernement a finalement écarté la question dans son texte, les députés l'ont réintroduite via un amendement de l'opposition mais voté à l'unanimité. Le gouvernement a demandé aux sénateurs de supprimer cet article 18bis, expliquant qu'il était préférable d'attendre la nouvelle réglementation européenne en préparation.
« Sans léser les éditeurs »
Le Sénat a rejeté cette solution et a proposé un amendement de compromis, empêchant les éditeurs d'interdire la fouille de texte et de données, mais les laissant libres d'en aménager les dispositions par contrat. "Il est déjà possible de fouiller les corpus par contrat, mais cet amendement oblige à l'autoriser dans tous les contrats, sans spécification technique ou financière. Cet article permettra à la recherche d'avancer sans léser les éditeurs", expliquait Colette Mélot, rapporteure du projet de loi, devant la commission des affaires culturelles du Sénat.
Cette version satisfait le SNE et la FNPS, sous condition de précision par décret. Les éditeurs évitent ainsi une exception, et restent maîtres des procédures de mise en œuvre, ce que la communauté des chercheurs considère avec méfiance, craignant que les conditions fixées vident de leur intérêt ces programmes de fouilles de textes. Dans leur communiqué, les éditeurs prévoient dans leurs futurs contrats d'accepter toutes les demandes "sans limitation autre que technique du volume des publications ainsi soumises à la fouille électronique" et à condition "que la sécurisation de leurs œuvres soit effectivement assurée, et que ces opérations de FTD n’entraînent aucun surcoût pour les éditeurs ou les agrégateurs concernés".
Le SNE et la FNPS publient ce communiqué avant la réunion d'une commission mixte paritaire entre députés et sénateurs, qui devront trouver une version commune de ce projet de loi voté dans des termes différents par les deux assemblées. Faute de compromis, c'est la version de l'Assemblée nationale qui l'emportera. La composition de cette commission n'est pas encore fixée, ni la date de sa réunion. Le texte contient d'autres dispositions touchant au droit d'auteur qui font débat, dont l'accès ouvert des publications scientifiques 6 à 12 mois après leur publication, ou la liberté de panorama.