Passer au playerPasser au contenu principal
  • il y a 2 jours
Lundi 13 avril 2026, retrouvez Patrick Bourbeau (Vice-Président Affaires juridiques, La Presse) et Sandrine Cochard, (Directrice de la rédaction, Mind) dans SMART TECH, une émission présentée par Delphine Sabattier.

Catégorie

🗞
News
Transcription
00:04Les sites d'information en ligne font face à un pillage de bots par les bots IA qui viennent attaquer
00:11leur contenu, contenu protégé.
00:13On en parle aujourd'hui avec deux personnes expertes et impliquées sur cette thématique.
00:19Sandrine Cochard est avec moi au plateau. Bonjour.
00:21Bonjour Nathalie.
00:21Bonjour Sandrine, directrice de la rédaction de Mind, qui est un groupe média spécialisé dans l'information B2B stratégique.
00:27Vous êtes aussi la vice-présidente du GEST, qui est le groupement des éditeurs de contenu, de médias et de
00:33services en ligne.
00:34Et puis on a vu, connecté avec nous à distance, Maître Patrick Bourbeau.
00:39Bonjour Maître.
00:40Vous êtes vice-président, responsable des affaires juridiques de la presse, qui est un média d'information de référence au
00:46Canada.
00:47Et comme avec d'autres médias canadiens d'ailleurs, vous poursuivez OpenAI pour violation de droit d'auteur.
00:54Alors, on va peut-être démarrer ensemble, Maître Bourbeau, juste pour que vous nous fassiez un petit rappel des faits
00:58de cette procédure que vous avez lancée en novembre 2024.
01:02Oui, en fait, c'est en novembre 2025.
01:05Pardon.
01:05Je vous corrige, c'était à la fin novembre 2025.
01:08Il y a une première poursuite qui a été déposée par d'autres médias canadiens en novembre 2024.
01:13Nous ne nous sommes pas joints à cette poursuite-là.
01:16En fait, nous avons déposé notre propre poursuite en novembre 2025 contre OpenAI.
01:21Très bien. Désolé pour la confusion.
01:24Alors, vous avez déclaré d'ailleurs dans une tribune qui m'a vraiment interpellé que ça faisait partie de leur
01:31modèle d'affaires, finalement, de piller les contenus protégés.
01:36En fait, oui, ce qu'il faut comprendre, c'est que je vais m'exprimer assez crûment.
01:42Au cours des dernières années, c'est un vol à grande échelle qui a été perpétré par les plateformes d
01:47'IA.
01:47En fait, ils se sont alimentés avec leurs robots.
01:50Ils sont venus piller le contenu de centaines de milliers de sites web, dont les sites web des médias,
01:56pour entraîner leur grand modèle de langage le plus communément connu sous l'expression LLM.
02:03Et ça, aujourd'hui, Sandrine Cochard, par exemple, en France aussi, vous le constatez,
02:07il y a un assaut de bots IA qui viennent chercher du contenu ?
02:11Oui, alors...
02:12Sans autorisation ?
02:13Sans autorisation, certains avec des autorisations.
02:15Mais ce qu'on constate, ce qui est documenté aujourd'hui, c'est qu'effectivement, il y a une montée
02:19en puissance
02:20du nombre de scrappings, du nombre de bots qui viennent scraper les sites des éditeurs.
02:25Est-ce qu'on sait dire d'où viennent ces bots ?
02:27Oui, on peut tracer l'origine. On a des outils. En fait, quand on est un éditeur et qu'on
02:31monite ses audiences,
02:33on a des outils qui nous permettent aussi de voir un petit peu l'origine du trafic que l'on
02:37obtient.
02:37On a aussi des outils qui existent, qui permettent de filtrer les bots,
02:40qui permettent de les identifier et donc de délivrer des autorisations.
02:44Oui, non, j'autorise par exemple le bot de OpenAI à venir.
02:48Et je peux même moduler, proposer une granularité des autorisations que je fournis.
02:54C'est-à-dire, je peux autoriser complètement, ne pas autoriser sur tout le site
03:00ou ne pas autoriser sur certaines requêtes URL spécifiques.
03:04Juste pour vous citer quelques chiffres, parce qu'il y a une étude, il y a un acteur qui s
03:07'appelle Toolbit,
03:08qui suit énormément ça et qui publie régulièrement des études.
03:10Une étude qui s'appelle State of the Bots.
03:12Alors, je regarde juste mes notes pour être sûre de ne pas vous donner les mauvais chiffres.
03:15Mais en gros, au premier trimestre en 2025, on comptait en moyenne une visite de bots pour 200 visites humaines.
03:21Ah oui.
03:22Donc ça, c'était tranquille.
03:24Mais à la fin de l'année 2025, ce ratio est passé à une visite de bots pour 31 visites
03:29humaines.
03:30Les humains n'ont pas disparu.
03:32Ce que ça traduit, c'est qu'il y a vraiment une montée en puissance du nombre des visites de
03:36bots.
03:36Énorme accélération.
03:37Oui.
03:38Et la presse parle même de pillage systématique.
03:42Mais ça, vous pouvez avoir la preuve que c'est un pillage systématique.
03:46C'est un mot fort quand même.
03:48Oui, mais comme disait Sandrine, en fait, on a des outils pour mesurer ce pillage-là.
03:54Alors, on est en mesure vraiment de faire du tracking en temps réel.
03:59Nous, on utilise une plateforme française, en fait, qui s'appelle BotsConner, qui fait ce monitoring-là.
04:04Et puis, donc, on est en mesure de voir qu'il y a des milliers, sinon des centaines de milliers
04:10de visites de bots par jour.
04:12On est en mesure d'identifier ces bots-là par plateforme.
04:17Donc, on sait que, bon, il y a trois bots d'OpenAI.
04:21Il y a des bots de Perplexity.
04:23Il y a des bots d'Anthropic.
04:24Alors, tout ça est documenté.
04:27On est en mesure de conserver nos logs également depuis 2024.
04:31Alors, on est en mesure de démontrer que depuis, par exemple, 18 mois, avec certitude, notre contenu est pillé en
04:36temps réel.
04:37Et puis, ce qu'il faut comprendre aussi, c'est que c'est un peu une course aux armements, ce
04:41qui se passe entre les détenteurs de contenu, les propriétaires de contenu et ces plateformes-là.
04:48Au départ, on a mis à jour nos fichiers robots.txt.
04:52Les plateformes d'IA prétendaient respecter ce protocole-là.
04:55Ce qu'il faut comprendre, c'est que ce protocole-là, c'est un peu comme une pancarte, une affiche
05:00défense d'entrée qu'on met sur une porte.
05:03C'est une convention de respecter cette demande-là.
05:07Ils prétendent la respecter lorsqu'on consulte leur documentation publique sur leur propre site Web.
05:12Ils ne le font pas. Ils contournent le robot.txt.
05:16Alors, ce que les médias ont fait suite à cette constatation-là, c'est de mettre en place des mesures
05:22plus strictes,
05:23l'équivalent un peu d'une serrure pour gérer l'accès.
05:27Donc, c'est un peu comme un mur.
05:29Alors, on a mis en place, nous, la solution AWS, un firewall, le Web Access Firewall d'AWS.
05:38Il y a Cloudflare également qui offre des solutions similaires.
05:41Et malgré ça, activement, ils essaient de trouver des nouvelles façons de contourner ces mesures-là.
05:47Maintenant, ce qu'ils font, c'est qu'ils simulent, ils se démulent des navigateurs Web.
05:52Donc, pour les propriétaires de sites Web, il n'y a aucun moyen de différencier entre le navigateur qui est
06:00utilisé par un être humain et le navigateur qui est utilisé par une plateforme d'intelligence artificielle.
06:05Donc, ça devient très difficile de bloquer ce moissonnage-là de la part des plateformes d'IA.
06:12Mais là, quand on vous entend, quand on entend Patrick, on se dit que c'est presque comme un problème
06:16de cybersécurité, en fait.
06:18C'est la course à l'armement pour se protéger.
06:21C'est en fait, oui, un jeu du chat et de la souris.
06:25Ils ont effectivement une technologie qui bouge, enfin qui évolue très vite.
06:29Ils ont des moyens qui évoluent très vite.
06:30Ils ont aussi des moyens démesurés.
06:32Quand même, pour reboucler avec ce que disait Maître Bourbeau, sur notamment cette dernière notion qui est que des robots
06:40viennent dissimuler, entre guillemets,
06:42et donc avec le masque de navigateur, ça a une influence sur la stratégie des éditeurs.
06:48C'est-à-dire qu'aujourd'hui, comme ça a été rappelé très justement sur robots.txt, qui est donc
06:52un fichier que tous les éditeurs proposent sur leur site,
06:55parce que c'est l'expression finalement de son consentement et ça doit être bien l'isier par des robots.
06:59Donc c'est en effet une porte de péage, une porte mais qui ne bloque pas.
07:07Une fois qu'on a porté les diesel-eau, etc., les robots peuvent continuer à passer.
07:11Mais nous, en fait, en tant qu'éditeurs, on n'a aucun intérêt à bloquer trop fortement, justement.
07:16Enfin, en tout cas, on ne va jamais bloquer des navigateurs parce que sinon, l'impact direct, c'est le
07:21SEO, c'est l'indexation, c'est le référencement.
07:22Et on sait qu'à longue échelle, l'enjeu finalement derrière ça, il y a deux grands enjeux, l'enjeu
07:27de pillage et donc de plagiat aussi derrière,
07:30parce qu'il y a ce corollaire-là, et surtout l'enjeu d'invisibilisation.
07:34C'est-à-dire qu'aujourd'hui, les réponses qui sont apportées sont de plus en plus performantes.
07:40Par les chatbots d'IA.
07:41Par les chatbots d'IA.
07:42Je pense notamment aux RAG qui permettent d'améliorer en continu ces réponses et qui, d'ailleurs, les bottes de
07:48RAG pinguent de plus en plus, justement.
07:50On le voit dans les stats, tout le bit que je citais tout à l'heure.
07:53Donc, en fait, il faut, comment dire, mettre en place des stratégies.
07:58C'est-à-dire que ce que vous dites, c'est que le risque, c'est que les contenus soient
08:01pillés sans paiement du droit d'auteur et puis des rédactions qu'on finance pour fournir cette information,
08:08les droits voisins également, mais aussi du risque de disparaître, c'est-à-dire que la marque média disparaisse finalement.
08:15On interroge un chatbot sur une information, elle donne la réponse en se servant dans vos groupes, mais sans vous
08:21citer.
08:21Sans citer. On constate d'ailleurs que le renvoi de trafic actuellement est très faible.
08:26Alors, ça fait partie des choses qu'on doit, des indicateurs qu'on doit mettre en place pour bien le
08:29suivre dans le temps.
08:30Mais le modèle qu'on a vu ces dernières années reposait essentiellement sur du renvoi de trafic.
08:35Et Google reste le principal apporteur de trafic quand même des sites.
08:40Mais avec les modèles que vous décrivez, en effet, la réponse est complètement intégrée dans l'outil.
08:45Au mieux, on est cité, mais ce n'est pas toujours le cas.
08:48Et en fait, l'information, on ne sait plus qui la produit.
08:52Donc, il y a déjà effectivement, à mon sens aussi, une chaîne de responsabilité qui est à trouver.
08:57Quand on produit une information, on s'engage.
09:00Absolument.
09:00Un journaliste qui signe son papier, le directeur de la publication, engage sa responsabilité sur tout ce qui est publié.
09:05Les IA, ce n'est pas le cas.
09:07Mais effectivement, à long terme, sur le business model de certains médias,
09:11et je pense notamment à ceux qui reposent sur la publicité ou qui ont plutôt un modèle gratuit ouvert ou
09:17pas,
09:18ça remet en cause, en fait, ces nouvelles captations de la valeur.
09:21On avait déjà beaucoup perçu ça avec la réalité de cette forme.
09:23C'est-à-dire que ce n'est pas la première fois, parce qu'il y a eu Google, il
09:26y a eu Facebook, les réseaux sociaux.
09:28Les réseaux sociaux qui nous avaient désintermédiés et donc les médias avaient dû investir ces nouveaux territoires d'audience.
09:36Aujourd'hui, ce n'est même plus de la désintermédiation.
09:38C'est potentiellement, vous n'existez pas, sauf si vous êtes considéré comme une source fiable.
09:43Alors, selon quels critères de qualité et de certification ?
09:46Là, pour l'instant, c'est décidé de manière unilatérale par les plateformes.
09:51Il y a des approches individuelles aussi au niveau des...
09:53Il y a des stratégies individuelles, je l'ai développées un petit peu,
09:55puis il y a les stratégies collectives pour répondre à la question que vous posiez en preambule,
09:58qui était comment les médias s'organisent face à ce pillage.
10:01Sur les réponses individuelles, c'est en fonction de son modèle et aussi en fonction de sa puissance face aux
10:06plateformes.
10:07Donc, il y a des médias qui contractent, qui contractualisent avec les plateformes.
10:12On en a vu aux États-Unis, au Canada et en France.
10:15En France, plusieurs acteurs ont signé avec des Open AI, Perplexity, Mistral.
10:18C'était Le Monde, par exemple.
10:19Le Monde, Le Figaro, l'AFP, en effet.
10:22Donc, c'est une première approche.
10:25Mais tout le monde ne peut pas y prétendre, parce que dans la stratégie aussi des IA,
10:31de ces plateformes IA, elles estiment que quand elles ont signé avec un ou deux gros acteurs,
10:35en gros, ça leur suffit.
10:36Ce qui soulève quand même la question de la pluralité aussi des points de vue et des informations.
10:43Il y a une autre voie qui est complètement à l'opposé,
10:45qui consiste à verrouiller véritablement les contenus,
10:48c'est-à-dire notamment les éditeurs qui ont un modèle payant, basé sur de l'abonnement,
10:53qui vont plutôt mettre un paywall très strict et qui vont avoir une approche très protectrice.
11:01Et enfin, il y a une voie un peu du milieu qui consiste finalement à devoir y aller.
11:06Il y a des modèles qui n'ont pas le choix.
11:07De toute façon, les modèles ouverts et gratuits qui reposent sur l'indexation,
11:13en tout cas, ne peuvent pas tout fermer, évidemment.
11:17Mais ça peut servir quand même à deux niveaux.
11:20Documenter, d'une part, c'est un vrai sujet.
11:22La documentation de ce qui se passe, nous on le voit,
11:26parce qu'il y a des contentieux effectivement qu'on suit au Canada,
11:28mais il y a aussi eu des contentieux en France,
11:31je pense à l'action collective entre le SEPM et la PIG,
11:35qui ont attaqué, qui ont déposé une plainte en septembre dernier,
11:38face à un common crawl notamment, et ces quatre.
11:41Et donc, ça permet de documenter ce qui se fait,
11:45dans l'optique derrière, de pouvoir obtenir,
11:47d'ouvrir la voie des négociations.
11:49Et si la voie des négociations ne fonctionne pas,
11:53elle vient d'aller effectivement plutôt vers le contentieux.
11:56Alors, on va faire réagir Patrick Bourbeau sur tout ça.
12:00Je voulais vous interroger peut-être plus spécifiquement,
12:02pour reprendre un peu les sujets,
12:03mais sur la question de l'entente,
12:05est-ce que ça vous semble une bonne solution
12:09d'essayer de s'entendre avec ces champions de l'intelligence artificielle
12:15qui viennent piller vos contenus ?
12:18Est-ce que l'argument du fair use aussi,
12:20on n'en a pas parlé, mais qui est souvent opposé aux médias,
12:23en disant que c'est juste un fair use,
12:24c'est-à-dire qu'on en a besoin pour entraîner nos modèles,
12:27mais ce n'est pas du pillage, c'est pour la science, j'ai envie de dire.
12:31Est-ce que ça, c'est entendable ?
12:33Et on a en France une proposition de loi
12:36qui vient d'être adoptée par le Sénat,
12:38pour dire que, par défaut, on considère que ces modèles d'IA
12:45exploitent du contenu protégé par le droit d'auteur.
12:48Voilà, comment vous vous positionnez par rapport à toutes ces pistes ?
12:51L'entente ? Comment on réagit au fair use ?
12:53Et quelles réponses politiques on peut espérer ?
12:57Alors, au niveau des ententes, du côté de la presse,
13:01nous, notre position, c'est justement, c'est celle de tout verrouiller
13:05et puis de sécuriser notre contenu.
13:08Nous ne cherchons pas à conclure des ententes de licence avec les plateformes d'IA.
13:13Parce que, justement, c'est cette idée-là de désintermédiation,
13:18où on va perdre le lien direct avec notre lecteur,
13:21et donc nos lecteurs, d'un, vont perdre leur attachement à la marque,
13:26la presse, parce qu'eux sont habitués, justement,
13:28il y a une marque de confiance,
13:30ils savent que c'est du contenu vérifié,
13:32du contenu de qualité lorsqu'ils consultent la plateforme de la presse,
13:36alors que sur les plateformes d'IA,
13:38le contenu de nouvelles devient un contenu complètement générique,
13:41ça devient une commodité,
13:42ça peut être remplacé par n'importe quel autre contenu de nouvelles.
13:46Alors, nous, on ne veut pas tomber dans le même piège...
13:49Oui, sans parler des risques de confusion,
13:52de désinformation aussi qui peuvent émerger.
13:55Oui, je vous en prie, continuez.
13:58Exactement, et puis, bon, c'est le risque aussi que ce contenu-là,
14:02nous, c'est du contenu québécois, c'est du contenu canadien,
14:04devienne un peu tout mélangé avec ce contenu hégémonique américain.
14:10Nous, on a un grand voisin,
14:12alors c'est ça, on perd un peu aussi une question ici de souveraineté culturelle
14:15sur notre contenu.
14:18Alors, je vous dirais, pour toutes ces raisons-là,
14:20nous ne voulons pas tomber non plus dans le même piège
14:23dans lequel nous sommes tombés il y a 20 ans,
14:25avec Google et Meta qui se sont accaparés 80 % des revenus publicitaires
14:30de l'industrie des médias.
14:33Alors, déjà, la tarte est beaucoup plus réduite qu'elle ne l'était il y a 20 ans.
14:38On ne veut pas qu'elle soit encore plus réduite.
14:41Alors, sur l'aspect fair use, je crois que c'est un faux argument.
14:47Je crois vraiment que c'est une fausse piste de la part des plateformes d'IA.
14:51Elles essaient tout simplement de gagner du temps dans ce débat-là devant les tribunaux.
14:57Prétendre qu'ils doivent bénéficier de l'exception de recherche,
15:04franchement, ça ne tient pas la route en ce sens que,
15:06oui, la recherche, c'est de la recherche académique, de la recherche universitaire,
15:10là, nous ne sommes plus là.
15:11Nous sommes dans la recherche à des fins purement commerciales.
15:15Je vous donne comme exemple, une compagnie pharmaceutique
15:18ne pourrait pas bénéficier d'une exception d'utilisation équitable.
15:21Ils développent leurs produits à des fins purement commerciales,
15:25même si au bout, peut-être que l'objectif est louable.
15:28Oui, on n'est pas contre le développement de l'IA,
15:30mais il faut que ce développement-là se fasse de façon responsable
15:33et il ne doit pas se faire au détriment des créateurs de contenu.
15:39Et sur la réponse politique, justement, que vous pouvez attendre,
15:44est-ce que là, par exemple, cette proposition de loi en France
15:46vous semble intéressante ou apporte une première solution?
15:51Oui, ça me semble très intéressant, ça me semble très prometteur.
15:54Puis, en fait, c'est une réponse similaire à celle pour le moment,
15:59cet encourageant qui est donné par la plupart des gouvernements.
16:04Parce que ce qu'il faut comprendre, justement,
16:05c'est que malgré le fait qu'ils plaident sur la place publique
16:08qu'ils doivent bénéficier de l'exception d'utilisation équitable,
16:11du même coup, ce qu'ils plaident également devant les gouvernements,
16:14ils font beaucoup de lobbying, les plateformes d'IA,
16:17pour demander qu'il y ait une exception, justement,
16:20qui soit intégrée explicitement dans les lois
16:22pour permettre ce qu'on appelle le « text and data mining ».
16:25Alors, ils savent, en quelque part, que ce n'est pas déjà permis par la loi,
16:29que ce n'est pas du « fair use ».
16:31Alors, on fait beaucoup de représentation, les médias, auprès des gouvernements
16:34pour ne pas qu'ils succombent à la tentation d'ouvrir la porte
16:38à cette exception-là, au nom, supposément, de l'innovation
16:42par les plateformes d'IA.
16:46En Angleterre, justement, ils ont été très tentés
16:48d'adopter une telle exception.
16:50Ils ont reculé, justement, devant l'opposition des créateurs de contenu.
16:57Au Canada, également, ça semble être le cas pour le moment.
17:00L'équivalent de notre ministre de la Culture a indiqué
17:03que ce n'était pas dans ses plans pour le moment
17:06d'ouvrir la loi sur la d'auteur pour adopter une exception de ce type-là.
17:11En tout cas, ce qu'on entend, c'est qu'il y a des vrais dangers.
17:15Enfin, vous les avez évoqués.
17:17Vous êtes en train de vous organiser, médias,
17:19et que vous avez tous intérêt, finalement, à travailler tous ensemble.
17:23Oui, oui.
17:23Juste pour...
17:25Très rapidement, pour conclure,
17:27il y a des organisations professionnelles qui s'organisent aussi.
17:30Donc, il y a une réponse collective qui est apportée.
17:32Le Geste y contribue.
17:34La PIG, le SEPM, la FNPS, le SPIL,
17:36toutes les organisations professionnelles sont très vigilantes sur le sujet.
17:40Des VPs s'y associent également.
17:41Et on cherche à porter à la fois le combat en France,
17:44et on salue d'ailleurs la PPL, effectivement, qui a été adoptée hier.
17:48Et on s'associe également,
17:50et en tout cas, on observe avec beaucoup d'intérêt ce qui se passe au niveau européen
17:53et chez nos amis canadiens.
17:54Merci beaucoup à tous les deux.
17:55Merci, Maître Patrick Boulot.
17:57Je rappelle quand même que vous êtes réveillé depuis le Québec,
18:00donc il est très tôt chez vous.
18:02Merci beaucoup d'avoir participé à cette émission Smartech.
18:04Vous êtes le vice-président d'affaires juridiques de la presse.
18:06Et merci à Sandrine Cochard d'être venue avec nous en studio,
18:10directrice de la rédaction de Main et vice-président du Geste.
18:13A très vite sur la chaîne Bsmart,
18:16n'a pas plus tard que demain pour de nouvelles discussions sur la tech.
18:18Sous-titrage Société Radio-Canada
Commentaires

Recommandations