Passer au playerPasser au contenu principal
  • il y a 11 heures
Sylvain Peyronnet, cofondateur et président de IBOU, était l'invité de François Sorel dans Tech & Co, la quotidienne, ce mardi 28 avril. Il s'est penché sur IBOU, le moteur de recherche français, sur BFM Business. Retrouvez l'émission du lundi au jeudi et réécoutez la en podcast.

Catégorie

📺
TV
Transcription
00:00Tech & Co, la quotidienne, l'invité.
00:05Et on va découvrir ensemble Ibu avec Sylvain Perronnet, cofondateur et président de Ibu.
00:10Bonsoir Sylvain.
00:11Bonsoir.
00:12Et bien dites-moi, quel courage se lancer dans un moteur de recherche,
00:16un moteur de recherche conversationnel, c'est ce que vous expliquez.
00:20Ça n'y est pas encore, vous lancez en fait Ibu pas à pas,
00:25on va rentrer dans les détails, mais juste un mot quand même sur votre pédigré,
00:28vous êtes un spécialiste des algorithmes de recherche depuis plus de 20 ans,
00:31vous avez été professeur des universités à l'université de Cannes-Normandie,
00:36avant de rejoindre Quant, comme chief science officer.
00:41Pas super expérience Quant, c'est ?
00:44Enfin je veux dire, bon...
00:45J'en suis parti en 2019.
00:47Voilà.
00:47Parce que Quant, rappelons-le, ça voulait être l'alternative justement européenne à Google,
00:54et on sait que Quant s'est fracassé pour plein de raisons qu'on ne va pas détailler là-maintenant.
01:03L'ancien moteur de recherche en 2026, c'est pourquoi ?
01:07Et comment vous vous êtes dit,
01:10tiens, je vais essayer de concurrencer un petit peu tout ce qui se fait aujourd'hui ?
01:14Alors il y a plein de raisons, mais d'abord, la première chose, c'est que ça fait des années
01:18qu'on voulait continuer à travailler là-dessus avec l'équipe des cofondateurs de Hibou,
01:22et on a commencé à travailler en fait un petit peu en mode visible sur un index depuis 2019,
01:26un index web propriétaire, indépendant, souverain,
01:30et il s'avère qu'au fur et à mesure des années, on a pu bien travailler,
01:34et qu'en ce moment, en fait, il y a un momentum pour lancer un moteur de recherche.
01:37La géopolitique étant ce qu'elle est, la technologie étant ce qu'elle est,
01:40il y a une demande pour un moteur de recherche indépendant, souverain,
01:43il se trouve que nous, on est en train de le fabriquer,
01:45il y a une réceptivité, que ce soit dans le grand public, dans les médias,
01:49chez les élus, qui est très très forte pour ça,
01:50et donc on s'est dit en juin dernier qu'on allait se lancer,
01:53et on s'est lancé, et on s'aperçoit qu'on arrive très très bien à développer le moteur,
01:57et que la roadmap qu'on a, qui est très ambitieuse,
01:59qui finit fin 2026 pour la livraison du moteur,
02:02sera à coup sûr tenue, enfin à coup sûr selon nous, bien sûr.
02:05L'idée c'est quoi ? C'est de concurrencer Google ?
02:08C'est de concurrencer la recherche via les LLM,
02:10chez GPT Search, d'ailleurs ils le font tous aujourd'hui,
02:13Jimmy Nye, Claude, etc.,
02:15parce qu'on voit que la recherche évolue aussi avec l'IA.
02:18Oui, alors l'objectif c'est pas de concurrencer,
02:21c'est de fournir une alternative.
02:22Nous on est une équipe de vieux du web, j'ai envie de dire,
02:25on est là depuis les débuts,
02:26et on s'est rendu compte que le web tel qu'il est aujourd'hui
02:28n'est pas tout à fait celui qu'on envisageait à l'époque,
02:30au début du web,
02:31et donc on s'est dit qu'on allait faire un nouveau type de moteur de recherche,
02:35il est conversationnel, il a un index web, comme tous les moteurs,
02:38mais par contre qu'il présente plus la diversité des informations possibles
02:42sur un sujet quand il y a une controverse,
02:43qu'il soit plus transparent d'un point de vue algorithmique,
02:45donc que les gens puissent savoir pourquoi ils sont mis en avant ou pas mis en avant,
02:49et aussi qu'il préserve les éditeurs,
02:51parce qu'aujourd'hui les moteurs conversationnels,
02:53en fait ont tendance à envoyer très peu de trafic sur les sites web,
02:55et c'est un problème,
02:56parce que les sites web c'est eux qui fournissent la matière,
02:58on a besoin pour répondre,
02:59et donc on va la mettre en avant.
03:01Alors on explique comment ça marche,
03:02par exemple vous cherchez,
03:03je ne sais pas moi,
03:03une info sur une actualité,
03:05auparavant,
03:06et via Google,
03:07vous cliquez sur un lien,
03:08ça vous emmène sur ce site d'actualité,
03:10ça peut être BFM Tech,
03:11BFM Business,
03:12BFM TV,
03:13Exactement.
03:13Aujourd'hui avec les moteurs de recherche conversationnels,
03:15vous avez une réponse qui est...
03:17Une synthèse de l'information.
03:19...touchée,
03:20directement sur le site,
03:21ce qui fait que,
03:22en fait le lecteur n'a même plus besoin
03:25d'aller visiter le site en question.
03:26Oui, il n'est pas du tout incité,
03:28ça dira,
03:28François Sorel a dit que,
03:30dans son émission,
03:31et hop,
03:31ça s'arrêtera là.
03:32Nous ce qu'on veut,
03:33c'est dire,
03:33ben voilà,
03:34telle personne a dit telle chose,
03:35telle autre personne a dit telle chose,
03:37si vous allez sur ce site-là,
03:38vous découvrirez le discours de cette personne,
03:40sur cet autre site,
03:41le discours de cette autre personne,
03:42et ce sera à l'internaute
03:44qui a fait la recherche
03:45de se faire sa propre opinion derrière.
03:46Donc vous êtes un peu à la croisée des chemins,
03:47c'est-à-dire que vous allez donner une réponse,
03:50mais pour l'argumenter,
03:51on pourra cliquer,
03:52ce que fait d'ailleurs Google,
03:54en toute transparence,
03:55tout à fait,
03:56il vous donne,
03:57en fait un résumé de l'information
03:59que vous voulez,
04:01mais malgré tout,
04:01très facilement,
04:02on peut cliquer sur les liens
04:03qui vous emmènent à cette information.
04:05Exactement.
04:05Le problème de Google,
04:06pour nous,
04:07c'est d'abord que c'est un acteur américain,
04:08donc il n'y a pas,
04:09il y a une problématique de souveraineté,
04:10et qu'en plus,
04:11il n'y a pas de grande transparence algorithmique,
04:13donc des fois,
04:13on ne sait pas pourquoi on est mis en avant
04:14ou on n'est pas mis en avant.
04:16Le problème,
04:17c'est que Google,
04:17c'est un excellent moteur de recherche.
04:19Tous les services de Google
04:21sont excellents.
04:22Après,
04:22et qu'on aime ou qu'on n'aime pas Google,
04:24tout est vraiment de très haut niveau.
04:26Est-ce que,
04:27sincèrement,
04:27Ibu,
04:28alors vous avez du talent
04:30et je n'en doute pas une seule seconde,
04:32est-ce que vous,
04:32comment vous pouvez vous dire
04:33que vous pouvez arriver
04:35à ce niveau de qualité ?
04:36Alors,
04:37il y a plusieurs choses.
04:38D'abord,
04:38il y a plusieurs manières
04:39de répondre à une question.
04:40Donc,
04:40ce qu'on pense,
04:41c'est qu'on peut avoir
04:41une qualité de réponse
04:42qui est équivalente
04:44et qui va présenter
04:45de manière différente l'information.
04:47Par ailleurs,
04:48il y a aussi
04:49cette problématique souveraine.
04:50Nous,
04:50ce qu'on veut,
04:50c'est fournir un moteur
04:51de recherche grand public,
04:52mais aussi un index web
04:54qui serait disponible
04:54pour tout le monde,
04:55y compris les opérateurs IA
04:56qui seraient européens,
04:57par exemple.
04:58Et il y a une double problématique
04:59qu'on peut remplir.
05:00Ce qu'on veut,
05:00c'est un niveau de qualité équivalent
05:03dans notre écosystème.
05:04On vise à être équivalent.
05:06D'accord.
05:08Alors,
05:08évidemment,
05:08le contexte géopolitique
05:10fait que
05:11vous êtes un peu plus
05:13sur le devant de la scène.
05:14Ça doit vous mettre
05:15une pression phénoménale
05:16parce que,
05:16mine de rien,
05:17leur tourne.
05:18On ne sait pas
05:19combien de temps
05:19toute cette pagaille
05:20va durer,
05:21finalement.
05:21Et il faudrait que,
05:22même si on sait que
05:23rien ne sera plus jamais
05:25comme avant,
05:27votre moteur de recherche
05:28n'est pas prêt.
05:28Si aujourd'hui,
05:29je tape Ibu,
05:30et vous pouvez taper,
05:31ibu.io,
05:32vous arrivez,
05:33en fait,
05:34à une bêta
05:36qui vous permet
05:37de découvrir
05:37Ibu Explorer
05:38qui est un peu
05:40un Google Actu,
05:41j'ai envie de dire.
05:42Vous faites une sélection
05:43d'actualités
05:43dans divers domaines
05:44qui sont
05:45à la politique,
05:46économique,
05:46économique,
05:47internationale,
05:47etc.
05:47On peut chercher
05:48dans ces contenus
05:50tirés d'informations.
05:50On retrouve d'ailleurs
05:51BFM Business.
05:52Tout à fait.
05:54Pour l'instant,
05:55c'est la seule verticale
05:56qui est mise en place.
05:57C'est aussi une question
05:58de crédibilité pour nous
05:59de montrer qu'on peut faire
05:59des premiers algorithmes
06:00et qu'un public
06:01peut être intéressé.
06:03Notre roadmap
06:03nous amène
06:05entre l'été
06:05et décembre 2026
06:07pour finaliser
06:08un moteur grand public
06:09qui sera exposé
06:09et une API
06:10pour les professionnels
06:11un petit peu plus tôt.
06:13Donc effectivement,
06:14il y a un horizon
06:15qui est assez court.
06:16On essaye d'avoir
06:17une plus grande vélocité.
06:17C'est pour ça d'ailleurs
06:18qu'on a fait une levée de fond
06:19très récemment
06:20qui a été fructueuse.
06:23Vous avez le soutien
06:23de Xavier Niel.
06:24De Xavier Niel,
06:25exactement,
06:25qui adhère au projet,
06:27qui adhère à cette vision
06:28d'un moteur de recherche
06:29souverain
06:29et qui adhère au fait
06:30que l'équipe a probablement
06:31tout ce qu'il faut
06:32pour réussir le pari.
06:35Ça coûte cher
06:35de développer tout ça ?
06:37Ça coûte pas très cher.
06:39Comment vous faites en fait ?
06:40Vous avez les mêmes recettes
06:42que Google ?
06:43Vous avez des robots
06:43qui scrollent
06:44l'Internet mondial
06:45de manière perpétuelle ?
06:47Tout à fait.
06:48Donc on a ce qu'on appelle
06:48des crawlers
06:49qui crawlent le web.
06:50On a commencé en 2019
06:51à travailler sur notre crawler.
06:52Ça fait déjà 6 ans.
06:53Aujourd'hui,
06:54on a un crawler
06:54qui se positionne,
06:55selon Claude Flair
06:56qui a un radar spécialisé
06:57sur les bots sur le web,
06:58entre la 15e
06:59et la 30e place mondiale
07:00sur les bots généralement,
07:02avec un coût opérationnel
07:03qui est généralement
07:048 fois plus bas
07:05que celui de nos compétiteurs
07:06parce qu'on a trouvé
07:07les bons algos,
07:08la bonne tech pour faire ça.
07:10Donc on a un crawler
07:11très efficace
07:11mais après le reste,
07:12c'est un moteur
07:12de recherche standard.
07:13On va indexer le web,
07:14on va avoir un système
07:15de classement,
07:16ça utilise beaucoup
07:17massivement l'IA.
07:18La petite spécificité
07:19qu'on a,
07:20et c'est pour ça
07:20qu'on pense que les choses
07:21sont possibles
07:21à moindre coût pour nous,
07:22c'est qu'on utilise
07:23le LLM,
07:23donc les modèles de langue,
07:24pour simuler le comportement
07:25des êtres humains,
07:26ce qui nous évite
07:27d'avoir à capter
07:28de la data utilisateur
07:29pour faire un bon moteur.
07:30Donc c'est l'IA
07:31qui nous aide
07:32à comprendre l'humain
07:34pour fabriquer
07:34un meilleur moteur.
07:35D'accord,
07:36donc il sera,
07:37on va dire,
07:38très efficace
07:39parce qu'il aura
07:41le même langage que nous
07:42grâce à l'IA.
07:43Exactement.
07:44Combien de temps faut-il
07:44pour crawler le web,
07:45en fait ?
07:46Le web est infini,
07:47donc...
07:48Non mais...
07:49C'est une question intéressante,
07:51je trouve,
07:51parce que combien de temps
07:52il vous faut
07:52pour avoir une photographie
07:54assez précise quand même
07:56de la monstruosité
07:59des données du web ?
08:00Nous on crawle
08:00de 2 à 4 milliards
08:01de pages web par jour
08:02actuellement
08:03et on peut estimer
08:04que sur 6 mois
08:05à 1 an,
08:06on a une vision
08:06qui n'est pas exhaustive
08:08bien sûr,
08:09mais qui est vraiment
08:09très très précise
08:10de ce qui se passe
08:10sur le web
08:11avec tous les plus gros sites,
08:12toutes les informations,
08:13etc.
08:15Avec plus,
08:16on peut faire
08:17marginalement mieux
08:17mais pas beaucoup mieux
08:18en fait.
08:19Quand on voit Google,
08:19aujourd'hui c'est un moteur
08:20de recherche
08:21mais c'est aussi une IA,
08:22c'est aussi un mail
08:25du cloud,
08:26plein de services,
08:27est-ce que votre stratégie
08:29c'est un peu pareil ?
08:30C'est-à-dire que vous allez
08:32commencer par le web
08:32et après proposer,
08:34pourquoi pas,
08:34un mail,
08:36du stockage,
08:37de l'IA,
08:38etc.
08:39L'idée c'est d'avoir
08:39une suite aussi ?
08:41On ne peut jamais savoir
08:41de quoi l'avenir sera fait
08:42mais nous ce qu'on vise
08:43c'est l'information,
08:45le search web
08:46et les images d'abord.
08:48Peut-être quelques petites
08:48choses périphériques
08:49mais pour le reste
08:50on vise plutôt
08:51une stratégie d'écosystème
08:52en s'aspirant
08:54sur des partenariats
08:54avec nos confrères
08:55français,
08:56européens
08:57qui font des fois
08:57du très très bon travail
08:58déjà sur certains domaines
08:59et on ne va pas réinventer
09:00la roue,
09:01ça existe,
09:01on va essayer
09:02de nouer des partenariats
09:03que ce soit les fabricants
09:04de LLM français ou européens
09:06que ce soit les opérateurs
09:07de mail,
09:07etc.
09:08Question un petit peu
09:09vache j'ai envie de dire,
09:11demain vous êtes prêt,
09:12votre moteur de recherche
09:13est prêt,
09:14comment vous allez le promouvoir
09:15en fait ?
09:16Et comment vous allez
09:19vivre et sortir
09:20de ce truc-là ?
09:21Il y a un modèle économique
09:22aussi ?
09:23Alors il y a un modèle économique,
09:24peut-être je vais commencer
09:24par le modèle économique,
09:25on a un double modèle économique,
09:27il y a le grand standard,
09:28la publicité,
09:30on va la faire différemment
09:31d'un Google par exemple.
09:33Pas de lien sponsorisé ?
09:34Alors il y aura
09:35des liens sponsorisés
09:36mais les liens
09:37dépendront du contenu
09:38de la réponse
09:39qui est affichée
09:39à l'internaute,
09:40donc ils viendront
09:40en supplément de la réponse
09:41et pas se substituer
09:43à la réponse.
09:43Donc les gens ont
09:44plutôt un intérêt
09:45d'abord à aller lire
09:46la réponse,
09:46puis ensuite à cliquer
09:47sur la pub éventuellement,
09:49et puis il y a
09:49un autre modèle économique
09:50qui est lié à l'API,
09:51fournir l'index web
09:52comme infrastructure
09:53de recherche à des tiers,
09:54ça peut être des Mistral,
09:55des Lighton,
09:55en France il y a plein
09:56d'opérateurs IA par exemple
09:57qui ont des besoins
09:57d'index web,
09:59et ça c'est notre deuxième branche
10:00pour le modèle économique.
10:01Après comment est-ce
10:02qu'on va faire connaître
10:02le moteur ?
10:04Ça c'est un autre problème,
10:05alors c'est un problème
10:06qui est secondaire pour nous
10:07pour l'instant
10:08parce qu'on a d'abord
10:09été financés pour réaliser
10:10le moteur et donc
10:10il faudra probablement
10:11qu'on trouve des fonds
10:12supplémentaires pour ça.
10:14Parce que rappelons
10:15que Bing,
10:15qui est quand même
10:16le moteur de Microsoft,
10:18n'a jamais décollé
10:19véritablement
10:20et je peux imaginer
10:22que ça coûtait quand même
10:23une blinde à Microsoft
10:24d'essayer de promouvoir
10:25ce moteur de recherche.
10:26Et en fait,
10:27la promotion qu'on va faire
10:28elle sera assez standard
10:29donc il faut qu'on trouve
10:30des relais d'influence.
10:31Est-ce que vous voulez
10:31par exemple une aide
10:32du gouvernement ?
10:33Est-ce qu'une commande publique
10:34vous intéresse ?
10:36Le fait que,
10:37à un moment,
10:38il y avait Quant
10:38comme moteur de recherche
10:39pour les fonctionnaires
10:41les pauvres d'ailleurs,
10:41j'imagine un peu
10:42la galère que ça devait être
10:43d'avoir comme moteur de recherche.
10:45Je ne ferai pas de commentaire
10:45là-dessus.
10:46Non, on rigole
10:47entre nous.
10:47Mais par contre,
10:48effectivement,
10:49la commande publique,
10:50moi j'y crois
10:51si on a un bon produit en fait.
10:52Il n'y a pas de honte
10:53à être mis en avant.
10:54Mais vous ne seriez pas contre ?
10:55Bien sûr,
10:56si notre produit le mérite,
10:58sans problème bien sûr.
10:59Mais ce qu'il nous faut,
11:00c'est trouver surtout
11:00des relais d'influence.
11:01On se donne rendez-vous
11:02dans combien de temps alors
11:03pour l'arrivée
11:03du moteur de recherche ?
11:04Entre octobre et décembre 2026.
11:07Vous viendrez sur le plateau
11:08Tech & Co
11:08nous annoncer tout ça ?
11:09Avec plaisir.
11:10Avec beaucoup de plaisir.
11:11Merci Sylvain Perronnet.
11:13Salutons cette initiative
11:14donc de Hibou.
11:16Vous en êtes le cofondateur
11:18et président.
11:18Sous-titrage Société Radio-Canada
Commentaires

Recommandations