- il y a 2 jours
Catégorie
📚
ÉducationTranscription
00:00Merci de m'avoir invité à cette journée, je suis très content d'être là.
00:08Je suis Jean-Daniel Fiquette, je suis directeur de recherche INRIA
00:11et je suis aussi responsable d'une équipe à Paris-Saclay en visualisation.
00:17J'ai faisant de la visualisation, de l'information, depuis très longtemps, depuis 2003.
00:26Je me suis intéressé à Bertin, évidemment, depuis le début, qui était un précurseur de la visualisation.
00:39Il est passé de la géographie à la visualisation en la rendant de plus en plus abstraite et interactive.
00:44Et la visualisation interactive, c'est mon domaine de recherche quotidien.
00:48J'ai rencontré Jacques Bertin en 2012, il était déjà âgé et il est décédé en 2014.
00:55Et c'est l'année où j'ai organisé une énorme conférence en France, à 200 mètres de là où il habitait,
01:03où sa femme a pu venir encore à l'époque.
01:06Et où on a organisé une exposition, une partie de ses fonds, à la fois qui était à la BNF, qui nous a aidés,
01:15et à la fois qui était aux archives.
01:16Donc je suis vraiment très content que ce projet ANR puisse maintenant rendre visible une grande partie des fonds Bertin,
01:27parce que jusqu'à maintenant, ces fonds étaient totalement invisibles.
01:31Et c'est un trésor inestimable, encore aujourd'hui, pour notre domaine de recherche,
01:36la visualisation et l'exploration de données en général.
01:40Dire que Bertin a été un des premiers à le faire, c'est une chose.
01:45Et ce que je vais essayer de vous montrer aujourd'hui, c'est que ce qu'il a lancé,
01:49ce n'est pas du tout dépassé.
01:56C'est un ensemble d'axes de recherche qui reste extrêmement intéressant, extrêmement actif.
02:03Et donc, je passe pas mal de temps à expliquer à mes collègues que regarder ce qu'a fait Jacques Bertin,
02:10non seulement dans la généologie graphique ou les autres livres, mais aussi dans son laboratoire,
02:15c'est une excellente source d'inspiration, parce qu'il a eu à travailler sur des vrais projets.
02:20Il a dû proposer des vraies solutions pour rendre compréhensibles des données très variées et très abstraites, souvent.
02:28Donc aujourd'hui, je vais vous faire, rapidement, j'espère, un petit historique du travail de Jacques Bertin
02:34sur ce qu'il appelle la matrice ordonnable.
02:37Ça a été, à la fin de sa vie, à la fin de sa vie scientifique,
02:40une de ses activités les plus prenantes pour lui et les plus importantes.
02:45Donc là, c'était quand on a été chez lui en 2012.
02:48Il nous a montré quelques-unes de ses matrices.
02:50Il y en a une qui est à l'entrée, le domino, qu'il a faite depuis les années 90.
02:56Et donc, Jacques Bertin, quand il a travaillé sur les matrices, il essayait de résoudre un problème
03:00qui est un problème qu'on a encore tous les jours, en réalité,
03:04qui est que quand on a une table composée de lignes et de colonnes,
03:10et donc, dans l'exemple qu'il donne, la table est une table de production de viande
03:16de plusieurs pays européens, à l'époque, avant l'Union européenne, c'est pas grave.
03:22Et donc, quand on a une table, comme un tableau Excel,
03:27on peut regarder cette table et on peut répondre à des questions de détail
03:30en disant, tel pays, la France, produit tant de bovins en telle année.
03:35Et donc, on répond à des questions de détail,
03:37mais on n'a pas une vue d'ensemble de la production européenne de viande
03:42à partir de ce tableau.
03:45Et donc, la question que se posait Bertin, c'est comment faire
03:47pour avoir à la fois une vision d'ensemble d'un tableau de données
03:51et une vision de détail.
03:54Excel nous donne une vision de détail,
03:56les tableurs nous donnent une vision de détail,
03:58les bases de données nous donnent une vision de détail,
04:00mais si on veut une vue d'ensemble pour dire des choses de plus haut niveau,
04:03comment on peut faire ?
04:03Et donc, ce que dit Jacques Bertin, c'est une chose très simple.
04:07Il part du début en disant,
04:09on va changer les nombres, et au lieu d'utiliser des nombres uniquement,
04:13on va utiliser des marques graphiques.
04:17Et donc, plus la marque est haute, plus le nombre est grand,
04:19plus la marque est petite, plus le nombre est petit, c'est assez simple.
04:21Et ensuite, il y a une table, comme ça,
04:23qui est une table à deux entrées.
04:25Il y a une entrée qui est le type de viande,
04:27et une autre entrée qui est le type de pays.
04:30Ce que dit Jacques Bertin, et c'est extrêmement simple,
04:32c'est de dire qu'en réalité, cette table, elle n'a pas un ordre inné.
04:36On peut parfaitement changer l'ordre des pays,
04:39ou changer l'ordre des viandes,
04:40ça ne change rien à la signification du tableau.
04:43Et donc, Jacques Bertin, il dit,
04:45on va essayer de trouver un ordre en ligne et un ordre en colonne
04:48qui permettent de faire ressortir une structure
04:51de plus haut niveau que juste le détail.
04:54Et donc, dans l'exemple que je vous donne ici,
04:55sur les viandes que vous voyez sur ce tableau-là,
04:59en haut à gauche, vous avez des nombres,
05:00vous n'avez pas la possibilité de comprendre,
05:02de vous souvenir globalement quelle est la structure,
05:04mais si on change l'ordre des pays,
05:07et si on change l'ordre des viandes,
05:09d'un seul coup, on voit une structure apparaître,
05:11où on voit qu'il y a quelque chose qui décroît en haut,
05:14qui croît en bas, et qui est à peu près neutre au milieu.
05:17Et donc, ça veut dire que si on organise le tableau comme ça,
05:19on peut se souvenir que l'Allemagne et les Pays-Bas
05:23ont à peu près le même profil de production de viande,
05:25elles sont tous les deux en haut,
05:27c'est le profil A, qui est décroissant de gauche à droite.
05:29L'Italie et la France ont à peu près le même profil
05:32de production de viande qui croît en bas,
05:36et au milieu, la Belgique et le Luxembourg,
05:38ont un profil qui est à peu près neutre.
05:40Et donc, ça, ça veut dire que maintenant,
05:42on peut se souvenir de cette vision,
05:44qu'on a cette organisation en trois groupes de pays.
05:47On peut se souvenir de l'ordre, si on veut,
05:49porc, bovin, veau, chevaux et ovins.
05:51Mais surtout, ce qu'il faut comprendre,
05:52c'est que cette organisation, elle est utile,
05:54parce que si la France veut négocier pour changer
05:56l'aide qu'elle va donner à ses paysans,
05:59elle va devoir s'allier avec facilement l'Italie,
06:03mais certainement pas la Hollande ou l'Allemagne,
06:07parce que les profils sont inverses,
06:08donc politiquement, ils ne pourront pas s'allier avec eux.
06:12L'allié dont ils ont besoin pour avoir un accord,
06:15à la majorité, c'est la Belgique et le Luxembourg,
06:17donc à l'époque.
06:18Donc, cette réorganisation, elle permet de comprendre,
06:21de mémoriser, de grouper,
06:23mais aussi de prendre une décision sur comment faire
06:25pour agir si on veut typiquement avoir
06:28une autre répartition des quotas.
06:31Donc, ça, c'est initialement ce qu'a fait Jacques Bertin
06:34en expliquant pourquoi c'était important
06:35d'organiser ces matrices.
06:38Et donc, la question qui se pose,
06:39qui se posait et que Jacques Bertin a posée,
06:41c'est est-ce que c'est un travail qui doit être fait manuellement,
06:43est-ce que c'est un travail qui doit être fait automatiquement,
06:46ou est-ce que c'est un travail qui peut être fait
06:47de façon mixte, humain et machine ?
06:50Et donc, ce travail, cette question,
06:53elle a eu plusieurs réponses dans le temps.
06:55Donc, Jacques Bertin a créé ce domino,
06:59cette machine, pour pouvoir réordonner les matrices interactivement.
07:03Donc, c'est un objet complexe qui lui a coûté beaucoup d'argent,
07:06il a fait plusieurs itérations dessus,
07:07vous pouvez le retrouver,
07:08et donc, on enfile des matrices dans un ensemble,
07:12dans des grilles,
07:15et on défait les grilles,
07:16et on refait les grilles pour les réordonner,
07:18ce domino.
07:20Et donc, il a utilisé ça de façon extrêmement active
07:24pendant plusieurs années.
07:26Donc, on retrouve, en bas à gauche,
07:27il y a une grille de codage pour les valeurs,
07:31et puis après, il y a toute une démarche à faire
07:33pour ordonner la matrice,
07:34de manière à faire apparaître des motifs globaux
07:37plus que des valeurs spécifiques,
07:40lignes-colonnes.
07:41Et il l'a fait sur des matrices petites,
07:44des matrices moyennes,
07:45et des matrices très grosses,
07:47et il l'a fait, initialement, à la main,
07:51manuellement.
07:53Et donc,
07:54la méthode pour réordonner les matrices,
07:57elle n'a jamais été extrêmement bien décrite
07:59dans les publications qu'il a faites,
08:02mais on a retrouvé,
08:03dans une des boîtes d'archives,
08:08qui étaient perdus, retrouvés,
08:11reperdus, re-retrouvés,
08:12des films qu'on a numérisés.
08:15Et donc, il y en a un qui est assez amusant,
08:16qui s'appelle Bebert et la graphique,
08:18qui est maintenant sur YouTube,
08:20avec la traduction.
08:22Et donc, on trouve dedans,
08:23il a été fait par I8,
08:25on trouve dedans
08:25un certain nombre d'explications
08:29sur comment on réordonne une matrice
08:31qui est faite pour le commun des mortels,
08:34où donc,
08:36on explique,
08:37je ne sais pas si vous avez le son,
08:38mais on explique comment on peut ordonner les matrices
08:40en permutant les lignes
08:41et en permutant les colonnes
08:42pour mettre côte à côte
08:44les lignes et les colonnes
08:45qui sont les plus semblables,
08:46avec une méthode
08:48qui consiste à plisser les yeux
08:50pour essayer de voir
08:50un centre de gravité visuel.
08:53Et en faisant ça itérativement,
08:55on arrive à trouver une structure
08:57qui devient de plus en plus ordonnée
08:58et qui permet d'avoir à la fin
08:59quelque chose qui est propre
09:01ou compréhensible.
09:04Donc, l'adverture a beaucoup appuyé
09:05sur cette méthode manuelle
09:07de réordonnancement,
09:09mais évidemment,
09:09à un moment donné,
09:10quand la matrice devient trop importante,
09:12vous pouvez retrouver ce film
09:15tout à fait désuet sur YouTube,
09:19mais c'est un des seuls films
09:20où il y a une explication
09:21à peu près claire sur la méthode.
09:25Jacques Bertin, malgré tout,
09:26il a été obligé de reconnaître
09:29que quand la matrice devient grande,
09:32faire ça à la main
09:33et avec les yeux,
09:34ça devient extrêmement long, pénible
09:36et difficile.
09:37Et donc, il a travaillé
09:38avec Jean-Yves Chauchat,
09:40qui est à l'origine
09:41de la création de Hamado,
09:44sur des méthodes automatiques
09:45pour réordonner les matrices.
09:47Et donc, il y a,
09:47dans la dernière édition
09:50de la cinéologie graphique,
09:51cet exemple qui est donné,
09:53qui est un exemple
09:53sur des objets archéologiques.
09:55Alors, je vais y revenir,
09:57mais l'archéologie,
09:58ça a été à l'origine
09:59de ce travail
10:01sur ce qui s'appelle
10:02la sériation en archéologie,
10:03mais qui est
10:04la réordonnancement de matrice.
10:05Et donc, ce que dit Bertin,
10:07il explique le processus
10:08qu'il a essayé d'utiliser.
10:09Il dit, voilà,
10:10on a un certain nombre
10:10d'objets archéologiques.
10:12Chaque objet archéologique,
10:13c'est une ligne dans la table
10:14qui est en haut à gauche.
10:15Et chaque objet archéologique
10:17qui est une ligne
10:17est décrit par des caractéristiques,
10:19par exemple,
10:20arrondi,
10:21oblong,
10:22des caractéristiques physiques
10:24de l'objet,
10:25qui est vrai ou faux,
10:26donc blanc ou noir.
10:27Et donc, on a un certain nombre
10:28de...
10:29Donc là, en l'occurrence,
10:30son exemple,
10:30il y a 59 objets mérovingiens
10:32et 27 caractéristiques
10:34en colonne.
10:35Et donc,
10:35ce qu'il essaye de faire,
10:36c'est de réordonner la matrice
10:38de manière à donner
10:39une structure globale
10:40pour organiser
10:41ces objets.
10:43Cette réorganisation,
10:44elle est non seulement utile
10:45pour comprendre, entre guillemets,
10:47mais aussi pour savoir
10:48si les objets sont
10:49de la même époque
10:51ou d'époque différente
10:52et caractéristiques
10:52variant par époque.
10:53Donc, il utilise au début
10:55trois méthodes
10:56qu'on voit ici,
10:57CA, AF et AH,
10:58qui sont trois méthodes
10:59automatiques
11:00de réordonnancement
11:04de matrice,
11:05la classification automatique,
11:06l'analyse vectorielle
11:07et l'analyse hiérarchique.
11:09Et il part de l'analyse
11:12hiérarchique,
11:13en bas à gauche,
11:13et ensuite, il fait plein d'opérations
11:15pour l'améliorer manuellement.
11:17Donc, il explique,
11:18enfin, il montre
11:19cette démarche,
11:20mais il ne l'explique pas.
11:20Encore une fois,
11:21on a passé beaucoup de temps
11:22à décrypter
11:22cette opération
11:25dans le livre
11:26de la semiologie graphique
11:27parce qu'il ne rentre pas
11:28vraiment dans les détails.
11:29Et donc, il fait des choses
11:30qui sont tout à fait inédites
11:31en analyse de données.
11:33À gauche,
11:35il commence par mettre
11:35à gauche des objets
11:36qui sont similaires
11:37ou qui sont inverses.
11:38Mais donc, il dit
11:39que si on a
11:40la caractéristique arrondie,
11:43on a le droit de dire
11:44que c'est l'inverse
11:45de pas arrondi
11:46et donc de transformer
11:48tous les blancs en noir
11:48et tous les noirs en blanc.
11:49Et c'est ce qu'il fait
11:50à gauche,
11:51dans la colonne,
11:52dans la partie gauche
11:53de la matrice,
11:54dans la première
11:55à la deuxième,
11:56il fait ça.
11:56Il transforme
11:57une caractéristique X
11:59en caractéristique non X
12:00pour dire,
12:01je vais comme ça
12:01mettre ensemble
12:02tout un ensemble
12:03de caractéristiques
12:03qui vont être identiques.
12:05Donc, il explique
12:06la démarche
12:07qu'il fait interactivement
12:07pour ordonner son tableau.
12:10Et tout à fait à droite,
12:11là, on a le tableau
12:12qui est parfaitement ordonné
12:13avec des exceptions.
12:15Et là encore,
12:16la notion d'exception,
12:17c'est une notion
12:17qui statistiquement
12:18est très très mal définie
12:21en réalité.
12:22Mais lui, il explique
12:23que quand on fait
12:24une classification,
12:24une organisation de matrice,
12:26il y a des exceptions
12:27et il faut les classer
12:28en exceptions.
12:30Donc, comme je vous disais,
12:31ce travail-là,
12:32il est vraiment intéressant
12:32et il a une longue tradition,
12:35une très longue tradition,
12:36justement dans le domaine
12:39de l'archéologie.
12:40Ça date de 8,
12:41des années 1900
12:42où on a cherché
12:43des méthodes
12:43pour classer,
12:44pour organiser
12:45ces matrices
12:46d'objets archéologiques
12:48et de caractéristiques
12:49automatiquement.
12:51Et donc,
12:51c'était des méthodes
12:51automatiques de sériation
12:53qui ont été utilisées.
12:54Et donc, Bertin,
12:55lui, il a cette particularité
12:58de dire qu'il faut interagir
12:59soit complètement,
13:01soit à un certain moment
13:02pour faire des opérations manuelles
13:03et donner du sens à la table.
13:05Ce qu'il faut aussi comprendre,
13:07et ça, c'est sur quoi je travaille,
13:08c'est que ce travail
13:09de méthode automatique
13:11ou manuelle
13:11ou mixte
13:13pour réussir
13:13à bien redonner
13:14les matrices,
13:15ce n'est pas un travail
13:16qui est terminé.
13:17C'est un travail
13:17qui est en cours.
13:18Donc, cette année,
13:19à la fin du mois,
13:20il va y avoir
13:20la présentation scientifique
13:22d'un nouvel article
13:23sur une nouvelle méthode,
13:24une nouvelle mesure
13:25pour améliorer
13:26la sériation.
13:28Donc,
13:29c'est un travail
13:30qui reste
13:34très actuel
13:35et très important.
13:36J'ai beaucoup travaillé dessus,
13:37on a fait des états de l'art,
13:38on a fait des nouveaux algorithmes,
13:39des nouveaux systèmes,
13:40mais c'est un travail
13:41qui continue.
13:42Et donc,
13:42Jacques Bertin
13:43se place vraiment
13:44à un moment charnière
13:46où plein de méthodes
13:47existaient automatiques,
13:48mais qui n'étaient pas
13:49vraiment satisfaisantes
13:50parce qu'elles donnaient
13:50des résultats
13:51qui étaient approximatifs
13:52et pas forcément
13:53très faciles à comprendre.
13:54Lui,
13:55il a prôné
13:56les méthodes manuelles
13:57pour améliorer,
13:58et derrière,
13:59nous,
13:59on est arrivé
14:00et on a essayé
14:01de voir comment combiner
14:02les méthodes manuelles
14:03et les méthodes automatiques.
14:04Donc,
14:04intégrer l'humain
14:05dans la boucle,
14:06par exemple,
14:07c'est ce qu'on a fait
14:07sur un système
14:08qui s'appelle Vertifier,
14:09qui est en ligne aussi,
14:11où l'humain peut intervenir
14:13et interagir
14:14avec des systèmes,
14:15des méthodes automatiques.
14:16Donc,
14:16la machine peut automatiquement
14:17proposer un réordonnancement
14:20et l'humain peut dire
14:21non,
14:23je ne suis pas d'accord
14:23avec ça,
14:24je le mets comme ci,
14:25je le mets comme ça,
14:26et donc à partir
14:26d'une table de données
14:27qu'on voit ici à gauche,
14:29à travers plusieurs itérations
14:31et méthodes soit manuelles,
14:33soit automatiques,
14:35soit entre les deux,
14:36réussir à donner du sens
14:37à des tables
14:38à partir d'un mélange
14:40de manuelles
14:42et d'automatiques.
14:43Et donc,
14:43je pense que ça,
14:43c'est un point crucial
14:44sur la recherche d'aujourd'hui.
14:46La recherche en mathématiques
14:48ou en informatique,
14:49elle a travaillé
14:50sur la notion d'optimisation
14:52jusqu'aux années 2010
14:54et les gens avaient
14:55dans leur tête l'idée
14:56qu'il existait
14:56une représentation
14:58parfaite
14:59et optimale
15:00d'un tableau
15:01ou de quelque chose
15:02comme ça.
15:03Depuis 2010,
15:03je pense que les gens
15:04ont bien réussi
15:04à comprendre
15:05que l'optimalité
15:06n'est pas forcément
15:07un objectif unique
15:09et qu'il y a deux choses
15:11différentes qui interviennent.
15:12Il faut être capable
15:13non seulement
15:13d'essayer d'optimiser
15:15mais aussi de rendre
15:15compréhensible
15:16et donc des fois
15:17rendre compréhensible,
15:18ce n'est pas optimiser
15:19au sens de la machine
15:20mais c'est optimiser
15:21au sens de l'homme.
15:22Et deuxièmement,
15:22une autre chose
15:23que Bertin a beaucoup dit,
15:25c'est qu'il n'y a pas
15:26une seule manière
15:27de représenter les données
15:28pour les rendre compréhensibles.
15:30Il est important
15:30de présenter
15:31plusieurs représentations
15:32de manière à ce qu'à travers
15:33ces multiples représentations
15:35puissent avoir
15:35une vision
15:36de plusieurs points de vue
15:38des mêmes données
15:39de manière à mieux
15:40les comprendre.
15:41Donc ça aussi,
15:42c'est une chose
15:43qui paraissait évidente
15:45à Bertin
15:45mais qui est encore aujourd'hui
15:47en data science
15:48ou en visualisation
15:50de données,
15:50les gens ont du mal
15:51à comprendre
15:52qu'il n'existe pas toujours
15:53une représentation optimale
15:55mais plusieurs représentations
15:56complémentaires
15:57et que parfois,
15:59il est important
16:00que l'humain fasse
16:00des opérations
16:01pour rendre compréhensibles
16:02les données
16:03au-delà de ce que la machine
16:04peut faire
16:05pour les rendre
16:06presque compréhensibles.
16:09Donc,
16:09verficieur,
16:10je ne vais pas vous faire
16:10la vidéo
16:11parce qu'il était par le temps
16:13si j'ai bien compris
16:13mais la vidéo
16:15est disponible en ligne
16:15aussi sur YouTube
16:17vous pouvez le voir.
16:18Donc vraiment,
16:19le point qui est important
16:21à comprendre
16:22c'est que Jacques Bertin
16:22a été pionnier
16:23des méthodes interactives
16:25pour le réordonnement
16:26de matrice.
16:27Il n'est pas le premier
16:27à l'avoir fait
16:28puisque c'est une longue
16:29tradition en archéologie
16:30mais qui a rencontré
16:32l'intérêt de statisticiens
16:33qui avaient l'idée
16:34que des méthodes
16:35totalement automatiques
16:36pouvaient résoudre le problème
16:37alors que Bertin
16:38a montré que
16:38l'intervention humaine
16:40améliorait sensiblement
16:41les solutions.
16:43Et aujourd'hui encore,
16:44on continue à travailler
16:45sur des méthodes
16:46automatiques et hybrides
16:47pour pouvoir faciliter
16:49la compréhension
16:49de ces tables complexes.
16:51et le fait de le faire
16:53ça permet effectivement
16:54en visualisation
16:55de comprendre
16:55des quantités
16:56de données importantes
16:57et donc effectivement
16:58que tu disais
17:00la plateforme Amado
17:01qui était la précurseur
17:03de ce qu'elle utilisait
17:03après ce qu'elle fait Bertin
17:05mais qui utilisait
17:06les mêmes méthodes
17:07et maintenant en ligne
17:07sur l'Unum.
17:09Donc ça c'est très bien
17:10que les méthodes
17:10soient utilisées
17:11et il reste énormément
17:13de travail à faire
17:14pour continuer
17:15à rendre
17:15ces méthodes utilisables
17:17par tout un chacun
17:18mais on a des outils
17:19qui sont maintenant en ligne
17:20et ce qu'a dit Jacques Bertin
17:23reste important
17:23il faut continuer
17:24à dire
17:25qu'interagir
17:26avec les visualisations
17:28ça permet de les rendre
17:29plus intelligibles
17:30et que la machine seule
17:32n'y arrivera pas
17:32il faut
17:33qu'une intervention humaine
17:35ait lieu
17:36et ça c'est Bertin
17:37qui l'a beaucoup
17:38Voilà, merci.