Blog de jpd

Aller au contenu | Aller au menu | Aller à la recherche

dimanche 11 septembre 2011

L\'intégration de Riemann (re)découverte

Et moi qui râle que les physiciens n\'ont pas assez de formation en mathématiques. En fait, ce sont aussi les physicians (remarquez le subtil jeu de mot !) qui devraient en avoir une meilleure :

\r\n

A mathematical model for the determination of total area under glucose tolerance and other metabolic curves

\r\n

Ceci dit, l\'idée était bonne ! J\'espère que son prochain article proposera une division non pas de l\'axe des abscisses, mais de l\'axe des ordonnées !

','

Et moi qui râle que les physiciens n\'ont pas assez de formation en mathématiques. En fait, ce sont aussi les physicians (remarquez le subtil jeu de mot !) qui devraient en avoir une meilleure :

\r\n

A mathematical model for the determination of total area under glucose tolerance and other metabolic curves

\r\n

Ceci dit, l\'idée était bonne ! J\'espère que son prochain article proposera une division non pas de l\'axe des abscisses, mais de l\'axe des ordonnées !

Savez-vous calculer ? (3)

On arrive sur le dernier effort pour ce long billet, un peu technique, je l\'avoue. Je me bornerai à énoncer un résultat, et à donner le vocabulaire nécessaire pour le comprendre, sans chercher à le démontrer, car j\'en serais moi-même incapable.

Commençons par du vocabulaire : soient trois groupes [tex]$G$[/tex], [tex]$\\tilde G$[/tex] et [tex]$A$[/tex]. On dit que [tex]$\\tilde G$[/tex] est une extension de [tex]$G$[/tex] par [tex]$A$[/tex] si la suite

[tex]$1 \\rightarrow A \\hookrightarrow \\tilde G \\twoheadrightarrow G \\rightarrow 1$[/tex]


est exacte.


Je suppose que la majorité de mes lecteurs ne sait pas ce qu\'est une suite exacte, je vais donc m\'empresser d\'en donner la définition. Cette notion est définie dans beaucoup de cadres différents, je vais me limiter au cadre des groupes. Soient donc un ensemble de groupes que je vais noter génériquement [tex]$G_i$[/tex], l\'indexation pouvant être sur un ensemble fini ou non des entiers. Je suppose en outre qu\'entre chaque groupe [tex]$G_i$[/tex] et [tex]$G_{i+1}$[/tex], j\'ai un morphisme [tex]$f_i : G_i \\rightarrow G_{i+1} $[/tex]. La situation est donc la suivante :


[tex]$\\cdots \\overset{f_{i-1}}{\\longrightarrow} G_i \\overset{f_i}{\\longrightarrow}G_{i+1} \\overset{f_{i+1} }{\\longrightarrow} G_{i+2} \\overset{f_{i+2}}{\\longrightarrow} \\cdots $[/tex]


La suite peut, ou non, s\'arrêter vers la droite ou vers la gauche, ce n\'est pas très important. La suite sera dite exacte si pour chaque groupe, l\'égalité suivante est satisfaite :

[tex]$\\mathop\\mathrm{Im} f_{i-1} = \\mathop\\mathrm{Ker} f_{i}$[/tex]


En particulier, prenons un élément [tex]$g$[/tex]dans un groupe [tex]$G_{i-1}$[/tex]. Celui-ci a une image dans [tex]$G_i$[/tex], par [tex]$f_{i-1}$[/tex]. En particulier, son image [tex]$f_{i-1}(g)$[/tex] sera évidemment dans [tex]$\\mathop\\mathrm{Im} f_{i-1}$[/tex]. Si la suite est exacte, on a de plus que [tex]$f_i(f_{i-1}(g)) = e $[/tex]. Ainsi, dans une suite exacte, un élément ne « survit » pas à deux sauts vers des groupes en aval. En fait, il aurait suffi que [tex]$\\mathop\\mathrm{Im} f_{i-1} \\subset \\mathop\\mathrm{Ker} f_{i}$[/tex].


Permettez-moi une petite digression à propos de ces suites exactes. Dans certaines situations, il est possible de définir des suites de groupes reliés par des morphismes comme précédemment, mais en imposant cette fois-ci seulement la condition [tex]$f_{i+1} \\circ f_i = e$[/tex]. Cette condition n\'est pas suffisante pour que la suite soit exacte (c\'est une condition nécessaire, comme on l\'a vu). Évaluer l\'obstruction à l\'exactitude d\'une telle suite — c\'est-à-dire « concrètement » (s\'il m\'est permis d\'utiliser ce terme) calculer le quotient [tex]$\\mathop\\mathrm{Ker} f_{i} / \\mathop\\mathrm{Im} f_{i-1}$[/tex] — est un problème qui est hautement non trivial, et relève du domaine qu\'on appelle l\'homologie ou la cohomologie. Pour ceux qui s\'en rappellent, les histoires de formes exactes et fermées relèvent de ce domaine : une forme exacte est fermée, mais une forme fermée n\'est pas toujours exacte...


Bref, ce n\'est pas grave si c\'était assez obscur, revenons à nos suites exactes. Une application assez importante et que je vais essayer de décrire en détail est la notion de suite exacte courte ; elle est du type


[tex]$1 \\longrightarrow A \\overset{f}{\\longrightarrow}\\tilde G \\overset{g}{\\longrightarrow} G \\longrightarrow 1 $[/tex]


Je suppose cette suite exacte ; les [tex]$1$[/tex] correspondent simplement aux groupes à un élément, le neutre. Examinons la propriété d\'exactitude. L\'application [tex]$1 \\longrightarrow A$[/tex] est évidemment celle qui au neutre, seul élément du groupe [tex]$1$[/tex], associe le neutre du groupe [tex]$A$[/tex], car c\'est un morphisme. L\'image de cette première application est donc le neutre. En vertu de la suite exacte, on en déduit que [tex]$f$[/tex] a pour noyau l\'élément neutre : c\'est donc une application injective ! Passons maintenant de l\'autre côté de la suite. La dernière application a évidemment pour noyau l\'ensemble du groupe [tex]$G$[/tex]. Ainsi, l\'image de [tex]$g$[/tex] est l\'ensemble du groupe d\'arrivée : autrement dit, cette dernière application est surjective ! C\'est la raison des notations initiales : les flèches sont légèrement modifiées, et signifient en général (ce n\'est pas une notation personnelle) l\'injectivité et la surjectivité des applications :

[tex]$1 \\rightarrow A \\hookrightarrow \\tilde G \\twoheadrightarrow G \\rightarrow 1$[/tex]

Si on a une telle suite, on peut (et on va !) montrer la propriété suivante : dans ce cas, [tex]$ \\tilde G / A \\cong G$[/tex], le symbole intermédiaire symbolisant l\'isomorphisme, c\'est-à-dire un morphisme bijectif.


Propriété de factorisation


L\'essentiel du travail va consister à démontrer le résultat intermédiaire, mais pourtant très important, suivant : si j\'ai un morphisme [tex]$f : G \\rightarrow G\'$[/tex], alors j\'ai un isomorphisme entre [tex]$G / \\mathop\\mathrm{Ker} f$[/tex] et [tex]$ \\mathop\\mathrm{Im} f$[/tex]. En fait, cette propriété est assez intuitive : lorsqu\'on quotiente, il faut considérer que l\'on « tue » les éléments de l\'ensemble par lequel on quotiente. Ainsi, si on retire de [tex]$G$[/tex] tous les éléments qui sont dans le noyau de l\'application, on obtient précisément l\'image. Mais on va tout de même démontrer ce résultat. Dans un premier temps, il faut démontrer que le quotient a bien une structure de groupe. On n\'a pas énormément de choix pour cette loi, c\'est celle qui se déduit naturellement de la loi de [tex]$G$[/tex] !


Groupe quotient et sous-groupe distingué

Je rappelle la définition du quotient de [tex]$G$[/tex] par [tex]$H$[/tex] : c\'est l\'ensemble des classes d\'équivalences pour la relation


[tex]$ g \\sim g\' \\qquad \\Leftrightarrow \\qquad \\exists h\\in H, \\quad g\' = hg$[/tex]


et on note [tex]$[g]$[/tex] la classe d\'un élément [tex]$g \\in G$[/tex]. On veut donc montrer qu\'il existe bien une loi de groupe pour [tex]$G/ H$[/tex]. Comme dit un peu plus haut, on cherche à poser [tex]$[g][\\tilde g] = [g \\tilde g]$[/tex] : comme d\'habitude pour un quotient, on ne peut travailler qu\'en choisissant explicitement un élément de l\'espace de départ, et on montre que le choix de tout autre élément équivalent donne le même résultat. On va donc montrer que si on avait pris [tex]$g\'$[/tex] et [tex]$\\tilde g\'$[/tex] équivalents à [tex]$g$[/tex] et [tex]$\\tilde g$[/tex], on aurait toujours eu le même résultat. On souhaite donc [tex]$[g\'][\\tilde g\'] = [g][\\tilde g] $[/tex]. On se donne [tex]$h$[/tex] et [tex]$\\tilde h$[/tex], qui existent par définition de la relation d\'équivalence. On en arrive donc à vouloir montrer [tex]$[h g \\tilde h \\tilde g] = [g \\tilde g] $[/tex] ; il faut montrer qu\'il existe un élément [tex]$\\ell \\in H$[/tex] tel que


[tex]$\\ell h g \\tilde h \\tilde g = g \\tilde g$[/tex]

La relation précédente se simplifie donc en [tex]$g \\tilde h g^{-1} = (\\ell h)^{-1}$[/tex], relation qu\'on souhaite démontrer pour prouver qu\'on a bien une relation de groupe. Mais à ce stade là, on est coincé si on ne fait pas d\'hypothèse supplémentaire ! Ce constat amène à définir un nouveau concept, celui de sous-groupe distingué : un sous-groupe [tex]$H$[/tex] de [tex]$G$[/tex] est dit distingué dans [tex]$G$[/tex], et on note [tex]$H \\vartriangleleft G$[/tex], si la relation suivante est vérifiée :


[tex]$\\forall g \\in G, \\quad \\forall h \\in H, \\qquad ghg^{-1} \\in H$[/tex] .

Dans notre cas, on voit bien que supposer [tex]$H$[/tex] distingué assure, en choisissant un [tex]$\\ell$[/tex] convenable, qu\'on aura bien l\'égalité [tex]$g \\tilde h g^{-1} = (\\ell h)^{-1}$[/tex]. Il suffit de prendre [tex]$\\ell = h^{-1} g \\tilde h g^{-1}$[/tex], qui appartient bien à [tex]$H$[/tex]. L\'égalité que l\'on vient de démontrer signifie que notre loi de groupe est bien indépendante des représentants choisis pour la calcul, donc que le quotient possède bien une structure de groupe — pourvu, encore une fois, que le sous-groupe par lequel on quotiente soit distingué !


Retour au problème de la factorisation

Nous voilà bien avancés : est-ce que, dans notre calcul de [tex]$G / \\mathop\\mathrm{Ker} f$[/tex], le sous-groupe [tex]$\\mathop\\mathrm{Ker} f$[/tex] est distingué ? Heureusement, la réponse est oui, et c\'est même une propriété générale : tout sous-groupe qui s\'exprime comme noyau d\'un morphisme est distingué. C\'est assez facile à démontrer : on cherche à démontrer que pour tout élément [tex]$g \\in G$[/tex] et [tex]$h \\in \\mathop\\mathrm{Ker} f$[/tex], on a [tex]$g h g^{-1} \\in \\mathop\\mathrm{Ker} f$[/tex] (c\'est la relation de définition !). Pour cela, on calcule tout bêtement


[tex]$f(g h g^{-1} ) = f(g) f(h) f(g^{-1}) = f(g) f(g^{-1}) = f(e) = e$[/tex] ;


on a utilisé le fait que [tex]$h \\in \\mathop\\mathrm{Ker} f$[/tex], c\'est-à-dire [tex]$f(h) = e$[/tex], et des propriétés de morphisme de [tex]$f$[/tex]. Ainsi, un sous-groupe qui s\'exprime comme noyau d\'une application est automatiquement distingué, et ça a donc un sens de parler du groupe quotient.


Il reste maintenant à démontrer [tex]$G / \\mathop\\mathrm{Ker} f \\cong\\mathop\\mathrm{Im} f $[/tex]. On va introduire une application auxiliaire [tex]$\\tilde f$[/tex] définie par [tex]$\\tilde f([g]) = f(g) $[/tex], et on va montrer que c\'est un isomorphisme. Cette application est bien définie ; pour le montrer, on fait comme d\'habitude, on prend deux éléments équivalents, et on montre que le résultat est identique :

[tex]$\\tilde f( [g\']) = f(g\') = f(hg) = f(h)f(g) = f(g) = \\tilde f([g])$[/tex]


Puisqu\'on a quotienté par le noyau de [tex]$f$[/tex], donc [tex]$f(h)=e$[/tex]. Le fait que ce soit un morphisme découle naturellement du fait que [tex]$f$[/tex] le soit.


Son noyau est par définition [tex]$\\{ [g] \\,|\\, \\tilde f([g])=0 \\}$[/tex], c\'est-à-dire


[tex]$\\{ [g] \\,|\\, f(g)=0 \\} = \\{ [g] \\,|\\, g \\in \\mathop\\mathrm{Ker} f\\} = [ \\mathop\\mathrm{Ker} f] $[/tex]


Le noyau de [tex]$\\tilde f$[/tex] est donc constitué des classes de chaque élément de [tex]$ \\mathop\\mathrm{Ker} f$[/tex] ; mais ce dernier ensemble n\'est rien d\'autre que la classe de l\'identité ! En effet, pour tout élément [tex]$\\tilde e \\in \\mathop\\mathrm{Ker} f$[/tex], il existe un élément [tex]$h$[/tex] dans [tex]$H = \\mathop\\mathrm{Ker} f $[/tex] tel que [tex]$e = h \\tilde e $[/tex] ; il suffit de prendre [tex]$h = \\tilde e ^{-1}$[/tex] ! On vient de vérifier la propriété-définition d\'appartenir à la même classe : tout élément [tex]$h$[/tex] de [tex]$\\mathop\\mathrm{Ker} f$[/tex] vérifie [tex]$[h] = [e]$[/tex]. Ainsi, le noyau de [tex]$\\tilde f$[/tex] est exactement la classe de l\'élément neutre de [tex]$G$[/tex], qui est précisément l\'élément neutre de [tex]$ G /\\mathop\\mathrm{Ker} f $[/tex] (attention, il y a une petite subtilité à cet endroit : il ne faut pas confondre un élément, sa classe, et le terme général d\'élément neutre dans un groupe).


Il reste à démontrer l\'aspect surjectif de [tex]$\\tilde f$[/tex] de [tex]$ G /\\mathop\\mathrm{Ker} f $[/tex] dans [tex]$\\mathop\\mathrm{Im} f$[/tex]. Supposons-nous donné un élément [tex]$z\\in \\mathop\\mathrm{Im} f $[/tex] dont on cherche un antécédent dans le groupe quotient. Évidemment, par définition de l\'image d\'un ensemble, on peut trouver un élément [tex]$g \\in G$[/tex] tel que [tex]$f(g) = z$[/tex]. Mais du coup, [tex]$\\tilde f([g]) = f(g) = z$[/tex] ! Ainsi, notre application est surjective.

[tex]$\\tilde f$[/tex] est un morphisme injectif et surjectif : c\'est donc un isomorphisme ! Récapitulons donc ce résultat que l\'on vient d\'établir :

Soit [tex]$f : G \\rightarrow G\'$[/tex] un morphisme. Alors on a

[tex]$G /\\mathop\\mathrm{Ker} f \\cong\\mathop\\mathrm{Im} f $[/tex] .

Suite exacte


Revenons au résultat que l\'on souhaitait initialement démontrer ; dans le cas d\'une suite exacte


[tex]$1 \\rightarrow A \\overset{f}{\\hookrightarrow} \\tilde G \\overset{g}{\\twoheadrightarrow} G \\rightarrow 1$[/tex] ,

alors [tex]$ \\tilde G / A \\cong G$[/tex]. On va bien sûr utiliser le résultat précédent, et on va l\'appliquer à l\'application [tex]$g : \\tilde G \\rightarrow G$[/tex]. Ainsi, on sait que [tex]$\\tilde G / \\mathop\\mathrm{Ker} g\\cong \\mathop\\mathrm{Im} g$[/tex]. Mais [tex]$g$[/tex] est surjective, comme le laisse d\'ailleurs entendre la double flèche (ce n\'est pas une démonstration, on l\'avait déjà faite !). Donc [tex]$\\mathop\\mathrm{Im} g = G$[/tex]. Il faut maintenant identifier [tex]$\\mathop\\mathrm{Ker} g$[/tex] ; grâce à la propriété d\'exactitude, [tex]$\\mathop\\mathrm{Ker} g = \\mathop\\mathrm{Im} f$[/tex]. Puisque [tex]$f$[/tex] est injective, il se trouve qu\'on a [tex]$\\mathop\\mathrm{Im} f \\cong A$[/tex] (je le démontre dans quelques instants). Ainsi, on a au final bien

[tex]$\\tilde G / \\mathop\\mathrm{Ker} g\\cong \\mathop\\mathrm{Im} g \\qquad \\Leftrightarrow \\qquad \\tilde G / A \\cong G $[/tex] ,

ce que l\'on souhaitait démontrer.


Il reste maintenant à montrer que [tex]$\\mathop\\mathrm{Im} f \\cong A$[/tex]. Il suffit d\'appliquer à nouveau notre propriété de factorisation ! On sait que [tex]$\\mathop\\mathrm{Ker} f =\\{ e \\} $[/tex] car [tex]$f$[/tex] est injective (c\'est une des propriétés de la suite exacte, au même titre que la surjectivité de [tex]$g$[/tex]). Ainsi, on a [tex]$A / \\{ e \\} \\cong \\mathop\\mathrm{Im} f$[/tex]. Et clairement, [tex]$[A / \\{ e \\} \\cong A$[/tex] : en effet, pour que [tex]$g\' \\sim g$[/tex], il faut trouver un élément de [tex]$\\{e\\}$[/tex] tel que [tex]$g\' = ge = g$[/tex]. Donc les classes sont constitués des éléments égaux à eux-mêmes, bref, il ne se passe rien.

Ceci conclut donc notre démonstration, nous gagnons un niveau, et nous pouvons passer à la suite (ouf) !


Extension centrale


Une extension centrale d\'un groupe [tex]$G$[/tex] est une suite exacte courte

[tex]$1 \\rightarrow A \\hookrightarrow \\tilde G \\twoheadrightarrow G \\rightarrow 1$[/tex]

telle que [tex]$A$[/tex] soit inclus dans le centre de [tex]$\\tilde G$[/tex] — le centre est constitué de l\'ensemble des éléments qui commutent avec tous les autres. Dans le cas d\'un groupe commutatif par exemple, le centre est le groupe lui-même. Ce qu\'on cherche à faire, c\'est donc à trouver un groupe plus gros que [tex]$G$[/tex], puisqu\'on a alors la relation\r\n

[tex]$ \\tilde G / A \\cong G $[/tex]


L\'intérêt des extensions centrales, et que je ne vais pas démontrer, et le suivant : il se trouve que toute représentation projective de [tex]$G$[/tex] découle d\'une représentation linéaire d\'une extension centrale ! En fait,


[tex]$1 \\rightarrow A \\hookrightarrow \\tilde G \\twoheadrightarrow G \\rightarrow 1$[/tex]


se transpose en


[tex]$1 \\rightarrow \\mathbf{K}^\\ast \\hookrightarrow GL(E) \\twoheadrightarrow PGL(E) \\rightarrow 1$[/tex] .

\r\n

Ce résultat se démontre précisément en faisant appel à des résultats de cohomologies, mais je ne l\'ai moi-même jamais vu. C\'est un résultat utile, car il est bien plus facile de trouver, et classer, des représentations linéaires que des représentations projectives. en revanche, les représentations projectives sont importantes car ce sont celles qui apparaissent naturellement en mécanique quantique ; ainsi, il suffira de trouver une extension centrale d\'un groupe, puis les représentations linéaires de l\'extension, pour en déduire des représentations projectives du groupe initial. Mais j\'en parlerais plus longuement dans mon prochain article !


Savez-vous calculer ? (2)

Maintenant que vous avez tous bien compris ce qu\'est une représentation de groupe, je vais devoir vous traumatiser encore un peu avant de pouvoir parler des applications en physique de cette belle théorie. Il va falloir parler des représentations projectives, puisque ce sont celles-là qui sont importantes en physique. Et pour comprendre ce qu\'est une représentation projective, il faut parler des espaces projectifs (bon, pour être franc, ce n\'est pas absolument indispensable, mais c\'est quand même le cadre le plus naturel).

\r\n

Espaces projectifs

\r\n

Bien bien, pour commencer, il faut se munir de son espace vectoriel favori, peu importe lequel. Personnellement, j\'ai un petit faible pour [tex]$\\mathbf{R}^{42}$[/tex], mais chacun fait comme il veut bien sûr. Dans cet espace, on peut définir la notion de droite (et on est tellement motivé qu\'on va le faire !).

\r\n

Rappelons-nous ce qu\'est une droite, version « pour les petits ». Une manière de définir la droite est la suivante : donnons-nous deux points [tex]$A$[/tex] et [tex]$B$[/tex]. Ces deux points définissent un vecteur, le vecteur... [tex]$\\overrightarrow{AB}$[/tex]. Alors la droite [tex]$AB$[/tex] est l\'ensemble des extrémités des vecteurs partant de [tex]$A$[/tex] et colinéaires à [tex]$\\overrightarrow{AB}$[/tex]. J\'espère que je ne vous apprends rien (tout au plus que je vous rappelle une définition), et que ça vous paraît évident. Lorsqu\'on passe dans un espace vectoriel, on perd bien sûr cette notion d\'extrémités d\'un vecteur, et il ne reste plus que... les vecteurs. Bien vu Sherlock. On va du coup légèrement adapter notre définition (ou caractérisation d\'une droite), de la manière la plus naturelle qui soit : une droite d\'un espace vectoriel passant par un vecteur [tex]$\\vec u$[/tex] est l\'ensemble des vecteurs colinéaires à [tex]$\\vec u$[/tex], c\'est-à-dire l\'ensemble des éléments de la forme [tex]$\\lambda \\vec u$[/tex] où [tex]$\\lambda$[/tex] est un scalaire (un élément du corps de l\'espace vectoriel, pour ceux qui s\'en rappellent). Bien sûr, on va exclure la possibilité que [tex]$\\vec u$[/tex] soit le vecteur nul, qui présente assez peu d\'intérêt. Quant à l\'espace projectif, c\'est tout simplement l\'ensemble dont les éléments sont constitués par ces droites ! J\'insiste : un élément de l\'espace projectif, c\'est une droite, et une droite, c\'est un ensemble de vecteurs. Se donner un vecteur, c\'est se donner une notion de direction et de longueur. Si on considère une droite, c\'est un ensemble de vecteurs colinéaires : on a donc conservé la notion de direction, mais on a perdu la notion de distance. Finalement, l\'espace projectif, c\'est l\'ensemble des directions de l\'espace vectoriel initial.

\r\n

Avant de définir l\'espace d\'une manière un peu plus formelle, je mentionnerai que cet espace est assez naturel dans un certain nombre de situations. L\'une d\'entre elle concerne les arts graphiques, puisqu\'un espace projectif est une manière mathématique de traiter la notion de perspective. Après tout, la vision d\'un de notre œil consiste essentiellement à donner une information de positionnement des objets environnants ; par positionnement, j\'entends une direction dans l\'espace. L\'œil est incapable, seul, de donner une information de distance. À ma connaissance (je ne suis pas un spécialiste), deux phénomènes peuvent participer à donner une impression de distance. La première est bien sûr la vue stéréographique, c\'est à dire à partir de deux yeux : en connaissant les directions spatiales d\'un point à partir de deux positions spatiales distinctes, on est capable de reconstruire sa position en s\'intéressant à l\'intersection des deux droites, passant par chaque œil et dont l\'orientation est connue par hypothèse.  Le cinéma « en relief », quel que soit sa technologie, repose sur ce principe : fournir à chaque œil une image différente qui correspond à ce que chaque œil verrait. Le cerveau n\'y voit que du feu (surtout si c\'est un film de guerre), et nous donne cette impression de relief. Le deuxième phénomène que j\'évoquais est en fait un peu une arnaque : on est capable d\'estimer une distance (en fait, une distance relative) en évaluant son diamètre apparent. En gros, l\'idée est par exemple qu\'on connaît la taille d\'un être humain, ainsi, si on dans la rue on ferme un œil, et si on voit une personne bien plus petite qu\'une autre, on saura que la personne la plus petite est la plus lointaine. C\'est donc plus l\'habitude de la taille des objets qui permet dans ce cas de les situer les uns par rapport aux autres, et d\'un point de vue « bio-mathématique », un seul œil est insuffisant à évaluer les distances, car un œil associe un objet (qu\'on suppose ponctuel) à... un élément d\'un espace projectif (vous avez vu comme on retombe sur nos pattes ? formidable !).

\r\n

Un autre exemple reposant sur ce principe, et qui souffre peut-être encore plus de cette limitation, est l\'observation astronomique : si la Terre était fixe, il ne serait pas possible d\'estimer la distance la séparant des étoiles (du moins, par une méthode géométrique ; je ne sais pas s\'il en existe d\'autres vraiment efficaces). On utilise le fait que la Terre se déplace par rapport au Soleil pour mesurer des positions (en fait, les directions) à six mois d\'intervalle, et on a ainsi simulé une observation avec nos deux yeux ! Bien sûr, on suppose que l\'astre observé n\'a pas ou peu bougé, etc.

\r\n

Avant de continuer, j\'avais parlé d\'une autre définition des espaces projectifs, peut-être un peu plus compliqué, mais d\'une portée plus générale, en ce sens qu\'elle utilise la procédure de quotient d\'un espace, procédure absolument fondamentale et omniprésente en mathématiques (quoique souvent cachée).

\r\n

Lorsqu\'on se donne un ensemble (quelconque à ce stade), on peut construire un certain nombre de relations entre ses éléments. Parmi les relations les plus courantes, on a d\'une part les relations d\'ordre, et d\'autre part les relations d\'équivalence. Ce sont ces dernières qui vont nous intéresser, je n\'en rappellerai pas la définition. Lorsqu\'on a muni un ensemble d\'une relation d\'équivalence, on peut toujours s\'intéresser à l\'ensemble des classes d\'équivalences liées à la relation. Cet ensemble s\'appelle l\'ensemble quotient.

\r\n

Dans le cas qui nous (m\')intéresse, la relation qu\'on pose sur notre [tex]$\\mathbf{K}$[/tex]-espace vectoriel,  [tex]$\\mathbf{K}= \\mathbf{R}$[/tex] ou [tex]$\\mathbf{C}$[/tex] est

\r\n

[tex]$\\vec u \\sim \\vec v \\quad \\leftrightarrow \\quad \\exists \\lambda \\in \\mathbf{K}\\setminus \\{0\\}, \\vec u = \\lambda \\vec v$[/tex]

\r\n

et l\'espace projectif est dont le quotient, qu\'on note

\r\n

[tex]$ P\\mathbf{K}^n = (\\mathbf{R}^{n+1} \\setminus \\{0\\}) / \\sim$[/tex]

\r\n

En quotientant, on perd une dimension d\'espace (intuitivement, on perd la notion de distance), d\'où les puissances [tex]$n$[/tex] et [tex]$n+1$[/tex] dans la définition. Pour être rigoureux, ce sont les dimensions en tant que variété, mais je ne veux pas m\'embarquer là-dedans (en tout cas pas maintenant).

\r\n

On notera [tex]$[\\vec u]$[/tex] un élément de [tex]$P\\mathbf{K}^n$[/tex], qui est la classe d\'équivalence de [tex]$\\vec u$[/tex]. En outre, [tex]$\\lambda \\vec u$[/tex] est dans la même classe d\'équivalence que [tex]$\\vec u$[/tex] ; ainsi, [tex]$[\\lambda \\vec u] = [\\vec u]$[/tex].

\r\n

Une autre remarque sur laquelle je souhaite insister et la suivante : aucune condition particulière sur l\'espace vectoriel n\'a été imposée. À partir d\'un espace vectoriel quelconque, on peut toujours définir l\'espace projectif qui lui est associé.

\r\n

Il est maintenant temps de parler de ce qui se passe pour les applications.

\r\n

Applications projectives

\r\n

Soient deux espaces vectoriels [tex]$E$[/tex] et [tex]$F$[/tex] quelconques, et soit une application linéaire [tex]$f : E \\rightarrow F$[/tex]. La question que l\'on se pose et de savoir si il existe une application naturellement déduite de [tex]$f$[/tex] qui relierait les espaces projectifs associés aux espaces initiaux.

\r\n

La réponse est bien sûr oui, mais il convient de faire un tout petit peu attention. Tout d\'abord, remarquons que l\'image par [tex]$f$[/tex] d\'une droite de [tex]$E$[/tex] et qui n\'est pas contenue dans [tex]$\\mathop\\mathrm{Ker}f$[/tex] est une droite de [tex]$F$[/tex]. Cette proposition est évidente, car c\'est la définition d\'une application linéaire : [tex]$f(\\lambda \\vec u) = \\lambda f(\\vec u)$[/tex], donc pourvu que [tex]$ f(\\vec u)$[/tex] ne soit pas nul, on obtient bien une droite en prenant tous les [tex]$\\lambda$[/tex] possibles. On va montrer que [tex]$f$[/tex] induit bien (« par passage au quotient », dans le jargon) une application, notée [tex]$[f]$[/tex], de [tex]$PE\\setminus P\\mathop\\mathrm{Ker}f$[/tex] dans [tex]$PF$[/tex], les espaces projectifs. Les espaces projectifs sont, je le rappelle, constitués d\'ensembles de vecteurs. Disposant d\'une application [tex]$f$[/tex] associant un vecteur de [tex]$E$[/tex] à un vecteur de [tex]$F$[/tex], le plus naturel (pour ne pas dire la seule chose possible) consiste à définir [tex]$[f]$[/tex] de la manière suivante : je considère un élément de [tex]$PE$[/tex] ; cet élément est une classe d\'équivalence de vecteurs, donc c\'est en particulier un ensemble qui contient des vecteurs (tous équivalents). J\'en choisis un au hasard ; cet élément, c\'est bien sûr un vecteur, donc je peux lui appliquer la fonction [tex]$f$[/tex]. J\'obtiens un autre vecteur, dans [tex]$F$[/tex]. À partir de [tex]$F$[/tex], je sais définir un élément de [tex]$PF $[/tex] : il suffit que je prenne sa classe d\'équivalence ! Tout ce petit raisonnement se symbolise de la manière suivante (je rappelle que les crochets symbolisent les objets qui ont un lien avec l\'espace projectif) :

\r\n

[tex]$[f]([\\vec u]) = [f(\\vec u)]$[/tex] .

\r\n

Bien sûr, il y a quelque chose qui j\'espère vous aura perturbé dans ce que je fais : j\'ai explicitement choisi un représentant de ma classe d\'équivalence. Que se serait-il passé si j\'en avais choisi un autre ? Il est nécessaire de vérifier que ma définition est bien indépendante du représentant choisi. Cette manière de procéder est extrêmement courante dès qu\'il s\'agit de travailler avec des espaces quotients : en général, on ne sait jamais travailler directement sur ces espaces, et on calcule « explicitement » en prenant un élément des espaces non quotientés, on calcule, et on vérifie que le résultat aurait été le même en prenant un élément équivalent (au sens de la relation d\'équivalence) à celui choisi.

\r\n

Mais vous connaissez bien sûr tout cela : que je calcule avec [tex]$\\frac53$[/tex] ou [tex]$\\frac{15}{9}$[/tex], le résultat est bien sûr le même ! Les rationnels sont effectivement construits à partir des entiers relatifs, en quotientant [tex]$\\mathbf{Z}\\times \\mathbf{Z}^\\ast$[/tex] par la relation

\r\n

[tex]$(a,b) \\sim (c,d) \\quad \\Leftrightarrow \\quad a\\cdot d = b \\cdot c$[/tex]

\r\n

Et on note en général [tex]$(a,b) \\equiv \\frac{a}{b}$[/tex]...

\r\n

Bref, revenons à nos applications ; on exige que notre définition ne dépende pas du représentant choisi au sein de notre classe d\'équivalence. Puisque de manière générale, deux éléments au sein d\'une même classe s\'écrivent [tex]$\\vec u$[/tex] et [tex]$\\lambda \\vec u$[/tex], on souhaite montrer

\r\n

[tex]$[f]([\\vec u]) = [f]([\\lambda \\vec u])$[/tex] .

\r\n

La démonstration n\'est pas compliquée, il suffit d\'être soigneux dans les objets qu\'on manipule :

\r\n

[tex]$[f]([\\vec u]) = [f(\\vec u)] = [\\lambda f(\\vec u)] = [f(\\lambda \\vec u)] = [f]([\\lambda \\vec u])$[/tex] .

\r\n

La première égalité vient de notre définition de [tex]$[f]$[/tex] ; la deuxième, car on se place dans l\'espace projectif [tex]$PF$[/tex] ; la troisième, car [tex]$f$[/tex] est une application linéaire ; enfin, la dernière vient de la définition de [tex]$[f]$[/tex] appliquée à l\'élément [tex]$\\lambda \\vec u$[/tex].

\r\n

Au passage, on constate que la troisième égalité pourrait aussi s\'écrire

\r\n

[tex]$[\\lambda f(\\vec u)] = [\\lambda f]([\\vec u])$[/tex] .

\r\n

Grâce à cette petite remarque, on vient de prouver que [tex]$[f] = [\\lambda f]$[/tex], c\'est-à-dire que deux applications linéaires proportionnelles ont même image. Autrement dit, on peut aussi définir l\'espace projectif associé aux applications linéaires (eh oui ! c\'est aussi un espace vectoriel !), et tout se passe comme on le souhaite ! La relation de proportionnalité s\'interprète dans ce cas comme la composition avec une application du type [tex]$\\lambda \\mathrm{Id}$[/tex], c\'est-à-dire les homothéties.

\r\n

Particularisons maintenant un peu la situation. On suppose [tex]$E=F$[/tex], et on s\'intéresse aux applications projectives bijectives de [tex]$PE$[/tex] dans lui-même. Ces applications forment un groupe pour la loi de composition : l\'élément neutre est l\'identité, est l\'existence de l\'inverse est assuré par l\'exigence d\'applications bijectives. Ce groupe est appelé groupe projectif linéaire, [tex]$PGL(E)$[/tex].

\r\n

Ainsi, deux applications projectives seront considérées égales (équivalentes...) si on peut passer de l\'une à l\'autre par une simple multiplication globale.

\r\n

Représentations projectives

\r\n

Rappelez-vous : on avait défini une représentation d\'un groupe [tex]$G$[/tex] comme un morphisme de [tex]$G$[/tex] dans [tex]$GL(E)$[/tex], avec [tex]$E$[/tex] un espace vectoriel a priori à déterminer (et jamais unique). Bon, je ne vais pas faire durer l\'absence de suspens plus longtemps : une représentation projective, c\'est un morphisme de [tex]$G$[/tex] dans un certain [tex]$PGL(V)$[/tex].

\r\n

Ah. Tout ça pour ça... Oui, c\'est un peu fastidieux, mais c\'est nécessaire pour comprendre vraiment et correctement la manière dont les représentations interviennent en physique (quantique). Bien sûr, vous n\'avez peut-être pas envie de le savoir, mais si déjà vous êtes arrivés jusqu\'ici, je suppose que vous êtes un tant soit peu intéressés !

\r\n

Supposons qu\'on ait une représentation (linéaire, par opposition à projective) d\'un groupe [tex]$G$[/tex]. Alors il est extrêmement facile d\'en fabriquer une représentation projective : comme on a vu, passer d\'une application [tex]$f$[/tex] à une application [tex]$[f]$[/tex] est chose aisée.

\r\n

Le contraire, en revanche, est bien plus compliqué, à savoir la question : recherchant des représentations projectives d\'un certain groupe, puis-je trouver des représentations linéaires dont elles découlent, éventuellement représentations d\'un autre groupe ? Évidemment, cette question n\'est pas gratuite, et c\'est précisément une question qui se pose en physique et qui explique la notion de spin d\'une particule.

\r\n

Initialement, je comptais répondre rapidement à cette question à la fin de ce billet, mais afin d\'épargner mes lecteurs (enfin, ceux qui ne sont pas morts en cours de route), et dont je n\'ose imaginer l\'état à ce stade, je préfère y répondre dans un autre article, le dernier avant d\'expliquer l\'origine du spin (mais je n\'ose plus rien promettre...).

','

(suite de Savez-vous calculer ?)

\r\n

Maintenant que vous avez tous bien compris ce qu\'est une représentation de groupe, je vais devoir vous traumatiser encore un peu avant de pouvoir parler des applications en physique de cette belle théorie. Il va falloir parler des représentations projectives, puisque ce sont celles-là qui sont importantes en physique. Et pour comprendre ce qu\'est une représentation projective, il faut parler des espaces projectifs (bon, pour être franc, ce n\'est pas absolument indispensable, mais c\'est quand même le cadre le plus naturel).

\r\n

Espaces projectifs

\r\n

Bien bien, pour commencer, il faut se munir de son espace vectoriel favori, peu importe lequel. Personnellement, j\'ai un petit faible pour [tex]$\\mathbf{R}^{42}$[/tex], mais chacun fait comme il veut bien sûr. Dans cet espace, on peut définir la notion de droite (et on est tellement motivé qu\'on va le faire !).

\r\n

Rappelons-nous ce qu\'est une droite, version « pour les petits ». Une manière de définir la droite est la suivante : donnons-nous deux points [tex]$A$[/tex] et [tex]$B$[/tex]. Ces deux points définissent un vecteur, le vecteur... [tex]$\\overrightarrow{AB}$[/tex]. Alors la droite [tex]$AB$[/tex] est l\'ensemble des extrémités des vecteurs partant de [tex]$A$[/tex] et colinéaires à [tex]$\\overrightarrow{AB}$[/tex]. J\'espère que je ne vous apprends rien (tout au plus que je vous rappelle une définition), et que ça vous paraît évident. Lorsqu\'on passe dans un espace vectoriel, on perd bien sûr cette notion d\'extrémités d\'un vecteur, et il ne reste plus que... les vecteurs. Bien vu Sherlock. On va du coup légèrement adapter notre définition (ou caractérisation d\'une droite), de la manière la plus naturelle qui soit : une droite d\'un espace vectoriel passant par un vecteur [tex]$\\vec u$[/tex] est l\'ensemble des vecteurs colinéaires à [tex]$\\vec u$[/tex], c\'est-à-dire l\'ensemble des éléments de la forme [tex]$\\lambda \\vec u$[/tex] où [tex]$\\lambda$[/tex] est un scalaire (un élément du corps de l\'espace vectoriel, pour ceux qui s\'en rappellent). Bien sûr, on va exclure la possibilité que [tex]$\\vec u$[/tex] soit le vecteur nul, qui présente assez peu d\'intérêt. Quant à l\'espace projectif, c\'est tout simplement l\'ensemble dont les éléments sont constitués par ces droites ! J\'insiste : un élément de l\'espace projectif, c\'est une droite, et une droite, c\'est un ensemble de vecteurs. Se donner un vecteur, c\'est se donner une notion de direction et de longueur. Si on considère une droite, c\'est un ensemble de vecteurs colinéaires : on a donc conservé la notion de direction, mais on a perdu la notion de distance. Finalement, l\'espace projectif, c\'est l\'ensemble des directions de l\'espace vectoriel initial.

\r\n

Avant de définir l\'espace d\'une manière un peu plus formelle, je mentionnerai que cet espace est assez naturel dans un certain nombre de situations. L\'une d\'entre elle concerne les arts graphiques, puisqu\'un espace projectif est une manière mathématique de traiter la notion de perspective. Après tout, la vision d\'un de notre œil consiste essentiellement à donner une information de positionnement des objets environnants ; par positionnement, j\'entends une direction dans l\'espace. L\'œil est incapable, seul, de donner une information de distance. À ma connaissance (je ne suis pas un spécialiste), deux phénomènes peuvent participer à donner une impression de distance. La première est bien sûr la vue stéréographique, c\'est à dire à partir de deux yeux : en connaissant les directions spatiales d\'un point à partir de deux positions spatiales distinctes, on est capable de reconstruire sa position en s\'intéressant à l\'intersection des deux droites, passant par chaque œil et dont l\'orientation est connue par hypothèse.  Le cinéma « en relief », quel que soit sa technologie, repose sur ce principe : fournir à chaque œil une image différente qui correspond à ce que chaque œil verrait. Le cerveau n\'y voit que du feu (surtout si c\'est un film de guerre), et nous donne cette impression de relief. Le deuxième phénomène que j\'évoquais est en fait un peu une arnaque : on est capable d\'estimer une distance (en fait, une distance relative) en évaluant son diamètre apparent. En gros, l\'idée est par exemple qu\'on connaît la taille d\'un être humain, ainsi, si on dans la rue on ferme un œil, et si on voit une personne bien plus petite qu\'une autre, on saura que la personne la plus petite est la plus lointaine. C\'est donc plus l\'habitude de la taille des objets qui permet dans ce cas de les situer les uns par rapport aux autres, et d\'un point de vue « bio-mathématique », un seul œil est insuffisant à évaluer les distances, car un œil associe un objet (qu\'on suppose ponctuel) à... un élément d\'un espace projectif (vous avez vu comme on retombe sur nos pattes ? formidable !).

\r\n

Un autre exemple reposant sur ce principe, et qui souffre peut-être encore plus de cette limitation, est l\'observation astronomique : si la Terre était fixe, il ne serait pas possible d\'estimer la distance la séparant des étoiles (du moins, par une méthode géométrique ; je ne sais pas s\'il en existe d\'autres vraiment efficaces). On utilise le fait que la Terre se déplace par rapport au Soleil pour mesurer des positions (en fait, les directions) à six mois d\'intervalle, et on a ainsi simulé une observation avec nos deux yeux ! Bien sûr, on suppose que l\'astre observé n\'a pas ou peu bougé, etc.

\r\n

Avant de continuer, j\'avais parlé d\'une autre définition des espaces projectifs, peut-être un peu plus compliqué, mais d\'une portée plus générale, en ce sens qu\'elle utilise la procédure de quotient d\'un espace, procédure absolument fondamentale et omniprésente en mathématiques (quoique souvent cachée).

\r\n

Lorsqu\'on se donne un ensemble (quelconque à ce stade), on peut construire un certain nombre de relations entre ses éléments. Parmi les relations les plus courantes, on a d\'une part les relations d\'ordre, et d\'autre part les relations d\'équivalence. Ce sont ces dernières qui vont nous intéresser, je n\'en rappellerai pas la définition. Lorsqu\'on a muni un ensemble d\'une relation d\'équivalence, on peut toujours s\'intéresser à l\'ensemble des classes d\'équivalences liées à la relation. Cet ensemble s\'appelle l\'ensemble quotient.

\r\n

Dans le cas qui nous (m\')intéresse, la relation qu\'on pose sur notre [tex]$\\mathbf{K}$[/tex]-espace vectoriel,  [tex]$\\mathbf{K}= \\mathbf{R}$[/tex] ou [tex]$\\mathbf{C}$[/tex] est

\r\n

[tex]$\\vec u \\sim \\vec v \\quad \\leftrightarrow \\quad \\exists \\lambda \\in \\mathbf{K}\\setminus \\{0\\}, \\vec u = \\lambda \\vec v$[/tex]

\r\n

et l\'espace projectif est dont le quotient, qu\'on note

\r\n

[tex]$ P\\mathbf{K}^n = (\\mathbf{R}^{n+1} \\setminus \\{0\\}) / \\sim$[/tex]

\r\n

En quotientant, on perd une dimension d\'espace (intuitivement, on perd la notion de distance), d\'où les puissances [tex]$n$[/tex] et [tex]$n+1$[/tex] dans la définition. Pour être rigoureux, ce sont les dimensions en tant que variété, mais je ne veux pas m\'embarquer là-dedans (en tout cas pas maintenant).

\r\n

On notera [tex]$[\\vec u]$[/tex] un élément de [tex]$P\\mathbf{K}^n$[/tex], qui est la classe d\'équivalence de [tex]$\\vec u$[/tex]. En outre, [tex]$\\lambda \\vec u$[/tex] est dans la même classe d\'équivalence que [tex]$\\vec u$[/tex] ; ainsi, [tex]$[\\lambda \\vec u] = [\\vec u]$[/tex].

\r\n

Une autre remarque sur laquelle je souhaite insister et la suivante : aucune condition particulière sur l\'espace vectoriel n\'a été imposée. À partir d\'un espace vectoriel quelconque, on peut toujours définir l\'espace projectif qui lui est associé.

\r\n

Il est maintenant temps de parler de ce qui se passe pour les applications.

\r\n

Applications projectives

\r\n

Soient deux espaces vectoriels [tex]$E$[/tex] et [tex]$F$[/tex] quelconques, et soit une application linéaire [tex]$f : E \\rightarrow F$[/tex]. La question que l\'on se pose et de savoir si il existe une application naturellement déduite de [tex]$f$[/tex] qui relierait les espaces projectifs associés aux espaces initiaux.

\r\n

La réponse est bien sûr oui, mais il convient de faire un tout petit peu attention. Tout d\'abord, remarquons que l\'image par [tex]$f$[/tex] d\'une droite de [tex]$E$[/tex] et qui n\'est pas contenue dans [tex]$\\mathop\\mathrm{Ker}f$[/tex] est une droite de [tex]$F$[/tex]. Cette proposition est évidente, car c\'est la définition d\'une application linéaire : [tex]$f(\\lambda \\vec u) = \\lambda f(\\vec u)$[/tex], donc pourvu que [tex]$ f(\\vec u)$[/tex] ne soit pas nul, on obtient bien une droite en prenant tous les [tex]$\\lambda$[/tex] possibles. On va montrer que [tex]$f$[/tex] induit bien (« par passage au quotient », dans le jargon) une application, notée [tex]$[f]$[/tex], de [tex]$PE\\setminus P\\mathop\\mathrm{Ker}f$[/tex] dans [tex]$PF$[/tex], les espaces projectifs. Les espaces projectifs sont, je le rappelle, constitués d\'ensembles de vecteurs. Disposant d\'une application [tex]$f$[/tex] associant un vecteur de [tex]$E$[/tex] à un vecteur de [tex]$F$[/tex], le plus naturel (pour ne pas dire la seule chose possible) consiste à définir [tex]$[f]$[/tex] de la manière suivante : je considère un élément de [tex]$PE$[/tex] ; cet élément est une classe d\'équivalence de vecteurs, donc c\'est en particulier un ensemble qui contient des vecteurs (tous équivalents). J\'en choisis un au hasard ; cet élément, c\'est bien sûr un vecteur, donc je peux lui appliquer la fonction [tex]$f$[/tex]. J\'obtiens un autre vecteur, dans [tex]$F$[/tex]. À partir de [tex]$F$[/tex], je sais définir un élément de [tex]$PF $[/tex] : il suffit que je prenne sa classe d\'équivalence ! Tout ce petit raisonnement se symbolise de la manière suivante (je rappelle que les crochets symbolisent les objets qui ont un lien avec l\'espace projectif) :

\r\n

[tex]$[f]([\\vec u]) = [f(\\vec u)]$[/tex] .

\r\n

Bien sûr, il y a quelque chose qui j\'espère vous aura perturbé dans ce que je fais : j\'ai explicitement choisi un représentant de ma classe d\'équivalence. Que se serait-il passé si j\'en avais choisi un autre ? Il est nécessaire de vérifier que ma définition est bien indépendante du représentant choisi. Cette manière de procéder est extrêmement courante dès qu\'il s\'agit de travailler avec des espaces quotients : en général, on ne sait jamais travailler directement sur ces espaces, et on calcule « explicitement » en prenant un élément des espaces non quotientés, on calcule, et on vérifie que le résultat aurait été le même en prenant un élément équivalent (au sens de la relation d\'équivalence) à celui choisi.

\r\n

Mais vous connaissez bien sûr tout cela : que je calcule avec [tex]$\\frac53$[/tex] ou [tex]$\\frac{15}{9}$[/tex], le résultat est bien sûr le même ! Les rationnels sont effectivement construits à partir des entiers relatifs, en quotientant [tex]$\\mathbf{Z}\\times \\mathbf{Z}^\\ast$[/tex] par la relation

\r\n

[tex]$(a,b) \\sim (c,d) \\quad \\Leftrightarrow \\quad a\\cdot d = b \\cdot c$[/tex]

\r\n

Et on note en général [tex]$(a,b) \\equiv \\frac{a}{b}$[/tex]...

\r\n

Bref, revenons à nos applications ; on exige que notre définition ne dépende pas du représentant choisi au sein de notre classe d\'équivalence. Puisque de manière générale, deux éléments au sein d\'une même classe s\'écrivent [tex]$\\vec u$[/tex] et [tex]$\\lambda \\vec u$[/tex], on souhaite montrer

\r\n

[tex]$[f]([\\vec u]) = [f]([\\lambda \\vec u])$[/tex] .

\r\n

La démonstration n\'est pas compliquée, il suffit d\'être soigneux dans les objets qu\'on manipule :

\r\n

[tex]$[f]([\\vec u]) = [f(\\vec u)] = [\\lambda f(\\vec u)] = [f(\\lambda \\vec u)] = [f]([\\lambda \\vec u])$[/tex] .

\r\n

La première égalité vient de notre définition de [tex]$[f]$[/tex] ; la deuxième, car on se place dans l\'espace projectif [tex]$PF$[/tex] ; la troisième, car [tex]$f$[/tex] est une application linéaire ; enfin, la dernière vient de la définition de [tex]$[f]$[/tex] appliquée à l\'élément [tex]$\\lambda \\vec u$[/tex].

\r\n

Au passage, on constate que la troisième égalité pourrait aussi s\'écrire

\r\n

[tex]$[\\lambda f(\\vec u)] = [\\lambda f]([\\vec u])$[/tex] .

\r\n

Grâce à cette petite remarque, on vient de prouver que [tex]$[f] = [\\lambda f]$[/tex], c\'est-à-dire que deux applications linéaires proportionnelles ont même image. Autrement dit, on peut aussi définir l\'espace projectif associé aux applications linéaires (eh oui ! c\'est aussi un espace vectoriel !), et tout se passe comme on le souhaite ! La relation de proportionnalité s\'interprète dans ce cas comme la composition avec une application du type [tex]$\\lambda \\mathrm{Id}$[/tex], c\'est-à-dire les homothéties.

\r\n

Particularisons maintenant un peu la situation. On suppose [tex]$E=F$[/tex], et on s\'intéresse aux applications projectives bijectives de [tex]$PE$[/tex] dans lui-même. Ces applications forment un groupe pour la loi de composition : l\'élément neutre est l\'identité, est l\'existence de l\'inverse est assuré par l\'exigence d\'applications bijectives. Ce groupe est appelé groupe projectif linéaire, [tex]$PGL(E)$[/tex].

\r\n

Ainsi, deux applications projectives seront considérées égales (équivalentes...) si on peut passer de l\'une à l\'autre par une simple multiplication globale.

\r\n

Représentations projectives

\r\n

Rappelez-vous : on avait défini une représentation d\'un groupe [tex]$G$[/tex] comme un morphisme de [tex]$G$[/tex] dans [tex]$GL(E)$[/tex], avec [tex]$E$[/tex] un espace vectoriel a priori à déterminer (et jamais unique). Bon, je ne vais pas faire durer l\'absence de suspens plus longtemps : une représentation projective, c\'est un morphisme de [tex]$G$[/tex] dans un certain [tex]$PGL(V)$[/tex].

\r\n

Ah. Tout ça pour ça... Oui, c\'est un peu fastidieux, mais c\'est nécessaire pour comprendre vraiment et correctement la manière dont les représentations interviennent en physique (quantique). Bien sûr, vous n\'avez peut-être pas envie de le savoir, mais si déjà vous êtes arrivés jusqu\'ici, je suppose que vous êtes un tant soit peu intéressés !

\r\n

Supposons qu\'on ait une représentation (linéaire, par opposition à projective) d\'un groupe [tex]$G$[/tex]. Alors il est extrêmement facile d\'en fabriquer une représentation projective : comme on a vu, passer d\'une application [tex]$f$[/tex] à une application [tex]$[f]$[/tex] est chose aisée.

\r\n

Le contraire, en revanche, est bien plus compliqué, à savoir la question : recherchant des représentations projectives d\'un certain groupe, puis-je trouver des représentations linéaires dont elles découlent, éventuellement représentations d\'un autre groupe ? Évidemment, cette question n\'est pas gratuite, et c\'est précisément une question qui se pose en physique et qui explique la notion de spin d\'une particule.

\r\n

Initialement, je comptais répondre rapidement à cette question à la fin de ce billet, mais afin d\'épargner mes lecteurs (enfin, ceux qui ne sont pas morts en cours de route), et dont je n\'ose imaginer l\'état à ce stade, je préfère y répondre dans un autre article, le dernier avant d\'expliquer l\'origine du spin (mais je n\'ose plus rien promettre...).

Pourquoi un avion vole-t-il ?

Petit lien vers un article qui rectifie une croyance fort répandue (et que je croyais également...) sur la raison pour laquelle une aile permet de faire voler un avion, ou avancer un bateau. Merci à bfpc qui l\'a trouvé !
','Petit lien vers un article qui rectifie une croyance fort répandue (et que je croyais également...) sur la raison pour laquelle une aile permet de faire voler un avion, ou avancer un bateau. Merci à bfpc qui l\'a trouvé !

Savez-vous calculer ?

Je ne me serais jamais cru aussi prolixe (j\'avais sans doute mal devin-é...), mais vu l\'enthousiasme général (d\'au moins une personne qui s\'est dite intéressée) à propos de ce sujet, je vais réveiller un vieux souvenir, pas toujours agréable, pour un certain nombre de mes lecteurs, à savoir : les représentations de groupe (on ne grimace pas !). Les prérequis seront essentiellement le programme de sup (notions sur les groupes, les espaces vectoriels, le groupe linéaire de matrices).

\r\n

« Il faut, Messieurs, agir ! » Sérébriakov dans Oncle Vania (Tchekhov)

\r\n

Prenons un groupe. Par rapport à notre pauvre condition d\'être humain (quoique je ne veuille nullement interdire ce blog aux êtres non humains, ou même aux non êtres), le groupe, lui, a un avantage considérable : il sait pour quoi il est fait et quel est son unique but dans la vie ; et ce but, c\'est d\'agir (personnellement, je soupçonne un vaste complot de la part des professeurs de mathématiques, qui semblent garder très précautionneusement ce secret... de la jalousie ? peut-être). Agir, c\'est bien beau, mais avant d\'agir, il faut d\'abord (en mathématiques) se donner un ensemble sur lequel on agit. Cet ensemble peut être le groupe lui-même, mais ce n\'est pas obligatoire, et c\'est même assez restrictif.

\r\n

Bon, maintenant que nous avons notre groupe [tex]$G$[/tex] et notre ensemble [tex]$X$[/tex], l\'action consiste à (roulements de timbales, la foule retient son souffle) associer à chaque couple [tex]$(g,x) \\in G \\times X$[/tex] un autre élément de l\'ensemble (la foule trouve qu\'on a fait beaucoup de bruit pour pas grand chose) ! Et je suis d\'accord avec la foule : car avec cette définition incomplète, on n\'a même pas utilisé le fait que [tex]$G$[/tex] soit un groupe (et lorsqu\'on est paresseux, on n\'aime pas vraiment s\'embêter à définir plein de lois compliquées sur un ensemble pour qu\'elles ne servent finalement à rien). Qu\'à cela ne tienne, on va rajouter des conditions supplémentaires : et tout naturellement, on va demander à ce que l\'action soit compatible avec la structure de groupe.

\r\n

Pour cela, prenons une image qui m\'est venue sur le trajet. Imaginons que notre ensemble soit un ensemble de poneys de toutes les couleurs possibles, et que notre groupe soit six pots de peintures : trois pour les couleurs primaires (cyan, magenta, jaune), et trois pour des anti-couleurs (anti-cyan, anti-magenta, anti-jaune). Une anti-couleur est bien sûr définie par le fait que si je mélange du cyan et de l\'anti-cyan, je trouve la couleur originale du support. Si je mélange du cyan et du jaune, j\'obtiens bien sûr du vert, etc. Mon action consiste à prendre un pot de peinture, un poney, et à badigeonner (complètement) le poney de peinture. Demander que l\'action soit compatible avec la loi de groupe revient à peu près à dire ceci : si je peins d\'abord mon poney en jaune, puis en bleu, l\'opération doit être équivalente à décider de peindre dès le départ mon poney en vert. Ou pour redevenir un peu sérieux, j\'impose la condition suivante : si j\'agis dans un premier temps sur [tex]$x$[/tex] avec [tex]$g_1$[/tex], puis dans un deuxième temps j\'agis sur [tex]$g_1\\cdot x$[/tex] (qui représente le résultat de la première opération, vous l\'aurez compris) avec [tex]$g_2$[/tex], je veux que ce soit la même chose que si j\'avais agis dès le départ avec [tex]$g_2 g_1$[/tex]. C\'est finalement une condition très naturelle quand on y pense un peu. Ah, et pour faire les choses bien, il y a encore une petite chose à demander : l\'élément neutre du groupe agit sans agir, c\'est-à-dire qu\'il laisse l\'élément invariant.

\r\n

Finalement, une action de groupe, c\'est une application [tex]$G \\times X \\rightarrow X$[/tex], [tex]$(g,x)\\mapsto g\\cdot x$[/tex] qui vérifie les deux propriétés :

\r\n
  1. [tex]$\\forall x \\in X, \\quad (e,x) \\mapsto x$[/tex] ;
  2. \r\n
  3. [tex]$\\forall x \\in X, \\forall g_1,g_2 \\in G, \\quad g_2\\cdot (g_1 \\cdot x) = (g_2 g_1) \\cdot x $[/tex].
  4. \r\n
\r\n

Donnons quelques exemples (quoique je sois très fier de mes poneys coloriés à coups de pots de peinture).

Déjà, il y a l\'action la plus inintéressante qui soit (mais qui sommes nous pour juger ?), l\'action triviale : quel que soit l\'élément [tex]$g$[/tex] que je choisis, je ne touche pas à mon élément de départ, je le renvoie inchangé : [tex]$g\\cdot x = x$[/tex].

Pour une action un peu plus intéressante, prenons l\'ensemble des sommets d\'un carré, et le groupe des rotations d\'angle 0°, 90°, 180° et 270°. Mon action est définie comme vous l\'imaginez : on prend le sommet, et on effectue une rotation de centre celui du carré, et d\'angle celui correspondant à l\'élément de mon groupe. On obtient bien un autre sommet, et je vous laisse vous convaincre que les propriétés demandées sont bien satisfaites.

De manière un peu plus générale, si on regarde l\'ensemble des rotations dans l\'espace à 3 dimensions [tex]$SO(3)$[/tex], celui-ci agit sur l\'espace [tex]$\\mathbf{R}^3$[/tex] en prenant un vecteur et en le faisant... tourner ! Mais ce même groupe agit également, de la même manière, sur la sphère unité de [tex]$\\mathbf{R}^3$[/tex] : en effet, une rotation change l\'orientation, mais conserve la norme des vecteurs. Donc en agissant sur ma sphère avec une rotation, je retomberai toujours sur un vecteur de la sphère.

\r\n

Un autre exemple que j\'oserai qualifier de concret est celui où le groupe est [tex]$GL_n(\\mathbf{R})$[/tex], et l\'ensemble est l\'ensemble des bases de l\'espace vectoriel. Il est bien connu qu\'un élément du groupe linéaire transforme une base en une autre base.

\r\n

Je vous laisse voir ici pour d\'autres exemples.

\r\n

Avant de passer aux représentations, j\'aimerais montrer une autre définition, équivalente, de la notion d\'action. Si on fixe un élément du groupe, on a donc une application de [tex]$X$[/tex] dans [tex]$X$[/tex] : je choisis un élément [tex]$x$[/tex], [tex]$g$[/tex] avait de toute manière été fixée, et je peux donc obtenir un nouvel élément [tex]$x\' = g \\cdot x = f(x)$[/tex]. Cette application possède des propriétés particulières : en fait, c\'est une permutation, c\'est-à-dire une bijection de [tex]$X$[/tex] dans lui-même. En effet, trouver l\'application réciproque est aisée : il suffit de choisir [tex]$g: x \\mapsto g^{-1}\\cdot x$[/tex], puisque

\r\n

[tex]$x \\overset{f}{\\mapsto} g\\cdot x \\overset{g}{\\mapsto} g^{-1}\\cdot(g\\cdot x) = e\\cdot x = x $[/tex]

\r\n

ce qui permet d\'affirmer que [tex]$g\\circ f = \\mathrm{Id}$[/tex], et de même, [tex]$f\\circ g = \\mathrm{Id}$[/tex]. On a donc choisit un élément du groupe, et on a vu qu\'on pouvait lui associer une permutation. Et on a même le droit à une propriété supplémentaire : l\'association élément du groupe à permutation est en fait un morphisme de groupe (eh oui, les permutations de [tex]$X$[/tex] aussi constituent un groupe ! Et d\'ailleurs, ce groupe agit naturellement sur [tex]$X$[/tex] ; saurez-vous trouver comment ?). Au final, on peut aussi définir une action de groupe comme un morphisme de [tex]$G$[/tex] vers [tex]$\\mathfrak{S}(X)$[/tex], groupe des permutations de [tex]$X$[/tex].

\r\n

Représentations de groupe

\r\n

J\'espère que vous avez à peu près assimilé la notion d\'action de groupe, car une représentation... n\'est qu\'un cas particulier d\'action ! La particularité réside dans le fait que le groupe [tex]$\\mathfrak{S}(X)$[/tex] est, par définition, le groupe linéaire d\'un espace vectoriel. Bon bon bon. On évite les perles de sueur, et on se calme. Commençons par deux exemples que j\'espère instructifs.

\r\n

Considérons le groupe des réels munis de l\'addition. Groupe d\'une banalité affligeante me direz-vous. Certes. Soient [tex]$a$[/tex] et [tex]$b$[/tex] deux tels réels. Calculer [tex]$a+b$[/tex], c\'est-à-dire la loi de groupe, ne pose pas de grands soucis. Je propose maintenant une égalité :

\r\n

[tex]\\catcode`\\?=4 $\\begin{pmatrix} 1 ? a \\\\ 0 ? 1 \\end{pmatrix}\\times \\begin{pmatrix} 1 ? b \\\\ 0 ? 1 \\end{pmatrix} = \\begin{pmatrix} 1 ? a+b \\\\ 0 ? 1 \\end{pmatrix}$[/tex]

\r\n

Deux choses sont à noter : les matrices dont il est question sont inversibles ; d\'autre part, la multiplication des matrices exprime la loi du groupe additif des réels.

\r\n

Prenons un autre exemple, le groupe des permutations d\'un ensemble à trois éléments. Ce groupe a six éléments : [tex]$\\mathrm{Id}$[/tex], [tex]$(1 \\,2)$[/tex], [tex]$(2\\, 3)$[/tex], [tex]$(1\\, 3)$[/tex], [tex]$(1\\, 2\\, 3)$[/tex] et enfin [tex]$(1\\, 3\\, 2)$[/tex]. On sait explicitement calculer les lois de groupes. Par exemple, [tex]$(1\\,2\\,3)\\circ(2\\,3) = (1\\,2)$[/tex] puisque [tex]$1$[/tex] est envoyé sur [tex]$2$[/tex] par la deuxième permutation, [tex]$2$[/tex] est envoyé sur [tex]$3$[/tex], puis sur [tex]$1$[/tex], et enfin [tex]$3$[/tex] est envoyé sur [tex]$2$[/tex], puis sur [tex]$3$[/tex]. Malheureusement, cette manière de faire n\'est pas très pratique, en particulier si on cherche à automatiser les calculs, par ordinateur par exemple. Comme finalement, la seule chose qu\'on sache bien calculer, ce sont les additions et les multiplications, on va chercher à écrire les éléments précédents sous forme matricielle. On réalise les associations suivantes :

\r\n

[tex]\\catcode`\\?=4 \\begin{minipage}{400pt}\\begin{align*}\\mathrm{Id}?\\mapsto\\begin{pmatrix} 1 ? 0 \\\\ 0 ? 1 \\end{pmatrix} ? (1\\,2\\,3)?\\mapsto\\begin{pmatrix} j ? 0 \\\\ 0 ? j^2 \\end{pmatrix} ? (1\\,3\\,2)?\\mapsto\\begin{pmatrix} j^2 ? 0 \\\\ 0 ? j \\end{pmatrix}\\\\ (1 \\,2)?\\mapsto \\begin{pmatrix} 0 ? 1 \\\\ 1 ? 0 \\end{pmatrix} ? (1 \\,3)?\\mapsto\\begin{pmatrix} 0 ? j \\\\ j^2 ? 0 \\end{pmatrix} ? (2 \\,3)?\\mapsto\\begin{pmatrix} 0 ? j^2 \\\\ j ? 0 \\end{pmatrix} \\end{align*}\\end{minipage}[/tex]

\r\n

où [tex]$j = \\exp \\frac{2 i \\pi}{3}$[/tex]. Avec un peu de calcul, on se convainc facilement qu\'à nouveau, la multiplication des matrices respecte la loi du groupe initial. En outre, les matrices considérées sont inversibles (ce qui est d\'ailleurs une conséquence logique du fait que la loi de groupe soit respectée !).

\r\n

Ces deux exemples constituent des représentations, respectivement du groupe [tex]$(\\mathbf{R},+)$[/tex] et du groupe [tex]$\\mathfrak{S}_3$[/tex], car à chaque élément, on a associé une matrice inversible, c\'est-à-dire un élément d\'un certain groupe linéaire. La voilà, la grande et géniale idée de la théorie des représentations : en général, faire des calculs à partir d\'un groupe est assez délicat à mener ; dans les deux exemples exposés, c\'est encore possible (surtout pour le premier), mais ce n\'est en général pas trop le cas. En revanche, il existe des groupes que l\'on connaît très bien, ce sont les groupes linéaires d\'espaces vectoriels, qui s\'identifient aux matrices inversibles. Et calculer des matrices, c\'est facile. Ainsi, représenter un groupe, c\'est trouver un morphisme vers un certain [tex]$GL_n(\\mathbf{R},\\mathbf{C})$[/tex]. Grâce à la remarque à la fin de la section précédente, on peut aussi dire que c\'est le faire agir sur un espace vectoriel, qualifié pour l\'occasion d\'espace de la représentation.

\r\n

Bien sûr, trouver une représentation, et a fortiori, les trouver toutes, ça demande du travail, et c\'est en général loin d\'être évident. Il n\'en reste pas moins qu\'on a plus de prises sur un groupe si on connaît ses représentations. En outre, la physique (quantique et au-delà) est très friande de représentations, pour des raisons que j\'évoquerais probablement dans un autre article. En gros, un état quantique est symbolisé par un élément d\'un espace de Hilbert ; les symétries de l\'espace-temps sont conceptualisées par des groupes. Pour pouvoir appliquer ces symétries, il faut donc passer par des représentations. Un scalaire est un élément se transformant par une certaine représentation du groupe des rotations ; un spineur (d\'où la notion de spin d\'une particule) indique qu\'on utilise une autre représentation du même groupe, etc.

\r\n

J\'aimerais terminer sur une propriété assez simple des représentations, à savoir la notion d\'irréductibilité. Prenons un exemple tout simple : le groupe [tex]$(\\mathbf{R},\\times)$[/tex]. Évidemment, ce groupe constitue lui-même un groupe linéaire, puisque c\'est une matrice carrée de côté 1. Mais si on regarde

\r\n

[tex]\\catcode`\\?=4 $\\begin{pmatrix} a ? 0 \\\\ 0 ? a \\end{pmatrix} $[/tex]

\r\n

c\'est une manière certes étrange, mais correcte, de représenter ce même groupe : la matrice est diagonale par bloc, donc la loi de groupe est respectée (simultanément sur les deux blocs). Une telle représentation est qualifiée de réductible, car on n\'a rien fait de plus qu\'accoler deux représentations que l\'on connaissait déjà ; cette représentation n\'apporte donc rien de nouveau, il est possible de la décortiquer. On s\'intéresse donc aux représentations qui ne jouissent pas de cette propriété, et qu\'on qualifie d\'irréductibles (oui, comme les gaulois).

','

Je ne me serais jamais cru aussi prolixe (j\'avais sans doute mal devin-é...), mais vu l\'enthousiasme général (d\'au moins une personne qui s\'est dite intéressée) à propos de ce sujet, je vais réveiller un vieux souvenir, pas toujours agréable, pour un certain nombre de mes lecteurs, à savoir : les représentations de groupe (on ne grimace pas !). Les prérequis seront essentiellement le programme de sup (notions sur les groupes, les espaces vectoriels, le groupe linéaire de matrices).

\r\n

« Il faut, Messieurs, agir ! » Sérébriakov dans Oncle Vania (Tchekhov)

\r\n

Prenons un groupe. Par rapport à notre pauvre condition d\'être humain (quoique je ne veuille nullement interdire ce blog aux êtres non humains, ou même aux non êtres), le groupe, lui, a un avantage considérable : il sait pour quoi il est fait et quel est son unique but dans la vie ; et ce but, c\'est d\'agir (personnellement, je soupçonne un vaste complot de la part des professeurs de mathématiques, qui semblent garder très précautionneusement ce secret... de la jalousie ? peut-être). Agir, c\'est bien beau, mais avant d\'agir, il faut d\'abord (en mathématiques) se donner un ensemble sur lequel on agit. Cet ensemble peut être le groupe lui-même, mais ce n\'est pas obligatoire, et c\'est même assez restrictif.

\r\n

Bon, maintenant que nous avons notre groupe [tex]$G$[/tex] et notre ensemble [tex]$X$[/tex], l\'action consiste à (roulements de timbales, la foule retient son souffle) associer à chaque couple [tex]$(g,x) \\in G \\times X$[/tex] un autre élément de l\'ensemble (la foule trouve qu\'on a fait beaucoup de bruit pour pas grand chose) ! Et je suis d\'accord avec la foule : car avec cette définition incomplète, on n\'a même pas utilisé le fait que [tex]$G$[/tex] soit un groupe (et lorsqu\'on est paresseux, on n\'aime pas vraiment s\'embêter à définir plein de lois compliquées sur un ensemble pour qu\'elles ne servent finalement à rien). Qu\'à cela ne tienne, on va rajouter des conditions supplémentaires : et tout naturellement, on va demander à ce que l\'action soit compatible avec la structure de groupe.

\r\n

Pour cela, prenons une image qui m\'est venue sur le trajet. Imaginons que notre ensemble soit un ensemble de poneys de toutes les couleurs possibles, et que notre groupe soit six pots de peintures : trois pour les couleurs primaires (cyan, magenta, jaune), et trois pour des anti-couleurs (anti-cyan, anti-magenta, anti-jaune). Une anti-couleur est bien sûr définie par le fait que si je mélange du cyan et de l\'anti-cyan, je trouve la couleur originale du support. Si je mélange du cyan et du jaune, j\'obtiens bien sûr du vert, etc. Mon action consiste à prendre un pot de peinture, un poney, et à badigeonner (complètement) le poney de peinture. Demander que l\'action soit compatible avec la loi de groupe revient à peu près à dire ceci : si je peins d\'abord mon poney en jaune, puis en bleu, l\'opération doit être équivalente à décider de peindre dès le départ mon poney en vert. Ou pour redevenir un peu sérieux, j\'impose la condition suivante : si j\'agis dans un premier temps sur [tex]$x$[/tex] avec [tex]$g_1$[/tex], puis dans un deuxième temps j\'agis sur [tex]$g_1\\cdot x$[/tex] (qui représente le résultat de la première opération, vous l\'aurez compris) avec [tex]$g_2$[/tex], je veux que ce soit la même chose que si j\'avais agis dès le départ avec [tex]$g_2 g_1$[/tex]. C\'est finalement une condition très naturelle quand on y pense un peu. Ah, et pour faire les choses bien, il y a encore une petite chose à demander : l\'élément neutre du groupe agit sans agir, c\'est-à-dire qu\'il laisse l\'élément invariant.

\r\n

Finalement, une action de groupe, c\'est une application [tex]$G \\times X \\rightarrow X$[/tex], [tex]$(g,x)\\mapsto g\\cdot x$[/tex] qui vérifie les deux propriétés :

\r\n
  1. [tex]$\\forall x \\in X, \\quad (e,x) \\mapsto x$[/tex] ;
  2. \r\n
  3. [tex]$\\forall x \\in X, \\forall g_1,g_2 \\in G, \\quad g_2\\cdot (g_1 \\cdot x) = (g_2 g_1) \\cdot x $[/tex].
  4. \r\n
\r\n

Donnons quelques exemples (quoique je sois très fier de mes poneys coloriés à coups de pots de peinture).

Déjà, il y a l\'action la plus inintéressante qui soit (mais qui sommes nous pour juger ?), l\'action triviale : quel que soit l\'élément [tex]$g$[/tex] que je choisis, je ne touche pas à mon élément de départ, je le renvoie inchangé : [tex]$g\\cdot x = x$[/tex].

Pour une action un peu plus intéressante, prenons l\'ensemble des sommets d\'un carré, et le groupe des rotations d\'angle 0°, 90°, 180° et 270°. Mon action est définie comme vous l\'imaginez : on prend le sommet, et on effectue une rotation de centre celui du carré, et d\'angle celui correspondant à l\'élément de mon groupe. On obtient bien un autre sommet, et je vous laisse vous convaincre que les propriétés demandées sont bien satisfaites.

De manière un peu plus générale, si on regarde l\'ensemble des rotations dans l\'espace à 3 dimensions [tex]$SO(3)$[/tex], celui-ci agit sur l\'espace [tex]$\\mathbf{R}^3$[/tex] en prenant un vecteur et en le faisant... tourner ! Mais ce même groupe agit également, de la même manière, sur la sphère unité de [tex]$\\mathbf{R}^3$[/tex] : en effet, une rotation change l\'orientation, mais conserve la norme des vecteurs. Donc en agissant sur ma sphère avec une rotation, je retomberai toujours sur un vecteur de la sphère.

\r\n

Un autre exemple que j\'oserai qualifier de concret est celui où le groupe est [tex]$GL_n(\\mathbf{R})$[/tex], et l\'ensemble est l\'ensemble des bases de l\'espace vectoriel. Il est bien connu qu\'un élément du groupe linéaire transforme une base en une autre base.

\r\n

Je vous laisse voir ici pour d\'autres exemples.

\r\n

Avant de passer aux représentations, j\'aimerais montrer une autre définition, équivalente, de la notion d\'action. Si on fixe un élément du groupe, on a donc une application de [tex]$X$[/tex] dans [tex]$X$[/tex] : je choisis un élément [tex]$x$[/tex], [tex]$g$[/tex] avait de toute manière été fixée, et je peux donc obtenir un nouvel élément [tex]$x\' = g \\cdot x = f(x)$[/tex]. Cette application possède des propriétés particulières : en fait, c\'est une permutation, c\'est-à-dire une bijection de [tex]$X$[/tex] dans lui-même. En effet, trouver l\'application réciproque est aisée : il suffit de choisir [tex]$g: x \\mapsto g^{-1}\\cdot x$[/tex], puisque

\r\n

[tex]$x \\overset{f}{\\mapsto} g\\cdot x \\overset{g}{\\mapsto} g^{-1}\\cdot(g\\cdot x) = e\\cdot x = x $[/tex]

\r\n

ce qui permet d\'affirmer que [tex]$g\\circ f = \\mathrm{Id}$[/tex], et de même, [tex]$f\\circ g = \\mathrm{Id}$[/tex]. On a donc choisit un élément du groupe, et on a vu qu\'on pouvait lui associer une permutation. Et on a même le droit à une propriété supplémentaire : l\'association élément du groupe à permutation est en fait un morphisme de groupe (eh oui, les permutations de [tex]$X$[/tex] aussi constituent un groupe ! Et d\'ailleurs, ce groupe agit naturellement sur [tex]$X$[/tex] ; saurez-vous trouver comment ?). Au final, on peut aussi définir une action de groupe comme un morphisme de [tex]$G$[/tex] vers [tex]$\\mathfrak{S}(X)$[/tex], groupe des permutations de [tex]$X$[/tex].

\r\n

Représentations de groupe

\r\n

J\'espère que vous avez à peu près assimilé la notion d\'action de groupe, car une représentation... n\'est qu\'un cas particulier d\'action ! La particularité réside dans le fait que le groupe [tex]$\\mathfrak{S}(X)$[/tex] est, par définition, le groupe linéaire d\'un espace vectoriel. Bon bon bon. On évite les perles de sueur, et on se calme. Commençons par deux exemples que j\'espère instructifs.

\r\n

Considérons le groupe des réels munis de l\'addition. Groupe d\'une banalité affligeante me direz-vous. Certes. Soient [tex]$a$[/tex] et [tex]$b$[/tex] deux tels réels. Calculer [tex]$a+b$[/tex], c\'est-à-dire la loi de groupe, ne pose pas de grands soucis. Je propose maintenant une égalité :

\r\n

[tex]\\catcode`\\?=4 $\\begin{pmatrix} 1 ? a \\\\ 0 ? 1 \\end{pmatrix}\\times \\begin{pmatrix} 1 ? b \\\\ 0 ? 1 \\end{pmatrix} = \\begin{pmatrix} 1 ? a+b \\\\ 0 ? 1 \\end{pmatrix}$[/tex]

\r\n

Deux choses sont à noter : les matrices dont il est question sont inversibles ; d\'autre part, la multiplication des matrices exprime la loi du groupe additif des réels.

\r\n

Prenons un autre exemple, le groupe des permutations d\'un ensemble à trois éléments. Ce groupe a six éléments : [tex]$\\mathrm{Id}$[/tex], [tex]$(1 \\,2)$[/tex], [tex]$(2\\, 3)$[/tex], [tex]$(1\\, 3)$[/tex], [tex]$(1\\, 2\\, 3)$[/tex] et enfin [tex]$(1\\, 3\\, 2)$[/tex]. On sait explicitement calculer les lois de groupes. Par exemple, [tex]$(1\\,2\\,3)\\circ(2\\,3) = (1\\,2)$[/tex] puisque [tex]$1$[/tex] est envoyé sur [tex]$2$[/tex] par la deuxième permutation, [tex]$2$[/tex] est envoyé sur [tex]$3$[/tex], puis sur [tex]$1$[/tex], et enfin [tex]$3$[/tex] est envoyé sur [tex]$2$[/tex], puis sur [tex]$3$[/tex]. Malheureusement, cette manière de faire n\'est pas très pratique, en particulier si on cherche à automatiser les calculs, par ordinateur par exemple. Comme finalement, la seule chose qu\'on sache bien calculer, ce sont les additions et les multiplications, on va chercher à écrire les éléments précédents sous forme matricielle. On réalise les associations suivantes :

\r\n

[tex]\\catcode`\\?=4 \\begin{minipage}{400pt}\\begin{align*}\\mathrm{Id}?\\mapsto\\begin{pmatrix} 1 ? 0 \\\\ 0 ? 1 \\end{pmatrix} ? (1\\,2\\,3)?\\mapsto\\begin{pmatrix} j ? 0 \\\\ 0 ? j^2 \\end{pmatrix} ? (1\\,3\\,2)?\\mapsto\\begin{pmatrix} j^2 ? 0 \\\\ 0 ? j \\end{pmatrix}\\\\ (1 \\,2)?\\mapsto \\begin{pmatrix} 0 ? 1 \\\\ 1 ? 0 \\end{pmatrix} ? (1 \\,3)?\\mapsto\\begin{pmatrix} 0 ? j \\\\ j^2 ? 0 \\end{pmatrix} ? (2 \\,3)?\\mapsto\\begin{pmatrix} 0 ? j^2 \\\\ j ? 0 \\end{pmatrix} \\end{align*}\\end{minipage}[/tex]

\r\n

où [tex]$j = \\exp \\frac{2 i \\pi}{3}$[/tex]. Avec un peu de calcul, on se convainc facilement qu\'à nouveau, la multiplication des matrices respecte la loi du groupe initial. En outre, les matrices considérées sont inversibles (ce qui est d\'ailleurs une conséquence logique du fait que la loi de groupe soit respectée !).

\r\n

Ces deux exemples constituent des représentations, respectivement du groupe [tex]$(\\mathbf{R},+)$[/tex] et du groupe [tex]$\\mathfrak{S}_3$[/tex], car à chaque élément, on a associé une matrice inversible, c\'est-à-dire un élément d\'un certain groupe linéaire. La voilà, la grande et géniale idée de la théorie des représentations : en général, faire des calculs à partir d\'un groupe est assez délicat à mener ; dans les deux exemples exposés, c\'est encore possible (surtout pour le premier), mais ce n\'est en général pas trop le cas. En revanche, il existe des groupes que l\'on connaît très bien, ce sont les groupes linéaires d\'espaces vectoriels, qui s\'identifient aux matrices inversibles. Et calculer des matrices, c\'est facile. Ainsi, représenter un groupe, c\'est trouver un morphisme vers un certain [tex]$GL_n(\\mathbf{R},\\mathbf{C})$[/tex]. Grâce à la remarque à la fin de la section précédente, on peut aussi dire que c\'est le faire agir sur un espace vectoriel, qualifié pour l\'occasion d\'espace de la représentation.

\r\n

Bien sûr, trouver une représentation, et a fortiori, les trouver toutes, ça demande du travail, et c\'est en général loin d\'être évident. Il n\'en reste pas moins qu\'on a plus de prises sur un groupe si on connaît ses représentations. En outre, la physique (quantique et au-delà) est très friande de représentations, pour des raisons que j\'évoquerais probablement dans un autre article. En gros, un état quantique est symbolisé par un élément d\'un espace de Hilbert ; les symétries de l\'espace-temps sont conceptualisées par des groupes. Pour pouvoir appliquer ces symétries, il faut donc passer par des représentations. Un scalaire est un élément se transformant par une certaine représentation du groupe des rotations ; un spineur (d\'où la notion de spin d\'une particule) indique qu\'on utilise une autre représentation du même groupe, etc.

\r\n

J\'aimerais terminer sur une propriété assez simple des représentations, à savoir la notion d\'irréductibilité. Prenons un exemple tout simple : le groupe [tex]$(\\mathbf{R},\\times)$[/tex]. Évidemment, ce groupe constitue lui-même un groupe linéaire, puisque c\'est une matrice carrée de côté 1. Mais si on regarde

\r\n

[tex]\\catcode`\\?=4 $\\begin{pmatrix} a ? 0 \\\\ 0 ? a \\end{pmatrix} $[/tex]

\r\n

c\'est une manière certes étrange, mais correcte, de représenter ce même groupe : la matrice est diagonale par bloc, donc la loi de groupe est respectée (simultanément sur les deux blocs). Une telle représentation est qualifiée de réductible, car on n\'a rien fait de plus qu\'accoler deux représentations que l\'on connaissait déjà ; cette représentation n\'apporte donc rien de nouveau, il est possible de la décortiquer. On s\'intéresse donc aux représentations qui ne jouissent pas de cette propriété, et qu\'on qualifie d\'irréductibles (oui, comme les gaulois).

Allemands, Français, exclusion, et autres dérangements

À la fin de mon dernier article, je vous avais promis un petit billet sur le nombre de dérangements d\'une permutation. Avant cela, il va être nécessaire de rappeler (ou de découvrir) une formule connue sous divers noms comme principe d\'inclusion-exclusion, formule de Poincaré, formule du crible, ...

Une formule étant souvent plus intuitive avec une mise en situation, je vous propose de raisonner sur deux ensembles... de population, les Français, les Allemands, et les personnes ayant la double nationalité, les Franco-allemands (qui sont considérées à la fois comme Allemands et comme Français). On cherche à établir une relation entre les nombres de personnes concernées par chacune de ces étiquettes.

Au total, le nombre de personnes physiques peut être décompté comme suit : on compte d\'abord la population française, on appelle ce nombre [tex]$F$[/tex]. Le piège consiste à rajouter directement la population allemande [tex]$A$[/tex]. En effet, il ne faut pas oublier que les Franco-allemands ont déjà été comptés (puisqu\'ils font partie de la population Française !). Pour obtenir la population totale des deux pays sans double compte, il faut ajouter la population Française et la population Allemande sans les Franco-allemands ! En notation ensembliste, si on note [tex]$A$[/tex] et [tex]$F$[/tex] les ensembles des Allemands et des Français, alors les Franco-allemands représentent ce qu\'on appelle l\'intersection des deux ensembles, qu\'on note [tex]$A \\cap F$[/tex], et la totalité de la population des deux pays — on s\'intéresse aux personnes physiques, donc une personne Franco-allemande est comptée une seule fois : il n\'est pas question de la compter une fois en tant que Française, et une fois en tant qu\'Allemande — est symbolisée par [tex]$A \\cup F$[/tex] (moyen mnémotechnique : le symbole est U comme Union). Petite subtilité, on va noter [tex]$|A|$[/tex] et [tex]$|F|$[/tex] le nombre de personnes (alors que les notations précédentes symbolisaient juste le regroupement des personnes physiques). Le petit raisonnement précédent conduit donc à la formule

[tex]$|A \\cup F| = |A| + |F| - |A \\cap F|$[/tex] .

En pratique, s\'il y a 62 616 488 Français (nombre exact), 81 879 976 Allemands (nombre exact), et 42 666 Franco-allemands (nombre inexact), il y a en tout 62 616 488 + 81 879 976 - 42 666 = 144 453 798 personnes physiques différentes.

On va maintenant compliquer la situation en rajoutant les Belges [tex]$B$[/tex] dans l\'histoire, et on va supposer que les législations internationales ont suffisamment évolué pour permettre la triple nationalité. Dans ce cas, l\'ensemble des Allemands et des Belges constitue un ensemble, qu\'on note [tex]$A \\cup B$[/tex] comme on a vu précédemment. La formule précédente est toujours valable, et revient à substituer [tex]$A$[/tex] par [tex]$A \\cup B$[/tex] :

[tex]$|\\underbrace{(A \\cup B) \\cup F}_1| = |\\underbrace{A \\cup B}_2| + |\\underbrace{F}_3| - |\\underbrace{(A \\cup B) \\cap F}_4|$[/tex] .

Le premier terme s\'interprète de la manière suivante : on réunit les personnes Allemandes et Belges, et dit aux Français de les rejoindre. C\'est évidemment la même chose que si on avait réuni d\'abord les Allemands et les Français, puis les Belges. On peut donc supprimer les parenthèses. Le deuxième terme, [tex]$A \\cup B$[/tex], est exactement le même que celui de la formule initiale ! On le replacera après. Le troisième terme est la population Française, et le dernier terme représente les personnes Allemandes ou Belges qui sont aussi Françaises. Ces personnes sont exactement les mêmes que celles qui sont Franco-allemandes ([tex]$A \\cap F$[/tex]) ou bien Franco-belges ([tex]$B \\cap F$[/tex]) ; cette catégorie est représentée par [tex]$(A \\cap F) \\cup (B\\cap F)$[/tex]. Et c\'est là que le miracle se produit : on se retrouve avec un terme qui peut-être traitée avec la formule initiale !

Récapitulons donc :

[tex]$|A \\cup B \\cup F| = |A \\cup B| + |F| - |(A \\cap F) \\cup (B \\cap F)|$[/tex]

avec en plus

[tex]$|A \\cup B| = |A| + |B| - |A \\cap B|$[/tex] ,

[tex]$|A \\cup F| = |A| + |F| - |A \\cap F|$[/tex] ,

[tex]$|B \\cup F| = |F| + |B| - |B \\cap F|$[/tex] .

En utilisant ces formules, on écrit

[tex]$|(A \\cap F) \\cup (B \\cap F)| = |A \\cap F| + |B \\cap F| - |(A \\cap F) \\cap (B \\cap F)| $[/tex] .

\r\n

Dans le dernier terme, on va supprimer l\'un des [tex]$ \\cap F $[/tex] : il suffit de demander une fois que la personne soit Française, ce n\'est pas la peine de demander qu\'elle soit Française et qu\'elle soit Française. Au final, une fois faites toutes les simplifications possibles, on aboutit à

\r\n

[tex]\\catcode`\\?=4\\begin{minipage}{540px}\\begin{align*}| A \\cup B \\cup F| =?\\phantom{+} |A| + |B| + |F| \\\\ ?- |A\\cap B| - |B \\cap F| - |F \\cap A| \\\\? + |A \\cap B \\cap F| \\end{align*}\\end{minipage}[/tex].

\r\n

On pourrait évidemment recommencer ce petit raisonnement pour tous les pays d\'Europe. Il y a deux choses importantes à noter pour, à terme, généraliser la formule :\r\n

\r\n
  • le résultat se présente sous la forme d\'une somme d\'intersections sur l\'ensemble des choix possibles de un, deux, ... et enfin tous les termes ;
  • \r\n
  • dans cette somme, on alterne le signe à chaque fois qu\'on rajoute une intersection.
  • \r\n
\r\n

On admet donc la forme du résultat général pour les ensembles [tex]$A_i$[/tex]:

\r\n

[tex]\\catcode`\\?=4\\begin{minipage}{540px}\\begin{align*} \\left | \\displaystyle \\bigcup_{i=1}^n A_i \\right | =? \\sum_{i=1}^n |A_i| - \\sum_{1 \\leq i < j \\leq n } |A_i \\cap A_j | + \\sum_{1 \\leq i < j <k \\leq n } |A_i \\cap A_j \\cap A_k | \\\\ ? + \\cdots + (-1)^{n+1} | A_1 \\cap \\ldots \\cap A_n| \\end{align*}\\end{minipage}[/tex] ;

\r\n

ce résultat, qui est la fameuse formule d\'inclusion-exclusion, s\'écrit aussi

\r\n

[tex]$\\left | \\displaystyle \\bigcup_{i=1}^n A_i \\right | = \\displaystyle \\sum_{k=1}^n (-1)^{k-1} \\displaystyle \\sum_{1 \\leq i_1 < i_2 < \\ldots < i_k \\leq n} |A_{i_1} \\cap A_{i_2} \\cap \\ldots \\cap A_{i_k}| $[/tex]

\r\n

Revenons maintenant à nos permutations sur un ensemble de [tex]$n$[/tex] éléments. On note [tex]$A_k$[/tex] l\'ensemble des permutations laissant l\'élément [tex]$k$[/tex] fixe. Il est facile de calculer

\r\n

[tex]$| A_k | = (n-1)!$[/tex] .

\r\n

puisqu\'il ne reste un arbitraire de permutation que sur les [tex]$n-1$[/tex] éléments restants. Les permutations qui fixent à la fois [tex]$k$[/tex] et [tex]$l$[/tex] est l\'ensemble intersection de celles qui fixent [tex]$k$[/tex] et de celles qui fixent [tex]$l$[/tex] ; on n\'a plus que [tex]$n-2$[/tex] éléments à permuter, et donc

\r\n

[tex]$ \\left| A_k \\cap A_l \\right | = (n-2)!$[/tex] ,

\r\n

et donc plus généralement,

\r\n

[tex]$ \\left| \\bigcap_{i=1}^k A_i \\right | = (n-k)!$[/tex] .

\r\n

On connaît donc les nombres d\'éléments de toutes intersections des ensembles [tex]$A_k$[/tex]. On peut donc appliquer la formule d\'inclusion-exclusion qu\'on vient d\'établir ! L\'ensemble

\r\n

[tex]$ \\left | \\displaystyle \\bigcup_{i=1}^n A_i \\right | $[/tex]

\r\n

représente la réunion des permutations fixant [tex]$i=1$[/tex], [tex]$i=2$[/tex], ..., [tex]$i=n$[/tex]. C\'est donc l\'ensemble des permutations laissant au moins un point fixe ! Lorsqu\'on applique la formule d\'inclusion-exclusion, il ne faut pas oublier que ce n\'est pas juste

\r\n

[tex]$\\left | \\displaystyle \\bigcap_{i=1}^k A_i \\right | = (n-k)!$[/tex] .

\r\n

qu\'il faut sommer : en effet, on a encore [tex]$k$[/tex] parmi [tex]$n$[/tex] manière de choisir quels points on va laisser fixes. Ainsi, chacun des termes à interpréter comme le nombre de permutations laissant exactement [tex]$k$[/tex] points fixes vaut

\r\n

[tex]$ \\displaystyle \\frac{n!}{k! (n-k)!} \\times (n-k)! = \\displaystyle \\frac{n!}{k!}$[/tex]

\r\n

et donc le nombre de permutations laissant au moins un point fixe est, grâce à la formule,

\r\n

[tex]$ \\left | \\displaystyle \\bigcup_{i=1}^n A_i \\right | = n! \\times \\displaystyle\\sum_{i=1}^n \\displaystyle\\frac{{(-1)}^{k-1}}{k!} = n! \\left ( 1- \\displaystyle\\sum_{i=0}^n \\displaystyle\\frac{{(-1)}^{k}}{k!}\\right ) $[/tex]

\r\n

Et on conclut que la probabilité qu\'une permutation choisie au hasard contienne au moins un point fixe est

\r\n

[tex]$ 1- \\displaystyle\\sum_{i=0}^n \\displaystyle\\frac{{(-1)}^{k}}{k!}$[/tex]

\r\n

Lorsque le nombre d\'éléments devient très important, on reconnaît dans cette expression le développement en série de [tex]$e^{-1}$[/tex], et on a donc une probabilité proche de

\r\n

[tex]$ 1 - e^{-1} \\simeq 0{,}63 $[/tex]

\r\n

qu\'une permutation prise au hasard contienne au moins un point fixe. Donc il y a presque deux chances sur trois qu\'il y ait un étudiant chanceux !

','

À la fin de mon dernier article, je vous avais promis un petit billet sur le nombre de dérangements d\'une permutation. Avant cela, il va être nécessaire de rappeler (ou de découvrir) une formule connue sous divers noms comme principe d\'inclusion-exclusion, formule de Poincaré, formule du crible, ...

\r\n

Une formule étant souvent plus intuitive avec une mise en situation, je vous propose de raisonner sur deux ensembles... de population, les Français, les Allemands, et les personnes ayant la double nationalité, les Franco-allemands (qui sont considérées à la fois comme Allemands et comme Français). On cherche à établir une relation entre les nombres de personnes concernées par chacune de ces étiquettes.

\r\n

Au total, le nombre de personnes physiques peut être décompté comme suit : on compte d\'abord la population française, on appelle ce nombre [tex]$F$[/tex]. Le piège consiste à rajouter directement la population allemande [tex]$A$[/tex]. En effet, il ne faut pas oublier que les Franco-allemands ont déjà été comptés (puisqu\'ils font partie de la population Française !). Pour obtenir la population totale des deux pays sans double compte, il faut ajouter la population Française et la population Allemande sans les Franco-allemands ! En notation ensembliste, si on note [tex]$A$[/tex] et [tex]$F$[/tex] les ensembles des Allemands et des Français, alors les Franco-allemands représentent ce qu\'on appelle l\'intersection des deux ensembles, qu\'on note [tex]$A \\cap F$[/tex], et la totalité de la population des deux pays — on s\'intéresse aux personnes physiques, donc une personne Franco-allemande est comptée une seule fois : il n\'est pas question de la compter une fois en tant que Française, et une fois en tant qu\'Allemande — est symbolisée par [tex]$A \\cup F$[/tex] (moyen mnémotechnique : le symbole est U comme Union). Petite subtilité, on va noter [tex]$|A|$[/tex] et [tex]$|F|$[/tex] le nombre de personnes (alors que les notations précédentes symbolisaient juste le regroupement des personnes physiques). Le petit raisonnement précédent conduit donc à la formule

\r\n

[tex]$|A \\cup F| = |A| + |F| - |A \\cap F|$[/tex] .

\r\n

En pratique, s\'il y a 62 616 488 Français (nombre exact), 81 879 976 Allemands (nombre exact), et 42 666 Franco-allemands (nombre inexact), il y a en tout 62 616 488 + 81 879 976 - 42 666 = 144 453 798 personnes physiques différentes.

\r\n

On va maintenant compliquer la situation en rajoutant les Belges [tex]$B$[/tex] dans l\'histoire, et on va supposer que les législations internationales ont suffisamment évolué pour permettre la triple nationalité. Dans ce cas, l\'ensemble des Allemands et des Belges constitue un ensemble, qu\'on note [tex]$A \\cup B$[/tex] comme on a vu précédemment. La formule précédente est toujours valable, et revient à substituer [tex]$A$[/tex] par [tex]$A \\cup B$[/tex] :

\r\n

[tex]$|\\underbrace{(A \\cup B) \\cup F}_1| = |\\underbrace{A \\cup B}_2| + |\\underbrace{F}_3| - |\\underbrace{(A \\cup B) \\cap F}_4|$[/tex] .

\r\n

Le premier terme s\'interprète de la manière suivante : on réunit les personnes Allemandes et Belges, et dit aux Français de les rejoindre. C\'est évidemment la même chose que si on avait réuni d\'abord les Allemands et les Français, puis les Belges. On peut donc supprimer les parenthèses. Le deuxième terme, [tex]$A \\cup B$[/tex], est exactement le même que celui de la formule initiale ! On le replacera après. Le troisième terme est la population Française, et le dernier terme représente les personnes Allemandes ou Belges qui sont aussi Françaises. Ces personnes sont exactement les mêmes que celles qui sont Franco-allemandes ([tex]$A \\cap F$[/tex]) ou bien Franco-belges ([tex]$B \\cap F$[/tex]) ; cette catégorie est représentée par [tex]$(A \\cap F) \\cup (B\\cap F)$[/tex]. Et c\'est là que le miracle se produit : on se retrouve avec un terme qui peut-être traitée avec la formule initiale !

\r\n

Récapitulons donc :

\r\n

[tex]$|A \\cup B \\cup F| = |A \\cup B| + |F| - |(A \\cap F) \\cup (B \\cap F)|$[/tex]

\r\n

avec en plus

\r\n

[tex]$|A \\cup B| = |A| + |B| - |A \\cap B|$[/tex] ,

\r\n

[tex]$|A \\cup F| = |A| + |F| - |A \\cap F|$[/tex] ,

\r\n

[tex]$|B \\cup F| = |F| + |B| - |B \\cap F|$[/tex] .

\r\n

En utilisant ces formules, on écrit

\r\n

[tex]$|(A \\cap F) \\cup (B \\cap F)| = |A \\cap F| + |B \\cap F| - |(A \\cap F) \\cap (B \\cap F)| $[/tex] .

\r\n

Dans le dernier terme, on va supprimer l\'un des [tex]$ \\cap F $[/tex] : il suffit de demander une fois que la personne soit Française, ce n\'est pas la peine de demander qu\'elle soit Française et qu\'elle soit Française. Au final, une fois faites toutes les simplifications possibles, on aboutit à

\r\n

[tex]\\catcode`\\?=4\\begin{minipage}{540px}\\begin{align*}| A \\cup B \\cup F| =?\\phantom{+} |A| + |B| + |F| \\\\ ?- |A\\cap B| - |B \\cap F| - |F \\cap A| \\\\? + |A \\cap B \\cap F| \\end{align*}\\end{minipage}[/tex].

\r\n

On pourrait évidemment recommencer ce petit raisonnement pour tous les pays d\'Europe. Il y a deux choses importantes à noter pour, à terme, généraliser la formule :\r\n

\r\n
  • le résultat se présente sous la forme d\'une somme d\'intersections sur l\'ensemble des choix possibles de un, deux, ... et enfin tous les termes ;
  • \r\n
  • dans cette somme, on alterne le signe à chaque fois qu\'on rajoute une intersection.
  • \r\n
\r\n

On admet donc la forme du résultat général pour les ensembles [tex]$A_i$[/tex]:

\r\n

[tex]\\catcode`\\?=4\\begin{minipage}{540px}\\begin{align*} \\left | \\displaystyle \\bigcup_{i=1}^n A_i \\right | =? \\sum_{i=1}^n |A_i| - \\sum_{1 \\leq i < j \\leq n } |A_i \\cap A_j | + \\sum_{1 \\leq i < j <k \\leq n } |A_i \\cap A_j \\cap A_k | \\\\ ? + \\cdots + (-1)^{n+1} | A_1 \\cap \\ldots \\cap A_n| \\end{align*}\\end{minipage}[/tex] ;

\r\n

ce résultat, qui est la fameuse formule d\'inclusion-exclusion, s\'écrit aussi

\r\n

[tex]$\\left | \\displaystyle \\bigcup_{i=1}^n A_i \\right | = \\displaystyle \\sum_{k=1}^n (-1)^{k-1} \\displaystyle \\sum_{1 \\leq i_1 < i_2 < \\ldots < i_k \\leq n} |A_{i_1} \\cap A_{i_2} \\cap \\ldots \\cap A_{i_k}| $[/tex]

\r\n

Revenons maintenant à nos permutations sur un ensemble de [tex]$n$[/tex] éléments. On note [tex]$A_k$[/tex] l\'ensemble des permutations laissant l\'élément [tex]$k$[/tex] fixe. Il est facile de calculer

\r\n

[tex]$| A_k | = (n-1)!$[/tex] .

\r\n

puisqu\'il ne reste un arbitraire de permutation que sur les [tex]$n-1$[/tex] éléments restants. Les permutations qui fixent à la fois [tex]$k$[/tex] et [tex]$l$[/tex] est l\'ensemble intersection de celles qui fixent [tex]$k$[/tex] et de celles qui fixent [tex]$l$[/tex] ; on n\'a plus que [tex]$n-2$[/tex] éléments à permuter, et donc

\r\n

[tex]$ \\left| A_k \\cap A_l \\right | = (n-2)!$[/tex] ,

\r\n

et donc plus généralement,

\r\n

[tex]$ \\left| \\bigcap_{i=1}^k A_i \\right | = (n-k)!$[/tex] .

\r\n

On connaît donc les nombres d\'éléments de toutes intersections des ensembles [tex]$A_k$[/tex]. On peut donc appliquer la formule d\'inclusion-exclusion qu\'on vient d\'établir ! L\'ensemble

\r\n

[tex]$ \\left | \\displaystyle \\bigcup_{i=1}^n A_i \\right | $[/tex]

\r\n

représente la réunion des permutations fixant [tex]$i=1$[/tex], [tex]$i=2$[/tex], ..., [tex]$i=n$[/tex]. C\'est donc l\'ensemble des permutations laissant au moins un point fixe ! Lorsqu\'on applique la formule d\'inclusion-exclusion, il ne faut pas oublier que ce n\'est pas juste

\r\n

[tex]$\\left | \\displaystyle \\bigcap_{i=1}^k A_i \\right | = (n-k)!$[/tex] .

\r\n

qu\'il faut sommer : en effet, on a encore [tex]$k$[/tex] parmi [tex]$n$[/tex] manière de choisir quels points on va laisser fixes. Ainsi, chacun des termes à interpréter comme le nombre de permutations laissant exactement [tex]$k$[/tex] points fixes vaut

\r\n

[tex]$ \\displaystyle \\frac{n!}{k! (n-k)!} \\times (n-k)! = \\displaystyle \\frac{n!}{k!}$[/tex]

\r\n

et donc le nombre de permutations laissant au moins un point fixe est, grâce à la formule,

\r\n

[tex]$ \\left | \\displaystyle \\bigcup_{i=1}^n A_i \\right | = n! \\times \\displaystyle\\sum_{i=1}^n \\displaystyle\\frac{{(-1)}^{k-1}}{k!} = n! \\left ( 1- \\displaystyle\\sum_{i=0}^n \\displaystyle\\frac{{(-1)}^{k}}{k!}\\right ) $[/tex]

\r\n

Et on conclut que la probabilité qu\'une permutation choisie au hasard contienne au moins un point fixe est

\r\n

[tex]$ 1- \\displaystyle\\sum_{i=0}^n \\displaystyle\\frac{{(-1)}^{k}}{k!}$[/tex]

\r\n

Lorsque le nombre d\'éléments devient très important, on reconnaît dans cette expression le développement en série de [tex]$e^{-1}$[/tex], et on a donc une probabilité proche de

\r\n

[tex]$ 1 - e^{-1} \\simeq 0{,}63 $[/tex]

\r\n

qu\'une permutation prise au hasard contienne au moins un point fixe. Donc il y a presque deux chances sur trois qu\'il y ait un étudiant chanceux !

Le D.E., le prof de maths et les élèves

Pour inaugurer ce blog, je vous propose — d\'aucuns diront que j\'impose ; et ils auraient raison, mais après tout, c\'est mon blog — une petite énigme. Bon, pour être honnête, c\'est surtout pour tester le nouveau plugin [tex]\\LaTeX[/tex] que je viens d\'installer. Et pour être encore plus honnête : il faut bien se distraire pendant cette période d\'examens.

Bref.

L\'énigme que je propose est assez connue, et un élève de sup est capable de la résoudre (en théorie, car la solution est assez difficile à imaginer, et pas réellement intuitive). En voici donc l\'énoncé.

Il était une fois, à l\'École polytechnique, un Directeur des Études. C\'était un homme mauvais — ce qui en passant n\'étonnera personne, puisqu\'il avait accepté ce poste. Il cherchait toujours de nouveaux moyens de nuire à l\'épanouissement des élèves. Un jour, en quête de nouvelles idées, il demanda à un professeur de mathématique de s\'occuper de cette basse besogne. Ce dernier, qui ne voulait ni déplaire à son supérieur par une tâche trop facile, ni aux élèves auxquels il ne voulait pas nuire, proposa une épreuve, dont l\'issue déterminerait le départ en vacances des élèves. Cette épreuve devait sembler suffisamment perfide au Directeur, mais il était confiant en la sagacité des étudiants pour savoir qu\'ils trouveraient une manière de s\'en sortir. Sa proposition était la suivante :

« Installez dans l\'amphi Arago, pour chacun des cinq cents élèves, un casier portant son nom. Préparez également cinq cents billets, chacun comportant le nom d\'un élève (et chaque élève apparaissant une fois, et une seule). Enfin, vous distribuerez les billets au hasard dans chacun des casiers. Après cette préparation, vous convoquerez les élèves en Poincaré. Chaque élève, à tour de rôle, et dans un ordre aléatoire qu\'ils ne connaissent pas, se rendra en Arago ; il aura le droit d\'ouvrir deux cent cinquante casiers, et de consulter le nom inscrit sur les billets contenus dans ceux-ci, mais sans y toucher. Si au terme de cette consultation, il a réussi à identifier le casier contenant son billet, il remet tout dans l\'état dans lequel il l\'a trouvé, et sort, sans avoir le droit de donner d\'informations aux autres rester en Poincaré, et l\'élève suivant est admis en amphi Arago. Si tous les élèves sans exceptions parviennent à identifier le casier contenant le billet à leurs noms, les élèves peuvent partir en vacances. Dans le cas contraire, si un élève ou plus ne parvient pas à l\'identifier, toute la cérémonie est remise au lendemain — avec bien sûr un nouveau tirage des billets. »

Jubilation du Directeur des Études. Se souvenant de ses cours de probabilité de terminale, il tint le raisonnement suivant : « Aucun élève, en arrivant en Arago, ne peut savoir où est son billet. En ouvrant des casiers au hasard, il a finalement une chance sur deux de parvenir à trouver son nom. Pour que tous les élèves y arrivent, il y a donc une probabilité [tex]$(1/2)^{500}$[/tex] . Je peux dormir tranquille, ils ne partiront jamais en vacances. Et j\'aurai tout le loisir de concocter de nouveaux plans diaboliques pour les tourmenter. »

Pourtant, en quelques jours, les élèves partirent en vacances. Bien entendu, ce n\'était pas sur la clémence du Directeur qu\'ils avaient pu compté. Alors, comment ont-il fait (sachant qu\'ils n\'ont pas eu particulièrement de chance) ?

Évidemment, le raisonnement du Directeur est parfaitement exact. Malheureusement, ses hypothèses de départ étaient fausses : les élèves n\'ont pas ouvert les casiers au hasard. S\'ils n\'ont pas ouvert au hasard, ils ont donc utiliser les rares informations dont ils disposaient en rentrant en Arago. Cette information se réduit même à une seule : leurs noms. Et cette information permet de particulariser un, et un seul, casier : le leur ! Chaque élève va donc aller regarder ce que contient son casier. Il y trouve un billet sur lequel est inscrit un nom. Si c\'est son propre nom, il peut sortir, et l\'élève suivant entre en agissant de la même manière ; sinon, ce billet contient un autre nom, qui particularise un nouveau casier. Il va à ce nouveau casier, et répète l\'opération : il l\'ouvre, et s\'il trouve son nom, il peut sortir, sinon, il va au casier indiqué par le nouveau nom qu\'il trouve, etc.

Évidemment, même si cette stratégie utilise les seules informations qu\'on connaît, il n\'est pas du tout évident a priori qu\'elle permettra de s\'en sortir en un temps raisonnable. Pour démontrer cela, on va devoir formaliser le problème un petit peu.

Mettre un billet dans chaque casier, chaque billet et chaque casier possédant un identifiant (dans notre cas, le nom), et chaque identifiant se retrouvant sur exactement un billet et un casier, correspond à choisir une permutation du groupe symétrique [tex]$\\mathfrak{S}_n$[/tex], où [tex]$n$[/tex] est, dans notre cas, le nombre d\'étudiants. Lorsqu\'ils suivent la procédure, ils parcourent un cycle de cette permutation. Par exemple, si la ligne du haut représente le numéro du casier, et la ligne du bas, le numéro inscrit sur le billet, alors la permutation

[tex]\\catcode`\\?=4$\\begin{pmatrix} 1 ? 2 ? 3 ? 4 ? 5 ? 6 ? 7 ? 8 ? 9 ? 10 \\\\ 2 ? 7 ? 4 ? 6 ? 1 ? 3 ? 9 ? 10? 5 ? 8 \\end{pmatrix}$[/tex]

signifie que l\'élève 3 trouvera dans son casier le billet de 4 ; en allant ouvrir le casier de 4, il trouve le billet de 6, et dans le casier de 6, il trouve son propre billet. Cette permutation se symbolise aussi par

[tex]$(1 2 7 9 5)(3 4 6)(8 10) $[/tex] :

si l\'on part d\'un numéro quelconque, il faut regarder le suivant dans la liste pour savoir le numéro qui lui est associé, en convenant que si on atteint une parenthèse fermante, on revient au nombre qui suit la parenthèse ouvrante associée. Évidemment, avec cette notation, [tex]$(3 4 6) = (4 6 3) = (6 3 4)$[/tex], et c\'est aussi la succession d\'ouverture que j\'ai décrite un peu plus haut ; une telle succession de numéro, qui boucle sur elle-même, est appelé un cycle, et on peut démontrer que toute permutation se décompose sous la forme de cycles de tailles variables.

Pour en revenir à nos étudiants, un peu de réflexion permet d\'arriver à la conclusion suivante : si la longueur du cycle qui est associée à mon casier est plus petite que le nombre d\'étudiant divisé par deux, alors je parviendrai à trouver mon nom en respectant les conditions. En effet, en choisissant mon casier comme point de départ, je choisis dès le départ « mon » cycle, c\'est-à-dire celui dans lequel j\'apparais. Et le contrat est rempli si ce cycle est plus petit que 250. Pour que les étudiants puissent partir en vacances, il faut donc que tous les cycles (puisque chaque cycle est utilisé !) soient de longueurs plus petites que [tex]$n/2$[/tex] : si chacun respecte la procédure, elle sera gagnante dès que tous les cycles satisfont la propriété.

Le problème est donc transformé en la question suivante : si on se donne une permutation au hasard, quelle est la probabilité qu\'elle ne possède aucun cycle de longueur supérieure à [tex]$n/2$[/tex]. On va en fait répondre à la question complémentaire : quelle est la probabilité qu\'elle possède un cycle de taille supérieure à [tex]$n/2$[/tex].

Dans un premier temps, on s\'intéresse à la probabilité qu\'une permutation choisie au hasard contienne (au moins) un cycle de longueur [tex]$k, 1 \\leq k \\leq n$[/tex] avec [tex]$n$[/tex] pair le nombre d\'éléments. Pour cela, on commence par choisir les [tex]$k$[/tex] nombres à mettre dans le cycle ; l\'ordre de choix est important, donc on a

[tex]$ n \\times (n-1) \\times \\ldots \\times (n-k+1) = \\displaystyle \\frac{n!}{(n-k)!}$ [/tex]

possibilités. Mais il ne faut pas oublier qu\'un cycle peut s\'écrire de plusieurs manières différentes : [tex]$(3 4 6) = (4 6 3) = (6 3 4)$[/tex] sont trois écritures possibles d\'un même cycle. On a [tex]$k$[/tex] manières de choisir le nombre en première position, ce qui donne  [tex]$ \\frac{n!}{k (n-k)!}$ [/tex]. On a donc déterminé le nombre de manières de choisir un cycle de la transposition ; il y a ensuite [tex]$ (n-k)!$ [/tex] manières de réaliser une permutation des [tex]$ (n-k)$ [/tex] nombres restants. Ainsi, le nombre de permutations de [tex]$\\mathfrak{S}_n$[/tex] contenant au moins un cycle de longueur [tex]$k$[/tex] est

[tex]$ \\displaystyle \\frac{n!}{ k (n-k)!}\\times (n-k)! = \\displaystyle \\frac{n!}{ k}$ [/tex] ,

et la probabilité est simplement

[tex]$ \\displaystyle \\frac{\\frac{n!}{k}}{n!} = \\frac{1}{k}$ [/tex] .

Lorsque [tex]$k > n/2$[/tex], il ne peut évidemment y avoir qu\'au plus un cycle de longueur [tex]$k$[/tex], et les évènements considérés sont disjoints : on peut donc sommer les probabilités. La probabilité qu\'une permutation de [tex]$\\mathfrak{S}_n$[/tex] choisie au hasard ne contienne aucun cycle de longueur strictement supérieure à [tex]$n/2$[/tex] est donc (roulement de timbales) :

[tex] $ 1 - \\displaystyle \\sum_{k=n/2+1}^n \\displaystyle \\frac{1}{k} $ [/tex] .

Pour évaluer cette expression, on va se servir du développement asymptotique de la série harmonique :

[tex] $ \\displaystyle \\sum_{k=1}^n \\frac1k \\simeq \\ln(n)+\\gamma+\\frac1{2n}, \\qquad \\gamma \\simeq 0{,}577$ [/tex]

et du coup

[tex] $ 1 - \\displaystyle \\sum_{k=n/2}^n \\displaystyle \\frac{1}{k} \\simeq 1 - \\displaystyle \\sum_{k=1}^n \\displaystyle \\frac{1}{k} + \\displaystyle \\sum_{k=1}^{n/2} \\displaystyle \\frac{1}{k} = 1 - \\ln 2 + \\frac1{2n} \\simeq 0{,}3 $ [/tex] .

Ainsi, les élèves ont une chance sur trois de partir en vacances à chaque tirage, ce qui est bien supérieur au [tex]$(1/2)^{500}$[/tex] initial !

Pour ceux qui suivent toujours, une petite question subsidiaire : quelle est la probabilité qu\'il y ait un chanceux dans le lot des étudiants, c\'est-à-dire que son casier contienne directement son billet ? Réponse dans un prochain billet à paraître prochainement.

','

Pour inaugurer ce blog, je vous propose — d\'aucuns diront que j\'impose ; et ils auraient raison, mais après tout, c\'est mon blog — une petite énigme. Bon, pour être honnête, c\'est surtout pour tester le nouveau plugin [tex]\\LaTeX[/tex] que je viens d\'installer. Et pour être encore plus honnête : il faut bien se distraire pendant cette période d\'examens.

Bref.

L\'énigme que je propose est assez connue, et un élève de sup est capable de la résoudre (en théorie, car la solution est assez difficile à imaginer, et pas réellement intuitive). En voici donc l\'énoncé.

Il était une fois, à l\'École polytechnique, un Directeur des Études. C\'était un homme mauvais — ce qui en passant n\'étonnera personne, puisqu\'il avait accepté ce poste. Il cherchait toujours de nouveaux moyens de nuire à l\'épanouissement des élèves. Un jour, en quête de nouvelles idées, il demanda à un professeur de mathématique de s\'occuper de cette basse besogne. Ce dernier, qui ne voulait ni déplaire à son supérieur par une tâche trop facile, ni aux élèves auxquels il ne voulait pas nuire, proposa une épreuve, dont l\'issue déterminerait le départ en vacances des élèves. Cette épreuve devait sembler suffisamment perfide au Directeur, mais il était confiant en la sagacité des étudiants pour savoir qu\'ils trouveraient une manière de s\'en sortir. Sa proposition était la suivante :

« Installez dans l\'amphi Arago, pour chacun des cinq cents élèves, un casier portant son nom. Préparez également cinq cents billets, chacun comportant le nom d\'un élève (et chaque élève apparaissant une fois, et une seule). Enfin, vous distribuerez les billets au hasard dans chacun des casiers. Après cette préparation, vous convoquerez les élèves en Poincaré. Chaque élève, à tour de rôle, et dans un ordre aléatoire qu\'ils ne connaissent pas, se rendra en Arago ; il aura le droit d\'ouvrir deux cent cinquante casiers, et de consulter le nom inscrit sur les billets contenus dans ceux-ci, mais sans y toucher. Si au terme de cette consultation, il a réussi à identifier le casier contenant son billet, il remet tout dans l\'état dans lequel il l\'a trouvé, et sort, sans avoir le droit de donner d\'informations aux autres rester en Poincaré, et l\'élève suivant est admis en amphi Arago. Si tous les élèves sans exceptions parviennent à identifier le casier contenant le billet à leurs noms, les élèves peuvent partir en vacances. Dans le cas contraire, si un élève ou plus ne parvient pas à l\'identifier, toute la cérémonie est remise au lendemain — avec bien sûr un nouveau tirage des billets. »

Jubilation du Directeur des Études. Se souvenant de ses cours de probabilité de terminale, il tint le raisonnement suivant : « Aucun élève, en arrivant en Arago, ne peut savoir où est son billet. En ouvrant des casiers au hasard, il a finalement une chance sur deux de parvenir à trouver son nom. Pour que tous les élèves y arrivent, il y a donc une probabilité [tex]$(1/2)^{500}$[/tex] . Je peux dormir tranquille, ils ne partiront jamais en vacances. Et j\'aurai tout le loisir de concocter de nouveaux plans diaboliques pour les tourmenter. »

Pourtant, en quelques jours, les élèves partirent en vacances. Bien entendu, ce n\'était pas sur la clémence du Directeur qu\'ils avaient pu compté. Alors, comment ont-il fait (sachant qu\'ils n\'ont pas eu particulièrement de chance) ?

Évidemment, le raisonnement du Directeur est parfaitement exact. Malheureusement, ses hypothèses de départ étaient fausses : les élèves n\'ont pas ouvert les casiers au hasard. S\'ils n\'ont pas ouvert au hasard, ils ont donc utiliser les rares informations dont ils disposaient en rentrant en Arago. Cette information se réduit même à une seule : leurs noms. Et cette information permet de particulariser un, et un seul, casier : le leur ! Chaque élève va donc aller regarder ce que contient son casier. Il y trouve un billet sur lequel est inscrit un nom. Si c\'est son propre nom, il peut sortir, et l\'élève suivant entre en agissant de la même manière ; sinon, ce billet contient un autre nom, qui particularise un nouveau casier. Il va à ce nouveau casier, et répète l\'opération : il l\'ouvre, et s\'il trouve son nom, il peut sortir, sinon, il va au casier indiqué par le nouveau nom qu\'il trouve, etc.

Évidemment, même si cette stratégie utilise les seules informations qu\'on connaît, il n\'est pas du tout évident a priori qu\'elle permettra de s\'en sortir en un temps raisonnable. Pour démontrer cela, on va devoir formaliser le problème un petit peu.

Mettre un billet dans chaque casier, chaque billet et chaque casier possédant un identifiant (dans notre cas, le nom), et chaque identifiant se retrouvant sur exactement un billet et un casier, correspond à choisir une permutation du groupe symétrique [tex]$\\mathfrak{S}_n$[/tex], où [tex]$n$[/tex] est, dans notre cas, le nombre d\'étudiants. Lorsqu\'ils suivent la procédure, ils parcourent un cycle de cette permutation. Par exemple, si la ligne du haut représente le numéro du casier, et la ligne du bas, le numéro inscrit sur le billet, alors la permutation

[tex]\\catcode`\\?=4$\\begin{pmatrix} 1 ? 2 ? 3 ? 4 ? 5 ? 6 ? 7 ? 8 ? 9 ? 10 \\\\ 2 ? 7 ? 4 ? 6 ? 1 ? 3 ? 9 ? 10? 5 ? 8 \\end{pmatrix}$[/tex]

signifie que l\'élève 3 trouvera dans son casier le billet de 4 ; en allant ouvrir le casier de 4, il trouve le billet de 6, et dans le casier de 6, il trouve son propre billet. Cette permutation se symbolise aussi par

[tex]$(1 2 7 9 5)(3 4 6)(8 10) $[/tex] :

si l\'on part d\'un numéro quelconque, il faut regarder le suivant dans la liste pour savoir le numéro qui lui est associé, en convenant que si on atteint une parenthèse fermante, on revient au nombre qui suit la parenthèse ouvrante associée. Évidemment, avec cette notation, [tex]$(3 4 6) = (4 6 3) = (6 3 4)$[/tex], et c\'est aussi la succession d\'ouverture que j\'ai décrite un peu plus haut ; une telle succession de numéro, qui boucle sur elle-même, est appelé un cycle, et on peut démontrer que toute permutation se décompose sous la forme de cycles de tailles variables.

Pour en revenir à nos étudiants, un peu de réflexion permet d\'arriver à la conclusion suivante : si la longueur du cycle qui est associée à mon casier est plus petite que le nombre d\'étudiant divisé par deux, alors je parviendrai à trouver mon nom en respectant les conditions. En effet, en choisissant mon casier comme point de départ, je choisis dès le départ « mon » cycle, c\'est-à-dire celui dans lequel j\'apparais. Et le contrat est rempli si ce cycle est plus petit que 250. Pour que les étudiants puissent partir en vacances, il faut donc que tous les cycles (puisque chaque cycle est utilisé !) soient de longueurs plus petites que [tex]$n/2$[/tex] : si chacun respecte la procédure, elle sera gagnante dès que tous les cycles satisfont la propriété.

Le problème est donc transformé en la question suivante : si on se donne une permutation au hasard, quelle est la probabilité qu\'elle ne possède aucun cycle de longueur supérieure à [tex]$n/2$[/tex]. On va en fait répondre à la question complémentaire : quelle est la probabilité qu\'elle possède un cycle de taille supérieure à [tex]$n/2$[/tex].

Dans un premier temps, on s\'intéresse à la probabilité qu\'une permutation choisie au hasard contienne (au moins) un cycle de longueur [tex]$k, 1 \\leq k \\leq n$[/tex] avec [tex]$n$[/tex] pair le nombre d\'éléments. Pour cela, on commence par choisir les [tex]$k$[/tex] nombres à mettre dans le cycle ; l\'ordre de choix est important, donc on a

[tex]$ n \\times (n-1) \\times \\ldots \\times (n-k+1) = \\displaystyle \\frac{n!}{(n-k)!}$ [/tex]

possibilités. Mais il ne faut pas oublier qu\'un cycle peut s\'écrire de plusieurs manières différentes : [tex]$(3 4 6) = (4 6 3) = (6 3 4)$[/tex] sont trois écritures possibles d\'un même cycle. On a [tex]$k$[/tex] manières de choisir le nombre en première position, ce qui donne  [tex]$ \\frac{n!}{k (n-k)!}$ [/tex]. On a donc déterminé le nombre de manières de choisir un cycle de la transposition ; il y a ensuite [tex]$ (n-k)!$ [/tex] manières de réaliser une permutation des [tex]$ (n-k)$ [/tex] nombres restants. Ainsi, le nombre de permutations de [tex]$\\mathfrak{S}_n$[/tex] contenant au moins un cycle de longueur [tex]$k$[/tex] est

[tex]$ \\displaystyle \\frac{n!}{ k (n-k)!}\\times (n-k)! = \\displaystyle \\frac{n!}{ k}$ [/tex] ,

et la probabilité est simplement

[tex]$ \\displaystyle \\frac{\\frac{n!}{k}}{n!} = \\frac{1}{k}$ [/tex] .

Lorsque [tex]$k > n/2$[/tex], il ne peut évidemment y avoir qu\'au plus un cycle de longueur [tex]$k$[/tex], et les évènements considérés sont disjoints : on peut donc sommer les probabilités. La probabilité qu\'une permutation de [tex]$\\mathfrak{S}_n$[/tex] choisie au hasard ne contienne aucun cycle de longueur strictement supérieure à [tex]$n/2$[/tex] est donc (roulement de timbales) :

[tex] $ 1 - \\displaystyle \\sum_{k=n/2+1}^n \\displaystyle \\frac{1}{k} $ [/tex] .

Pour évaluer cette expression, on va se servir du développement asymptotique de la série harmonique :

[tex] $ \\displaystyle \\sum_{k=1}^n \\frac1k \\simeq \\ln(n)+\\gamma+\\frac1{2n}, \\qquad \\gamma \\simeq 0{,}577$ [/tex]

et du coup

[tex] $ 1 - \\displaystyle \\sum_{k=n/2}^n \\displaystyle \\frac{1}{k} \\simeq 1 - \\displaystyle \\sum_{k=1}^n \\displaystyle \\frac{1}{k} + \\displaystyle \\sum_{k=1}^{n/2} \\displaystyle \\frac{1}{k} = 1 - \\ln 2 + \\frac1{2n} \\simeq 0{,}3 $ [/tex] .

Ainsi, les élèves ont une chance sur trois de partir en vacances à chaque tirage, ce qui est bien supérieur au [tex]$(1/2)^{500}$[/tex] initial !

Pour ceux qui suivent toujours, une petite question subsidiaire : quelle est la probabilité qu\'il y ait un chanceux dans le lot des étudiants, c\'est-à-dire que son casier contienne directement son billet ? Réponse dans un prochain billet à paraître prochainement.

Histoire de la Transylvanie

J\'entame aujourd\'hui un article sur l\'histoire de la Transylvanie, sur laquelle je me suis penché cet été pour un projet dont je parlerai peut-être un jour... Évidemment, je n\'avais pas pris de notes, et je suis obligé de tout recommencer, mais ça, c\'est mon problème. Je ne cache pas que ma source principale sera Wikipedia, mais je vais essayer d\'y apporter un minimum de valeur ajoutée (consistant essentiellement à supprimer les informations que j\'estime moins importantes :D ).

Aux origines

La région était, dans l\'Antiquité, le centre politique du royaume des Daces (les Thraces du nord). En 106, elle est conquise par l\'empereur romain Trajan et devient la province romaine de Dacia Felix. Cette province romaine ne correspondait que partiellement aux limites de la future Transylvanie du Moyen Âge.

Après le départ des Romains en 271, la région entre dans une longue période de « diète documentaire » pour les historiens, car les sources écrites se raréfient comme partout en Europe. À partir du IVe siècle, s’y succédèrent les Huns (des turcophones), les Gépides (des germains), les Avars puis les Bulgares (autres turcophones) et les Slaves.

Au Moyen-Âge

À partir des IXe - Xe siècles, des Magyars (un peuple d\'origine proche asiatique, arrivé en Europe lors des Grandes Invasions), installés d\'abord au nord de la Mer Noire puis au centre du bassin danubien, étendent progressivement leur autorité vers les montagnes qui ceinturent ce bassin. Vers l\'Est ils trouvent les Carpates, en direction de ce qui devient alors pour eux « le pays au-delà des forêts » : la Transylvanie. Alors qu\'ils adoptent le christianisme catholique, ceux qu\'on appellent « Hongres » ou « Hongrois » par confusion avec leurs alliés Onoghours étendent leur domination sur les populations locales majoritairement slaves et valaque, qui relèvent du patriarcat orthodoxe d\'Ohrid. Plus tard, les nouveaux seigneurs Hongrois sédentarisent dans la partie orientale de la Transylvanie des mercenaires, les Sicules, colons aux origines incertaines, mais de langue hongroise. Devenus eux aussi catholiques, ils prennent en charge la garde des frontières.

Du XIe siècle au début du XVIe siècle, la Transylvanie est une\r\nprincipauté dotée de ses propres institutions et lois, autonome par\r\nrapport au royaume de Hongrie mais vassale de celui-ci. Le prince\r\nrégnant, portant le titre de voïvode, est adoubé par le roi de Hongrie.

Pour développer la région, le Roi de Hongrie fait appel à des colons allemands (appelés Saxons même si beaucoup ne proviennent pas de Saxe) dont il consigne les privilèges et les droits en 1224 (diplôme de l\'Andreanum). Ils s\'installent sur des terres royales (Fundus Regius) où ils fondent - dit-on - sept cités (d\'où le nom allemand pour Transylvanie de Siebenbürgen). Ils consolident leur privilèges qui ne seront définitivement abolis qu\'en 1876.

Jusqu\'en 1366, la Transylvanie connaît une organisation politique où, outre l\'aristocratie magyare, les Saxons, les Sicules et les Valaques (Roumains) étaient représentés à la Diète (sorte de Parlement). Ils formaient ensemble un Tiers état (congregatio generalis) pouvant proposer et voter des lois. Mais en 1366, par l\'Édit de Turda, le roi Louis Ier de Hongrie redéfinit l\'accessibilité à la congregatio generalis et à la Diète, désormais conditionnée par l\'appartenance à l\'Église catholique. Bien que l\'édit ne le mentionne pas ouvertement, cela en exclut la majorité orthodoxe roumaine, c\'est-à-dire la majorité des Transylvains. L\'ancienne noblesse roumaine, les boyards, dont l\'autorité se fondait sur un droit coutumier, n\'est plus reconnue, et doit soit se convertir et se faire reconnaître soit s\'exiler (en Moldavie et Valachie). Ces départs sonnent la fin des ţări, sortes de communautés territoriales qui structuraient initialement les Valaques, qui sont progressivement intégrées aux comitats hongrois et aux fiefs saxons (XIIIe et XIVe siècle), installant de facto les Valaques orthodoxes en situation de soumission, puis de servage.

En 1438, après leur victoire sur les jacqueries valaques, seuls les catholiques, Hongrois, Sicules et Saxons sont reconnus comme « nations » (Unio Trium Nationum), enterinant une situation foncièrement inégalitaire qui perdurera jusqu\'au XVIIIe siècle et à la Révolution transylvaine de 1784.

Domination ottomane

L\'irruption des turcs Ottomans dans le bassin danubien et le désastre hongrois de Mohács (1526), provoquent la désintégration de la Hongrie médiévale. En l\'espace de trente ans, après un certain nombre de péripéties sur fond de soif de conquêtes et de querelles dynastiques (qui doivent bien constituer 99% des causes de remaniements territoriaux au cours de l\'histoire), la situation est la suivante : la Transylvanie est une monarchie indépendante, mais qui doit accepter, comme avant elle la Valachie et la Moldavie, le statut de vassale de l\'Empire ottoman. Vassale ne signifie pourtant pas annexée, et c\'est pourquoi les cartes qui montrent la Transylvanie, la Valachie et la Moldavie comme territoires ottomans, sont fausses. En effet les trois Voïvodats gardent leur statut d\'états chrétiens autonomes, leurs armées, leurs institutions, leurs lois et leurs ambassadeurs. Le traité de Speyer, du 10 mars 1571, signé par l’empereur Maximilien et le prince, entérinait cette position de la Transylvanie.

La Transylvanie est donc une Principauté élective dirigée par un Voïvode hongrois, et où les pouvoirs de la diète sont réels. Lors de la Réforme, alors que la Contre-Réforme sévit en France et dans les possessions des Habsbourg (Autriche, Bohême, Hongrie royale), la Diète transylvaine, par l\'édit de tolérance de 1571, passe en majorité au protestantisme, qu\'il soit luthérien, calviniste ou unitarien. Dans cet édit de tolérance transylvain, ces quatre confessions (professées par les aristocrates, les bourgeois et les fermiers libres, magyarophones ou germanophones) sont déclarées « acceptées » (receptæ), alors que la foi orthodoxe de la majorité des Transylvains (professée par les serfs roumanophones) est seulement « tolérée » (tolerata). Du point de vue des Magyars et des Saxons, c\'est un Âge d\'Or de la Transylvanie au XVIIe siècle, mais du point de vue de la paysannerie, en majorité roumaine et orthodoxe, c\'est un âge obscur. Pendant toute cette période, la plupart du temps, les Voïvodes de Transylvanie, comme leurs homologues de Moldavie et Valachie, jouent double jeu : ils paient un tribut aux Ottomans tout en reconnaissant, à plusieurs reprises, l\'autorité lointaine des Habsbourg.

Domination des Habsbourg

À partir de 1688-1690, la région passe sous le contrôle de l\'empire des Habsbourg qui vient de reconquérir le bassin danubien après 150 ans d\'occupation ottomane. L\'empereur Léopold s\'engage à reconnaître l\'autonomie transylvaine, mais il met en place un gouverneur, entouré d\'un Conseil (Gubernium), chargé de le représenter personnellement dans ce qui devient, peu à peu, une simple province de son Empire.

À la fin du XVIIIe siècle, la situation sociale est la suivante : la paysannerie, majoritairement \"valaque\" (roumanophone), devait la dîme sur toutes ses productions, d\'écrasants impôts sur le sel, au moins la moitié des six jours ouvrables par semaine, etc. L\'aristocratie, majoritairement magyare, et la haute bourgeoisie, majoritairement allemande, y détiennent tous les pouvoirs civils, juridiques, militaires et économiques, ainsi que la quasi-totalité des terres et des biens immobiliers.\r\nSous l\'influence de l\'esprit des Lumières commencent à se développer les consciences nationales modernes. Les élites valaques souffrent de n\'avoir aucune participation au pouvoir, et réclament entre 1784 et 1792 la reconnaissance des Roumains comme « Quatrième nation » en Transylvanie. La révolution transylvaine de 1784 échoue, mais les Habsbourg se rendent compte qu\'il est nécessaire d\'assouplir la situation sociale. Joseph II, imprégné par l\'esprit des Lumières, mène entre 1781 et 1787 des réformes audacieuses: suppression du servage, démantèlement des privilèges des Ordres (hongrois, sicule, saxon) issus du Moyen Âge. Mais, refusées par l\'aristocratie magyare, ces réformes sont annulées en 1790, dans le contexte de la révolution française qui effraie toutes les cours impériales d\'Europe.

Ces réformes, qui mettaient les Roumains à égalité avec les autres « nations » reconnues de Transylvanie, sont un électrochoc pour les Hongrois de Transylvanie, nobles mais aussi bourgeois, qui commencent à réclamer l\'abolition de l\'Archiduché et le rattachement de la Transylvanie à la « Grande Hongrie » comprenant également le Royaume de Croatie-Slavonie. Les Sicules, de langue hongroise, s\'identifient, eux aussi, de plus en plus, à la « cause nationale » Hongroise. À partir de cette époque, la Transylvanie va de plus en plus devenir l\'enjeu des luttes nationales et les revendications identitaires, dont elle n\'est toujours pas complètement sortie au début du XXIe siècle. En 1848, le nationalisme romantique du « Printemps des peuples » qui lutte pour la liberté et la démocratie contre les tyrans souverains, révèle vite ses limites et ses naïvetés en Europe centrale, et particulièrement en Transylvanie, où les révolutions hongroise et roumaine de 1848 échouent après s\'être opposées l\'une à l\'autre.

Suit une courte période de transition dite du néo-absolutisme autrichien : la Transylvanie, dont l\'autonomie fut rétablie pour encore 19 ans (elle fut définitivement abolie en 1867), devient de facto une coquille vide, dissoute dans un système répressif et bureaucrate, qui n\'en poursuit pas moins les réformes de modernisation de 1848-1849 (fin du servage, modernisation des codes juridiques). Dans les années 1860 l\'Autriche subit plusieurs graves défaites en Italie puis à Sadowa en 1866, et l\'empereur François-Joseph doit relâcher la pression sur les nationalités. Une diète transylvaine se réunit à Sibiu où, pour la première fois, les Roumains sont représentés, et vote l\'usage à égalité des trois langues, roumaine, hongroise et allemande dans l\'administration (1863-1864). Un projet est présenté à l\'empereur: l\'Autriche, comme l\'Allemagne, deviendrait une fédération de sept monarchies (Autriche, Bohême-Moravie, Galicie-et-Lodomérie, Hongrie, Croatie-Slavonie, Transylvanie, Dalmatie) dont il serait le roi ou l\'archiduc. Mais, pour ne pas contrarier les magnats d\'Autriche et de Hongrie, l\'empereur choisit de ne faire reposer l\'équilibre de l\'Empire que sur un pacte avec les seuls Hongrois : c\'est le Compromis de 1867 (Ausgleich) qui fonde l\'Autriche-Hongrie. Pour sa part, la Transylvanie est intégrée dans la « Grande-Hongrie », et perd toute autonomie.

Période austro-hongroise

\r\nAprès 1867, les Hongrois ont carte blanche pour réorganiser la partie de l\'Empire qui leur est dévolue : ils construisent le projet de la « Grande Hongrie unitaire ». La Transylvanie disparaît définitivement des cartes administratives, le territoire hongrois est découpé en « comitats » (megyek) uniformes (1876). Le Parlement est désormais à Budapest.

Après une première période plutôt conciliatrice, le gouvernement hongrois mène en Transylvanie une politique de magyarisation de plus en plus poussée et agressive dans une province constituée, à l\'époque, d\'environ 55 % de Roumains, 10 % de Saxons et 35 % de Hongrois. Cette politique aboutit à un effet contraire à celui recherché: les manifestations identitaires tant roumaines que saxonnes se renforcent. Les associations nationales de tout type (sport, arts, culture, banque) se multiplient, comme partout en Europe centrale.

Du côté roumain, après une période de boycott ( dite \"passiviste\": 1867-1902), une élite politique déterminée se forme au début du XXe siècle. En outre, l\'unification de la Valachie et de la Moldavie en un seul État de Roumanie (autonome en 1859, indépendant en 1878) est un message fort pour les Roumains de Transylvanie. Quant aux Saxons qui ont perdu leurs privilèges en 1876, ils choisissent majoritairement la voie du compromis avec Budapest (1890) mais, forts de leur avance économique et sociale, ils développent des stratégies de résistance à la magyarisation et, déçus par Vienne, regardent de plus en plus vers Berlin, où ils envoient leurs enfants faire leurs études universitaires.

Depuis 1918

\r\nPendant la Grande Guerre, la Transylvanie va devenir l\'objet des tractations et des convoitises entre puissances. Le pays concerné en premier chef est le Royaume de Roumanie. Dans les mouvements nationalistes roumains de ce pays, depuis les années 1880-1890, la revendication du rattachement de la Transylvanie, volontiers qualifiée de « troisième pays roumain » (avec la Valachie et la Moldavie), est devenue un leit-motiv. En août 1916, le gouvernement roumain, vivement encouragé par une opinion francophile, déclare la guerre à l\'Autriche-Hongrie pour libérer les « frères transylvains opprimés ».

En Transylvanie, de nouvelles associations ultra-nationalistes hongroises font la chasse aux Roumains « traîtres », et le gouvernement mène une politique de colonisation rurale anti-roumaine. À l\'automne 1918, quand l\'Autriche-Hongrie s\'effondre, les Roumains de Transylvanie proclament logiquement l\'Union de la Transylvanie à la Roumanie (Assemblée d\'Alba Iulia, 1er décembre 1918, actuellement fête nationale de la Roumanie). Les représentants saxons valident l\'union le 15 décembre 1918 à Mediaş, les Hongrois quant à eux s\'y opposent le 22 décembre de la même année. Les Transylvains roumains leur donnent des garanties pour le respect de leurs droits À la suite de la victoire des Alliés en 1918, la Bucovine et la Transylvanie votent également leur rattachement à la Grande Roumanie : la population du Royaume de Roumanie passe subitement de 8 millions à 18 millions d\'habitants. L\'unification du pays est reconnue (sauf par les Soviétiques) au traité de Saint-Germain-en-Laye (1919). La nouvelle frontière entre Hongrie et Roumanie est tracée par une commission de l\'Entente. Cette question des frontières,\r\névidemment considérée par la Hongrie comme un résultat injuste, installe pour longtemps un contentieux avec la Hongrie, qui s’aggrave au printemps 1919 lorsque le gouvernement bolchévique hongrois de Budapest tente de reprendre la Transylvanie. Ce gouvernement est vaincu par l\'armée roumaine encadrée par les officiers français de la mission Berthelot.

Bienvenue sur Dotclear !

Ceci est votre premier billet. Quand vous serez prêt à bloguer, connectez-vous pour le modifier ou le supprimer.