Types de transformations affines. Transformations affines élémentaires. Décomposition par transformation affine

Dans cet article, je parlerai d'une formule inhabituelle qui permet d'envisager les transformations affines sous un nouvel angle, et notamment les problèmes inverses qui se posent en lien avec ces transformations. J'appellerai problèmes inverses ceux qui nécessitent de calculer la matrice inverse : trouver une transformation par points, résoudre un système d'équations linéaires, transformer des coordonnées lors d'un changement de base, etc. Permettez-moi tout de suite de faire une réserve sur le fait que l'article ne contiendra ni découvertes fondamentales ni réduction de la complexité algorithmique - je montrerai simplement une formule symétrique et facile à retenir avec laquelle vous pouvez résoudre un nombre étonnamment élevé de problèmes courants. Pour les amateurs de rigueur mathématique, il y a une présentation plus formalisée ici (destiné aux étudiants) et un petit cahier de problèmes ici.

Une transformation affine est généralement spécifiée par une matrice et un vecteur de translation et agit sur l'argument vectoriel selon la formule

Cependant, vous pouvez vous en passer si vous utilisez une matrice augmentée et des coordonnées homogènes pour l'argument (comme les utilisateurs d'OpenGL le savent bien). Cependant, il s'avère qu'en plus de ces formes de notation, vous pouvez également utiliser le déterminant d'une matrice spéciale, qui contient à la fois les coordonnées de l'argument et les paramètres qui spécifient la transformation. Le fait est que le déterminant a la propriété de linéarité sur les éléments de n'importe laquelle de ses lignes ou colonnes, ce qui lui permet d'être utilisé pour représenter des transformations affines. Voici en effet comment exprimer l’action d’une transformation affine sur un vecteur arbitraire :


Ne vous précipitez pas pour vous enfuir avec horreur - premièrement, ici est écrite une transformation qui opère sur des espaces de dimension arbitraire (d'où il y a tant de choses), et deuxièmement, bien que la formule semble lourde, elle est facile à retenir et à utiliser. Pour commencer, je mettrai en évidence les éléments logiquement liés avec des cadres et des couleurs.


Ainsi, nous voyons que l'action de toute transformation affine sur un vecteur peut être représentée comme un rapport de deux déterminants, l'argument vectoriel étant inclus uniquement dans celui du haut, et celui du bas étant simplement une constante qui ne dépend que des paramètres.

Le vecteur surligné en bleu est l'argument, le vecteur sur lequel la transformation affine est appliquée. Ici et ci-dessous, les indices désignent la composante vectorielle. Dans la matrice supérieure, les composants occupent presque toute la première colonne, à l'exception d'eux dans cette colonne il n'y a que zéro (en haut) et un (en bas). Tous les autres éléments de la matrice sont des vecteurs de paramètres (numérotés avec un exposant placé entre parenthèses pour ne pas être confondus avec un degré) et des unités dans la dernière ligne. Les paramètres sélectionnent parmi l’ensemble de toutes les transformations affines celle dont nous avons besoin. La commodité et la beauté de la formule sont que la signification de ces paramètres est très simple : ils définissent une transformation affine qui transforme les vecteurs en . Par conséquent, nous appellerons les vecteurs « entrée » (ils sont décrits dans des rectangles dans la matrice) - chacun d'eux est écrit par composant dans sa propre colonne, avec une unité ajoutée en dessous. Les paramètres « Sortie » sont écrits en haut (surlignés en rouge), mais désormais non plus composant par composant, mais dans leur ensemble.

Si quelqu'un est surpris par une telle notation, souvenez-vous du produit vectoriel

Où il y avait une structure très similaire et où la première ligne était occupée par les vecteurs de la même manière. Dans ce cas, il n'est pas nécessaire que les dimensions des vecteurs coïncident. Tous les déterminants sont calculés comme d'habitude et permettent les « astuces » habituelles, par exemple, une autre colonne peut être ajoutée à n'importe quelle colonne.

Avec la matrice inférieure, tout est extrêmement simple - elle s'obtient à partir de la matrice supérieure en supprimant la première ligne et la première colonne. L'inconvénient est qu'il faut compter les déterminants, mais si cette tâche de routine est transférée sur un ordinateur, il s'avère qu'une personne n'aura qu'à remplir correctement les matrices avec les nombres de sa tâche. Dans le même temps, en utilisant une formule, vous pouvez résoudre de nombreux problèmes courants dans la pratique :

Transformation affine basée sur trois points du plan

Sous l'action d'une transformation affine inconnue, trois points du plan se transforment en trois autres points. Trouvons cette transformation affine.
Pour être précis, laissez nos points d'entrée


et le résultat de l'action de transformation était les points

Trouvons la transformation affine.

En fait, ce problème peut être résolu de différentes manières : en utilisant un système d'équations linéaires, de coordonnées barycentriques... mais nous suivrons notre propre chemin. Je pense qu'à partir de la notation utilisée, vous pouvez deviner où je veux en venir : nous prenons l'équation de la dimension et la substituons comme paramètres d'entrée et comme paramètres de sortie.


et il ne reste plus qu'à calculer les déterminants
Un œil exercé peut facilement repérer le virage et le diffuser.
Quand la formule est-elle applicable ?
Les vecteurs d'entrée et de sortie peuvent avoir des dimensions différentes - la formule est applicable aux transformations affines agissant sur des espaces de n'importe quelle dimension. Cependant, il doit y avoir suffisamment de points d'entrée et ils ne doivent pas « coller ensemble » : si une transformation affine agit à partir d'un espace à dimensions, les points doivent former un simplexe non dégénéré à partir du point. Si cette condition n'est pas remplie, il est alors impossible de restaurer sans ambiguïté la transformation (par n'importe quelle méthode, pas seulement celle-ci) - la formule en avertira avec un zéro au dénominateur.
Pourquoi un programmeur devrait-il restaurer les transformations affines ?
Il faut souvent trouver une transformation entre deux images (pour calculer la position de la caméra par exemple). Si nous trouvons plusieurs points spéciaux (caractéristiques) fiables sur ces images, ou si nous ne voulons tout simplement pas commencer tout de suite par des saccages et des combats contre les outlayers, alors nous pouvons utiliser cette formule.


Ainsi, la formule cache la matrice inverse et la multiplication par une autre matrice en plus. Cette expression est la solution standard au problème de trouver une transformation linéaire à partir de points. Notez qu'en faisant de la deuxième matrice du produit la matrice identité, nous obtenons simplement l'inverse de la matrice. Avec son aide, un système d'équations linéaires et des problèmes qui s'y réduisent sont résolus : recherche de coordonnées barycentriques, interpolation par polynômes de Lagrange, etc. Cependant, la représentation sous forme d'un produit de deux matrices ne permet pas d'obtenir ces « deux vues » associées à la décomposition en première ligne et en première colonne.

Interpolation de Lagrange et ses propriétés

Permettez-moi de vous rappeler que l'interpolation de Lagrange consiste à trouver un polynôme du plus petit degré passant par les points , , , . Non pas que ce soit une tâche courante dans la pratique de la programmation, mais regardons-la quand même.
Quel est le lien entre les polynômes et les transformations linéaires ?
Le fait est que le polynôme
peut être considéré comme une transformation linéaire qui mappe un vecteur à . Cela signifie que le problème de l'interpolation des points , , , se réduit à trouver une transformation linéaire telle que


et nous savons comment faire cela. Remplacez les bonnes lettres dans les bonnes cellules et obtenez la formule


La preuve qu’il s’agira d’un polynôme de Lagrange (et non celui de quelqu’un d’autre) peut être trouvée dans . À propos, l'expression au dénominateur est le déterminant de Vandermonde. Sachant cela et en développant le déterminant du numérateur le long de la première ligne, nous arrivons à une formule plus familière pour le polynôme de Lagrange.
Problème polynomial de Lagrange
Est-ce difficile à utiliser ? Essayons de résoudre le problème : trouver le polynôme de Lagrange passant par les points , et .

Remplaçons ces points dans la formule


Sur le graphique, tout ressemblera à ceci.

Propriétés du polynôme de Lagrange
En développant le déterminant supérieur le long de la première ligne et de la première colonne, nous examinons le polynôme de Lagrange sous deux angles différents. Dans le premier cas, on obtient la formule classique de Wikipédia, et dans le second cas, on obtient un polynôme écrit sous la forme d'une somme de monômes, où


Et maintenant, nous pouvons prouver des affirmations plutôt compliquées d’une manière relativement simple. Par exemple, en une ligne, on prouve que la somme des polynômes de Lagrange de base est égale à un et que le polynôme de Lagrange interpolant , , , a pour valeur , à zéro. Eh bien, pas seulement Lagrange - une approche similaire peut être appliquée à l'interpolation par sinus-cosinus ou à d'autres fonctions.

Conclusion

Merci à tous ceux qui ont lu jusqu'au bout. Dans cet article, nous avons résolu des problèmes standard en utilisant une formule non standard. Je l'ai aimé parce que, premièrement, cela montre que les transformations affines (linéaires), les coordonnées barycentriques, l'interpolation et même les polynômes de Lagrange sont étroitement liés. Après tout, lorsque les solutions aux problèmes sont écrites de manière uniforme, l'idée de leur similitude surgit d'elle-même. Deuxièmement, la plupart du temps, nous plaçons simplement les données d’entrée dans les bonnes cellules sans transformations supplémentaires.

Les problèmes que nous avons envisagés peuvent être résolus en utilisant des méthodes assez familières. Cependant, pour des problèmes à petite échelle ou des tâches éducatives, la formule peut être utile. En plus, je la trouve belle.

Toute transformation affine complexe peut être représentée comme une composition de plusieurs transformations affines élémentaires. L'analyse montre que dans les graphiques 2D, il existe quatre transformations affines élémentaires : rotation, étirement, réflexion, translation.

Tourner.

Considérons la rotation d'un point arbitraire UN autour de l'origine d'un angle (Fig. 6).

Une transformation affine élémentaire est la rotation d'un angle .

De la géométrie analytique, on sait que la rotation est décrite par la transformation affine suivante.

(5)

Il est pratique de combiner les coordonnées d'un point sous la forme d'un vecteur bidimensionnel (colonne). Puis la transition ponctuelle UNà la position du point UN

(6)

Dans cette notation, la rotation peut être exprimée sous forme de multiplication matricielle.

(7)

Ici R.– matrice de rotation (Rotation). La structure de cette matrice est obtenue à partir des équations (5).

(8)

Étirement-compression, détartrage.

Considérons l'opération d'étirement-compression le long des axes de coordonnées avec des coefficients d'étirement k 1 ,k 2. Cette opération est souvent appelée mise à l’échelle. Par exemple, montrons (Fig. 7) l'étirement d'un segment avec des coefficients d'étirement égaux à
.

Transformation affine élémentaire - dilatation avec coefficients
.

La dilatation est décrite par la transformation affine suivante.

(9)

La transformation (9) peut être exprimée sous forme de multiplication matricielle.

(10)

Ici S– matrice de mise à l'échelle. La structure de cette matrice est obtenue à partir des équations (9).

(11)

Réflexion.

Considérons l'opération de réflexion par rapport aux axes de coordonnées. Par exemple, montrons (Fig. 8) la réflexion par rapport à l'axe X.

Transformation affine élémentaire – réflexion par rapport à l’axe Ox.

La réflexion est décrite par la transformation affine suivante.

(12)

La transformation (12) peut être exprimée sous forme de multiplication matricielle.

(13)

Ici M– matrice de réflexion (Miroir – miroir, réflexion). La structure de cette matrice est obtenue à partir des équations (12).

(14)

De même, on retrouve la matrice de réflexion par rapport à l'axe oui.

(15)

Transfert.

Considérons l'opération de transfert vers le vecteur de traduction
. Avec cette opération, tout objet se déplace sans distorsion, et chaque côté reste parallèle à lui-même. Par exemple, nous montrons sur la figure 9 le transfert d'un segment.

Transformation affine élémentaire - transfert vers le vecteur de traduction t .

Le transfert est décrit par la transformation affine suivante.

(16)

Nous aimerions exprimer la transformation (16) sous forme de multiplication matricielle.

(17)

Ici T– doit être une matrice de traduction (Traduction – traduction, transfert). Cependant, il est impossible de construire une matrice T dimension 22, de sorte que les équations (16) et (17) soient simultanément satisfaites.

Et pourtant, une telle matrice peut être créée si l’on considère formellement des transformations affines 2D dans un espace tridimensionnel. Pour ce faire, nous devons nous déplacer vers des coordonnées homogènes.

Coordonnées homogènes.

Le concept de coordonnées homogènes nous est venu de la géométrie projective. Laissons le point UN se trouve sur le plan et a des coordonnées ( X,oui). Alors coordonnées homogènes ce point est n'importe quel triplet de nombres x 1 , x 2 , x 3 associés à des nombres donnés X Et oui les relations suivantes.

(18)

Lors de la résolution de problèmes d'infographie, les trois nombres suivants sont généralement choisis comme coordonnées homogènes.

Ainsi, à un moment arbitraire UN(X,oui) l'avion se voit attribuer un point UN(X,oui, 1) dans l'espace. Essentiellement, nous considérons des transformations affines dans le plan z= 1, comme le montre la figure 10.

Transformation affine en coordonnées homogènes.

Coordonnées des points situés dans le plan z= 1 sont combinés sous forme de vecteurs tridimensionnels. Point de transition UNà la position du point UN* peut être considéré comme une transformation vectorielle.

(20)

Dans cette notation, la transformation affine générale (1) peut être exprimée sous la forme d'une multiplication matricielle.

(21)

Voici la matrice P. de dimension 33 est la matrice de la transformation affine générale (1) et a la forme.

(22)

Notons un point important , associé à des coordonnées homogènes. La transition vers des vecteurs et des matrices tridimensionnels (20, 21, 22) pourrait être effectuée de manière totalement formelle, sans être liée à l'espace tridimensionnel réel (x, y, z). Cette approche permet d'introduire des coordonnées homogènes pour les transformations affines 3D et d'effectuer des multiplications matricielles dans un espace vectoriel à 4 dimensions.

Les matrices de transformations affines élémentaires introduites précédemment prendront désormais la forme suivante en coordonnées homogènes.

Matrice de rotation R. en coordonnées homogènes aura la forme suivante.

(23)

Matrice d'étirement S changera comme suit.

(24)

Matrices de réflexion M par rapport aux axes de coordonnées aura la forme.

(25)

Matrice de transfert T diffuser un vecteur en coordonnées homogènes aura la forme suivante.

(26)

Chapitre I. Le concept de transformation géométrique

1.1 Qu'est-ce qu'une transformation géométrique ?

La symétrie axiale, la symétrie centrale, la rotation, la translation parallèle, l'homothétie ont ceci en commun de « transformer » chaque figure F en une nouvelle figure F1. On les appelle donc transformations géométriques.

En général, une transformation géométrique est toute règle qui permet à chaque point A du plan d'indiquer un nouveau point A, auquel point A est transféré par la transformation en question. Si une figure F est donnée sur le plan, alors l'ensemble de tous les points auxquels vont les figures minces de F transformation considérée, représente une nouvelle figure F. Dans ce cas, on dit que F" est obtenu à partir de F en utilisant la transformation considérée.

Exemple. La symétrie autour de la droite l est une transformation géométrique. La règle qui permet de trouver le point A" correspondant à un point A" dans ce cas est la suivante : du point A une perpendiculaire AP s'abaisse sur une droite l et sur son prolongement au-delà du point P le segment RA" = AP est licencié.

Ajout de transformations géométriques

Supposons que nous considérions deux transformations géométriques, dont l’une que nous appelons « première » et l’autre « seconde ». Prenons un point arbitraire A sur le plan et désignons par A" le point auquel A va lors de la première transformation. À son tour, le point A" est transféré par la deuxième transformation vers un nouveau point A. En d'autres termes, le point A" est obtenu à partir du point A en utilisant l'application séquentielle de deux transformations - d'abord la première puis la seconde.

Le résultat de l'exécution séquentielle des deux transformations prises est aussi une transformation géométrique : elle amène le point A au point A." Cette transformation « résultante » est appelée somme de la première et de la deuxième transformations considérées.

Soit une figure F donnée sur le plan. La première transformation la transforme en une figure F". La deuxième transformation transforme cette figure F" en une nouvelle figure F". La somme des première et deuxième transformations transforme immédiatement le chiffre F en chiffre F."

Exemple. Soit la première transformation représente la symétrie par rapport au point O1 et la deuxième transformation représente la symétrie par rapport à un autre point O2. Trouvons la somme de ces deux transformations.

Soit A un point arbitraire du plan. Supposons d’abord que le point A ne se trouve pas sur la droite O1O2. Notons A" le point symétrique au point A par rapport à O1, et par A" le point symétrique au point A" par rapport à O2. Puisque O1O2 est la ligne médiane du triangle AA"A"" alors le segment AA" est parallèle au segment O1O2 et a deux fois la longueur. La direction du point A au point A" coïncide avec la direction du point

O1 au point O2. Notons maintenant par MN un vecteur tel que les segments MN et O1 O2 sont parallèles, le segment MN est deux fois plus long que le segment O1O2, et les rayons MN et O1O2 ont la même direction. Alors AA" = MN, c'est-à-dire que le point A" est obtenu à partir du point A par transfert parallèle vers le vecteur MN.

Il en va de même pour un point situé sur la droite O1O2.

Finalement, on obtient : la somme de la symétrie autour du point O1 et de la symétrie autour du point O2 représente une translation parallèle.

1.2 Mouvements

La symétrie axiale, la rotation (en particulier la symétrie centrale) et la translation parallèle ont en commun que chacune de ces transformations transforme toute figure F du plan en une figure égale F". Les transformations qui ont cette propriété sont appelées mouvements. L'homothétie est un exemple de une transformation, qui n'est pas un mouvement. En effet, chaque mouvement transforme n'importe quelle figure en une figure égale, c'est-à-dire qu'il change seulement la position des figures sur le plan ; l'homothétie change aussi les dimensions des figures.

Le rôle des mouvements en géométrie

Les mouvements jouent un rôle extrêmement important en géométrie. Ils ne modifient ni la forme ni la taille des figures, modifiant uniquement l'emplacement de la figure. Mais les figures qui ne diffèrent que par leur emplacement sur le plan sont totalement identiques du point de vue de la géométrie. C’est pourquoi on les appelle « figures égales » en géométrie. Aucune propriété d'une figure géométrique ne diffère de la propriété correspondante d'une figure égale. Ainsi, par exemple, des triangles égaux ont non seulement des côtés identiques, mais aussi des angles, des médianes, des bissectrices, des aires, des rayons de cercle inscrits et circonscrits identiques, etc.

Dans les cours de géométrie, nous avons toujours considéré que les figures égales (c'est-à-dire celles qui peuvent être combinées par le mouvement) étaient identiques ou indiscernables. De tels chiffres sont souvent confondus avec le même chiffre. C’est pourquoi on peut dire que, par exemple, le problème de la construction d’un triangle utilisant deux côtés a, b et l’angle C qui les sépare n’a qu’une seule solution. En fait, bien sûr, vous pouvez trouver un nombre infini de triangles ayant des côtés a et b donnés et un angle C d’une taille donnée entre eux. Cependant, tous ces triangles sont identiques, égaux, ils peuvent donc être considérés comme « un » triangle.

Ainsi, la géométrie étudie les propriétés des figures qui sont les mêmes pour des figures égales. De telles propriétés peuvent être appelées « propriétés géométriques ». En d'autres termes : la géométrie étudie les propriétés des figures qui ne dépendent pas de leur localisation. Mais les figures qui diffèrent uniquement par leur emplacement (figures égales) sont celles qui peuvent être combinées par le mouvement. Par conséquent, nous arrivons à la définition suivante du sujet de la géométrie ; la géométrie étudie les propriétés des figures qui sont préservées lors des mouvements.

Mouvements en géométrie et physique

Ainsi, la notion de mouvement joue un rôle primordial en géométrie. Les mouvements (« chevauchement ») étaient utilisés en sixième année pour déterminer des figures égales, pour prouver des signes d'égalité de triangles ; la notion de mouvement, comme nous l'avons vu plus haut, permet également de donner une description du sujet de la géométrie.

Pendant ce temps, il existe une lacune dans les définitions du concept d'égalité des figures et du concept de mouvement. En fait, les chiffres égaux ont été définis (au grade VI) comme les chiffres qui peuvent être combinés par superposition (c'est-à-dire par mouvement). Les mouvements ont été définis ci-dessus comme de telles transformations qui transforment deux polygones F1 et F tels qu'il existe un polygone F" homothétique à F et égal à F1, alors les angles du polygone F sont respectivement égaux aux angles du polygone F" et les côtés du polygone F sont respectivement proportionnels aux côtés du polygone F". Mais le polygone F a les mêmes angles et côtés que son polygone égal F1. Par conséquent, les polygones F1 et F sont similaires dans le sens dans lequel cela a été compris dans le cours de géométrie classe VIII.

Inversement, soit les polygones F1 et F tels que leurs angles sont respectivement égaux et leurs côtés sont respectivement proportionnels. Le rapport des côtés du polygone F1 aux côtés correspondants du polygone F sera noté k. Notons ensuite par F" le polygone obtenu à partir de F par une homothétie de coefficient k (et de centre d'homothétie quelconque. Dans ce cas, en vertu du théorème, les polygones F" et F1 auront respectivement des côtés et des angles égaux, c'est-à-dire que ces polygones seront égaux, donc les polygones F1 et F seront similaires au sens de la définition de similarité donnée ici.


Chapitre II. Transformations affines

2.1 Transformations affines du plan

Une transformation affine α est une transformation du plan qui transforme chaque ligne en ligne droite et préserve la relation dans laquelle un point divise un segment.

Sur la figure 1 : L"= α(L), A"=α(A), B"=α(B), C"=α(C),

|

Les transformations - mouvement et similarité - sont des cas particuliers de transformations affines, car, en raison des propriétés de mouvement et de similarité, toutes les exigences pour la définition des transformations affines sont remplies pour elles.

Donnons un exemple de transformation affine non réductible à celles considérées précédemment. Pour cela, considérons d'abord la projection parallèle d'un plan sur un plan.

Soit les plans : w et w1, une ligne droite l (direction de conception), non parallèle à aucun de ces plans (Fig. 2). Le point Aєw est appelé la projection du point A1єw1, si AA1||l, alors la ligne AA1 est appelée la ligne projetée. La conception parallèle est une cartographie du plan w1 sur w.

Notons les propriétés suivantes du design parallèle.

1) L’image de toute droite a1 est une droite.

En effet, les droites projetant les points de la droite a1 forment un plan (il passe par a1 parallèlement à l), qui, en coupant avec w, donne l'image de la droite a1 - droite a (Fig. 2).

2) La relation dans laquelle le point divise le segment est conservée, c'est-à-dire

(Fig.2)

Il découle immédiatement du théorème de l'intersection des côtés d'un angle par des lignes parallèles.

Passons directement à la construction d'un exemple de transformation affine.

Prenons deux copies du plan w et déplaçons l'une d'elles vers une autre position w1 (Fig. 3). La nouvelle position de tout point Аєw sera notée А1єw1. Nous projetons maintenant le plan w1 dans une certaine position sur w, et désignons la projection du point A1 par A."

Le résultat est une transformation du plan w sur lui-même, dans laquelle

. En raison des propriétés symétriques de la projection parallèle, pour cette transformation, les deux exigences d'une certaine transformation affine sont satisfaites, par conséquent, la transformation maintenant construite est affine à la perspective.

Ci-dessous \(f\) désigne une transformation affine écrite dans le système de coordonnées cartésiennes \(O, \boldsymbol(e)_(1), \boldsymbol(e)_(2)\) par les formules
$$
x^(*)=a_(1)x+b_(1)y+c_(1),\ y^(*)=a_(2)x+b_(2)y+c_(2).\label( réf1)
$$
étant donné que
$$
\begin(vmatrix)
a_(1)& b_(1)\\
a_(2)& b_(2)
\end(vmatrix) \neq 0.\label(ref2)
$$

Considérons une droite sur le plan d'équation \(\boldsymbol(r)=\boldsymbol(r)_(0)+\boldsymbol(a)t\) et trouvons son image sous la transformation \(f\). (L'image d'une ligne s'entend comme l'ensemble des images de ses points.) Le rayon vecteur de l'image \(M^(*)\) d'un point arbitraire \(M\) peut être calculé comme suit :
$$
\overrightarrow(OM^(*))=\overrightarrow(Of(O))+f\overrightarrow((O)M^(*))=\boldsymbol(c)+f(\boldsymbol(r)).\nonumber
$$

Ici \(\boldsymbol(c)\) est un vecteur constant \(\overrightarrow(Of)(O)\), et \(\boldsymbol(r)\) est le rayon vecteur du point \(M\). D’après (11) §2 on obtient
$$
\overrightarrow(OM^(*))=\boldsymbol(c)+f(\boldsymbol(r)_(0))+f(\boldsymbol(a))t.\label(ref3)
$$
Puisque \(f\) est une transformation affine et \(\boldsymbol(a) \neq \boldsymbol(0)\), alors \(\boldsymbol(a)\) ira dans le vecteur \(f(\boldsymbol( a) ) \neq 0\), et l’équation \eqref(ref3) est l’équation d’une droite. Ainsi, les images de tous les points de la droite \(\boldsymbol(r)=\boldsymbol(r)_(0)+\boldsymbol(a)t\) se trouvent sur la droite \eqref(ref3).

De plus, la transformation \(f\) détermine une application biunivoque d'une ligne sur une autre, puisqu'avec le choix des points initiaux et des vecteurs directeurs fait ici, le point \(M^(*)\) a le même valeur sur la ligne \eqref(ref3) paramètre \(t\), identique au point \(M\) sur la ligne d'origine. De là, nous obtenons la première déclaration.

Déclaration 1.

Avec une transformation affine :

  • une ligne droite se transforme en ligne droite ;
  • un segment entre dans un segment ;
  • les lignes parallèles deviennent parallèles.

Preuve.

Pour prouver la deuxième affirmation, il suffit de noter qu'un segment de droite est constitué de points pour lesquels les valeurs des paramètres satisfont une inégalité de la forme \(t_(1) \leq t \leq t_(2)\) Le La troisième affirmation découle du fait que sous une transformation affine, les -èmes vecteurs colinéaires deviennent colinéaires.

Déclaration 2.

Lors d'une transformation affine, le rapport des longueurs des segments parallèles ne change pas.

Preuve.

Soit les segments \(AB\) et \(CD\) parallèles. Cela signifie qu'il existe un nombre \(\lambda\) tel que \(\overrightarrow(AB)=\lambda \overrightarrow(CD)\). Les images des vecteurs \(\overrightarrow(AB)\) et \(\overrightarrow(CD)\) sont reliées par la même dépendance \(\overrightarrow(A^(*)B^(*))=\lambda \ overrightarrow(C^( *)D^(*))\). Il en résulte que
$$
\frac(|\overrightarrow(AB)|)(|\overrightarrow(CD)|)=\frac(|\overrightarrow(A^(*)B^(*))|)(|\overrightarrow(C^(* )D^(*))|)=|\lambda|.\nonnuméro
$$

Conséquence.

Si un point \(C\) divise le segment \(AB\) dans une relation \(\lambda\), alors son image \(C^(*)\) divise l'image \(A^(*)B^ (*) \) segment \(AB\) dans la même relation \(\lambda\).

Changement de zones lors d'une transformation affine.

Tout d’abord, jetons un coup d’œil. Choisissons un système de coordonnées cartésiennes général \(O, \boldsymbol(e)_(1), \boldsymbol(e)_(2)\) et notons-le par \((p_(1), p_(2)) \) et \ ((q_(1), q_(2))\) composantes des vecteurs \(\boldsymbol(p)\) et \(\boldsymbol(q)\) sur lesquels il est construit. On peut calculer l'aire d'un parallélogramme en utilisant :
$$
S_(\pm)=S_(\pm) (\boldsymbol(p), \boldsymbol(q))=(p_(1)q_(2)-p_(2)q_(1)) S_(\pm) ( \boldsymbol(e)_(1), \boldsymbol(e)_(2)).\nonumber
$$

Soit la transformation affine \(f\) s'écrire dans le système de coordonnées choisi par les formules \eqref(ref1). De ce qui a été prouvé précédemment, il s'ensuit que les vecteurs \(f(\boldsymbol(p))\) et \(f(\boldsymbol(q))\) ont \(f(\boldsymbol(e)_(1)) dans leur base, f(\boldsymbol(e)_(2))\) les mêmes composants \((p_(1), p_(2))\) et \((q_(1), q_(2)) \) cela et les vecteurs \(\boldsymbol(p)\) et \(\boldsymbol(q)\) dans la base \(\boldsymbol(e)_(1), \boldsymbol(e)_(2)\ ). L'image du parallélogramme est construite sur les vecteurs \(f(\boldsymbol(p))\) et \(f(\boldsymbol(q))\), et son aire est égale à
$$
S_(\pm)^(*)=S_(\pm) (f(\boldsymbol(p)), f(\boldsymbol(q)))=(p_(1)q_(2)-p_(2)q_ (1)) S_(\pm) (f(\boldsymbol(e)_(1)), f(\boldsymbol(e)_(2))).\nonumber
$$

Calculons le dernier facteur. Comme nous le savons d'après ce qui a déjà été prouvé, les coordonnées des vecteurs \(f(\boldsymbol(e)_(1)), f(\boldsymbol(e)_(2))\) sont respectivement égales, \ ((a_(1), a_( 2))\) et \((b_(1), b_(2))\). Par conséquent \(S_(\pm) (f(\boldsymbol(e)_(1)), f(\boldsymbol(e)_(2)))=(a_(1)b_(2)-a_(2) b_(1)) S_(\pm) (\boldsymbol(e)_(1), \boldsymbol(e)_(2))\) et
$$
S_(\pm)^(*)=(p_(1)q_(2)-p_(2)q_(1))(a_(1)b_(2)-a_(2)b_(1)) S_( \pm) (\boldsymbol(e)_(1), \boldsymbol(e)_(2)).\nonumber
$$
De là, nous voyons que
$$
\frac(S_(\pm)^(*))(S_(\pm))=\begin(vmatrix)
a_(1)& b_(1)\\
a_(2)& b_(2)
\end(vmatrix).\label(ref4)
$$

Ainsi, le rapport de l'aire de l'image d'un parallélogramme orienté à l'aire de ce parallélogramme est le même pour tous les parallélogrammes et est égal à \(a_(1)b_(2)-a_(2)b_ (1)\).

Il s'ensuit que ce déterminant ne dépend pas du choix du système de coordonnées dans lequel la transformation est écrite, bien qu'il soit calculé à partir de coefficients dépendant du système de coordonnées. Cette quantité est un invariant exprimant la propriété géométrique de la transformation.

D'après la formule \eqref(ref4), il est clair que le rapport entre l'aire de l'image d'un parallélogramme non orienté et son aire est égal à
$$
S^(*)/S=|a_(1)b_(2)-a_(2)b_(1)|.\label(ref5)
$$

Si \(a_(1)b_(2)-a_(2)b_(1) > 0\), alors les orientations de tous les parallélogrammes orientés sont conservées lors de la transformation, et si \(a_(1)b_(2) -a_(2 )b_(1)< 0\), то для каждого ориентированного параллелограмма ориентация образа противоположна его ориентации.

Parlons maintenant des zones d'autres figures. Chaque triangle peut être étendu pour former un parallélogramme dont l'aire est le double de l'aire du triangle. Par conséquent, le rapport de l'aire de l'image d'un triangle à l'aire de ce triangle satisfait l'égalité \eqref(ref5).

Chaque polygone peut être divisé en triangles. Par conséquent, la formule \eqref(ref5) est également valable pour les polygones arbitraires.

Nous n'aborderons pas ici la détermination de l'aire d'une figure curviligne arbitraire. Nous dirons seulement que dans les cas où cette aire est définie, elle est égale à la limite des aires d'une certaine séquence de polygones inscrite dans la figure considérée. De la théorie des limites, l'hypothèse suivante est connue : si la séquence \(S_(n)\) tend vers la limite \(S\), alors la séquence \(\delta S_(n)\), où \(\ delta\) est constant, tend à limiter \(\delta S\). Sur la base de cette proposition, nous concluons que la formule \eqref(ref5) est valable dans le cas le plus général.

A titre d'exemple, trouvons l'expression de l'aire d'une ellipse en fonction de ses demi-axes. Nous avons noté précédemment qu'une ellipse de demi-axes \(a\) et \(b\) peut être obtenue en comprimant un cercle de rayon \(a\) en une droite passant par son centre. Le taux de compression est \(b/a\). Dans l'un d'eux, nous avons reçu un enregistrement de coordonnées de compression à la droite \(x^(*)=x\), \(y^(*)=\lambda y\). Le déterminant des coefficients dans ces formules est égal à \(\lambda\), c'est-à-dire dans notre cas \(b/a\). Ainsi, le rapport de l'aire de l'ellipse à l'aire du cercle est \(b/a\), et cette aire est \(S=(b/a)\pi a^(2)\ ). Finalement nous avons
$$
S=\pi ab.\nonnuméro
$$

Images de lignes de second ordre.

Nous avons vu qu'une ligne droite se transforme en ligne droite. Il s’agit d’un cas particulier de l’énoncé suivant.

Déclaration 3.

Une transformation affine transforme une droite algébrique en une droite algébrique du même ordre.

Preuve.

En fait, laissez la droite \(L\) dans le système de coordonnées cartésiennes \(O, \boldsymbol(e)_(1), \boldsymbol(e)_(2)\) avoir une équation algébrique d'ordre \(p \). Nous savons déjà que les images de tous les points de la droite \(L\) sous la transformation affine \(f\) ont dans le système de coordonnées \(f(O), f(\boldsymbol(e)_(1)) , f(\boldsymbol( e)_(2))\) sont les mêmes coordonnées que leurs images inverses dans le système de coordonnées \(O, \boldsymbol(e)_(1), \boldsymbol(e)_(2) \). Par conséquent, les coordonnées des images dans le système \(f(O), f(\boldsymbol(e)_(1)), f(\boldsymbol(e)_(2))\) sont liées par la même algébrique équation d'ordre \(p\ ). Cela suffit pour tirer la conclusion dont nous avons besoin.

De l'énoncé prouvé ci-dessus, en particulier, il s'ensuit qu'une droite du second ordre sous une transformation affine se transformera en une droite du second ordre. Nous allons prouver une affirmation plus forte. Comme nous le savons déjà, les lignes de second ordre peuvent être divisées en . Nous verrons que la classe de la droite est conservée sous la transformation affine. Sur cette base, les classes de droites répertoriées dans ledit théorème sont appelées classes affines. Alors, prouvons une nouvelle affirmation.

Déclaration 4.

Une lignée de second ordre appartenant à l'une des classes affines ne peut se transformer en une lignée de la même classe que sous n'importe quelle transformation affine. Chaque ligne du second ordre peut être transformée par une transformation affine appropriée en n'importe quelle autre ligne de la même classe affine.

Preuve.

Nous appellerons une droite délimitée si elle se trouve à l’intérieur d’un parallélogramme. Il est facile de voir qu’avec une transformation affine, une ligne bornée doit devenir bornée, et une ligne illimitée doit devenir illimitée.

  1. Une ellipse est une ligne bornée du second ordre. En plus des ellipses, seules les lignes constituées d'un seul point, c'est-à-dire une paire de lignes sécantes imaginaires, sont limitées. Puisqu’une ellipse est limitée et comprend plus d’un point, elle ne peut se transformer qu’en ellipse.
  2. L'hyperbole a deux branches distinctes. Cette propriété peut être formulée de telle manière que son invariance sous transformations affines soit claire. À savoir, il existe une ligne droite qui ne coupe pas une hyperbole, mais coupe certaines de ses cordes. Parmi toutes les lignes du second ordre, seules les hyperboles et les paires de lignes parallèles ont cette propriété. Les branches d'une hyperbole ne sont pas des lignes droites et, par conséquent, sous une transformation affine, elle ne peut se transformer qu'en hyperbole.
  3. Une parabole est une ligne illimitée du second ordre, constituée d'une seule pièce non rectiligne. Aucune autre droite de second ordre n'a cette propriété, et donc une parabole ne peut se transformer qu'en parabole.
  4. Si une ligne du second ordre représente un point (une paire de lignes sécantes imaginaires), une ligne (une paire de lignes coïncidentes), une paire de lignes sécantes ou une paire de lignes parallèles, alors à partir des propriétés précédemment prouvées des transformations affines, il s'ensuit que cette ligne ne peut pas se transformer en une ligne d'une autre classe.

Démontrons la deuxième partie de la proposition. Dans ce que nous avons déjà prouvé, les équations canoniques des droites du second ordre sont écrites dans un repère cartésien rectangulaire et contiennent des paramètres \(a, b, ...\) Si on abandonne l'orthonormalité de la base, on peut faire plus des simplifications des équations canoniques et les amener à une forme qui ne contient pas de paramètres. Par exemple, remplacer les coordonnées \(x'=x/a\), \(y'=y/b\) transforme l'équation de l'ellipse \(x^(2)a^(2)+y^(2 )b^(2 )=1\) dans l'équation \(x'^(2)+y'^(2)=1\), quels que soient \(a\) et \(b\). (La dernière équation n'est pas une équation de cercle, puisque le nouveau système de coordonnées n'est pas rectangulaire cartésien.)

Le lecteur peut facilement montrer que les équations canoniques des droites du second ordre peuvent être transformées en les équations suivantes en se déplaçant vers un système de coordonnées approprié :

  1. \(x^(2)+y^(2)=1\);
  2. \(x^(2)+y^(2)=0\);
  3. \(x^(2)-y^(2)=1\);
  4. \(x^(2)-y^(2)=0\);
  5. \(y^(2)=2x\);
  6. \(y^(2)-1=0\);
  7. \(y^(2)=0\).

Nous appellerons un tel système de coordonnées un système de coordonnées canonique affine.

Il découle de ce qui précède qu'une transformation affine qui combine les systèmes de coordonnées canoniques affines de deux lignes de la même classe affine combine également ces lignes. Ceci termine la preuve.

Décomposition par transformation orthogonale.

Théorème 1.

Chaque transformation orthogonale est décomposée en un produit de translation parallèle, de rotation et éventuellement de symétrie axiale.

Preuve.

Soit \(f\) une transformation orthogonale et \(\vartriangle ABC\) un triangle rectangle isocèle d'angle droit \(A\). Lors de la transformation de \(f\), il se transformera en un triangle égal \(\vartriangle A^(*)B^(*)C^(*)\) avec un angle droit au sommet \(A^(*) \). Le théorème sera prouvé si, en effectuant séquentiellement une translation parallèle \(p\), une rotation \(q\) et (si nécessaire) une symétrie axiale \(r\), on peut combiner les triangles \(ABC\) et \( A^ (*)B^(*)C^(*)\). En effet, le produit \(rqp\) est une transformation affine tout comme \(f\), et une transformation affine est uniquement déterminée par les images de trois points qui ne se trouvent pas sur la même droite. Donc \(rqp\) coïncide avec \(f\).

Traduisons donc \(A\) et \(A^(*)\) par transfert parallèle \(p\) vers le vecteur \(\overrightarrow(AA^(*))\) (si \(A=A ^(* )\), alors \(p\) est la transformation d'identité). Alors, en tournant \(q\) autour du point \(A^(*)\), \(p(B)\) est compatible avec \(B^(*)\) (peut-être que cette transformation sera aussi identique ). Le point \(q(p(C))\) soit coïncide avec \(C^(*)\), soit lui est symétrique par rapport à la droite \(A^(*)B^(*)\ ). Dans le premier cas, l'objectif est déjà atteint, et dans le second, une symétrie axiale par rapport à la droite spécifiée sera requise. Le théorème a été prouvé.

Il convient de garder à l’esprit que l’expansion résultante de la transformation orthogonale n’est pas unique. De plus, une rotation ou une translation parallèle peut être décomposée en un produit de symétries axiales, le produit d'une translation parallèle et d'une rotation peut être représenté comme une seule rotation, et ainsi de suite. Nous ne préciserons pas comment procéder, mais clarifierons la propriété générale suivante de toutes ces extensions.

Déclaration 5.

Pour toute expansion d'une transformation orthogonale en produit d'un nombre quelconque de traductions parallèles, de rotations et de symétries axiales, la parité du nombre de symétries axiales incluses dans l'expansion est la même.

Preuve.

Pour le prouver, considérons une base arbitraire sur le plan et suivons le changement de son orientation (la direction de la rotation la plus courte de \(\boldsymbol(e)_(1)\) à \(\boldsymbol(e)_ (2)\)) lors des transformations effectuées. Notez que la rotation et la translation parallèle ne modifient l'orientation d'aucune base, mais la symétrie axiale modifie l'orientation de chaque base. Par conséquent, si une transformation orthogonale donnée change l’orientation de la base, alors toute expansion de celle-ci doit inclure un nombre impair de symétries axiales. Si l'orientation de la base ne change pas, alors le nombre de symétries axiales incluses dans l'expansion ne peut être que pair.

Définition.

Les transformations orthogonales qui peuvent être décomposées en produit de translation et de rotation parallèles sont appelées transformations orthogonales du premier type , et le reste - transformations orthogonales du deuxième type .

Une transformation orthogonale dans un système de coordonnées rectangulaires cartésiennes s'écrit :
$$
\begin(tableau)(cc)


\end(tableau).\nonnuméro
$$
Avec les signes supérieurs des coefficients \(y\) dans ces formules, le déterminant composé des coefficients est égal à +1, et avec les signes inférieurs il est égal à -1. De là et de la formule \eqref(ref4) découle l’instruction suivante.

Déclaration 6.

Une transformation orthogonale du premier type s'écrit dans un système de coordonnées rectangulaires cartésiennes par les formules
$$
\begin(tableau)(cc)
& x^(*)=x \cos \varphi \mp y \sin \varphi+c_(1),\\
& y^(*)=x \sin \varphi \pm y \cos \varphi+c_(2).
\end(tableau).\nonnuméro
$$
avec des signes supérieurs pour les coefficients de \(y\), et une transformation orthogonale du deuxième type - avec des signes inférieurs.

Décomposition d'une transformation affine.

Nous avons vu à quel point une transformation affine peut modifier un plan : un cercle peut se transformer en ellipse, un triangle régulier en un triangle complètement arbitraire. Il semblerait qu’aucun angle ne puisse être préservé. Cependant, la déclaration suivante est vraie

Déclaration 7.

Pour chaque transformation affine, il existe deux lignes mutuellement perpendiculaires qui se transforment en lignes mutuellement perpendiculaires.

Preuve.

Pour le prouver, considérons un cercle. Avec cette transformation affine, elle se transformera en une ellipse. Chaque axe d'ellipse est l'ensemble des milieux des cordes parallèles à l'autre axe. Lors d'une transformation affine, la corde se transformera en corde, le parallélisme devra être préservé, et le milieu du segment se transformera en milieu de son image. Ainsi, les prototypes des axes de l'ellipse sont des segments qui ont la même propriété : chacun d'eux est l'ensemble des milieux des cordes d'un cercle parallèle à un autre segment. De tels segments sont certainement deux diamètres de cercle mutuellement perpendiculaires. C'est ce dont nous avions besoin : il existe deux diamètres de cercle mutuellement perpendiculaires, qui se transforment en segments mutuellement perpendiculaires - les axes de l'ellipse.

Il convient de noter un cas particulier : un cercle sous transformation affine peut se transformer en cercle. Dans ce cas, le même raisonnement s’applique à deux diamètres mutuellement perpendiculaires du cercle-image. Évidemment, dans ce cas, deux directions mutuellement perpendiculaires restent perpendiculaires.

Définition.

Deux directions mutuellement perpendiculaires sont appelées directions principales ou singulières de la transformation affine \(f\) si elles se transforment en directions mutuellement perpendiculaires.

Théorème 2.

Chaque transformation affine est décomposée en produit d'une transformation orthogonale et de deux compressions en deux droites mutuellement perpendiculaires.

Preuve.

La preuve est similaire à la preuve. Considérons la transformation affine \(f\) et choisissez un triangle rectangle isocèle \(ABC\) de sorte que ses branches \(AB\) et \(AC\) soient dirigées dans les directions principales de la transformation \(f\). Notons \(A^(*)\), \(B^(*)\) et \(C^(*)\) les images de ses sommets. Faisons une transformation orthogonale \(g\) telle que \(g(A)=A^(*)\), et les points \(g(B)\) et \(g(C)\) se trouvent respectivement sur les rayons \(A^(*)B^(*)\) et \(A^(*)C^(*)\). (Cela peut facilement être réalisé, comme dans le théorème 1, par translation parallèle, rotation et symétrie axiale.)

Soit \(\lambda=|A^(*)B^(*)|/|A^(*)g(B)|\), a \(\mu=|A^(*)C^(*) |/|A^(*)g(C)|\). Alors la contraction de \(p_(1)\) à la droite \(A^(*)C^(*)\) dans la relation \(\lambda\) transformera \(g(B)\) en \ (p_(1) g(B)=B^(*)\) et ne décalera pas les points \(A^(*)\) et \(g(C)\). De même, contracter \(p_(2)\) à la ligne \(A^(*)B^(*)\) transformera \(g(C)\) en \(p_(2)g(C)= C^ (*)\) et ne décalera pas les points de la ligne \(A^(*)B^(*)\).

Cela signifie que le produit \(p_(2)p_(1)g\) amène les points \(A\), \(B\) et \(C\) aux points \(A^(*)\) , \ (B^(*)\) et \(C^(*)\) ainsi que la transformation \(f\) qui nous est donnée. D'après ce qui a été prouvé précédemment, nous avons \(p_(2)p_(1)g=f\), comme requis.