Aller au contenu

Théorème de Cauchy-Lipschitz

Un article de Wikipédia, l'encyclopédie libre.

En mathématiques et plus précisément en analyse, le théorème de Cauchy-Lipschitz, appelé également théorème de Picard-Lindelöf ou théorème d'existence de Picard, concerne les solutions d'une équation différentielle. Sous certaines hypothèses de régularité[Note 1] de la fonction définissant l'équation, le théorème garantit l'existence d'une solution répondant à une condition initiale dite de Cauchy et l'unicité d'une solution maximale.

Certaines lois physiques, comme le principe fondamental de la dynamique, se traduisent par des équations différentielles vérifiant les hypothèses du théorème. Ce dernier assure alors le caractère déterministe du mécanisme décrit par la loi. Ce déterminisme ne se traduit pas toujours par une possibilité de prédiction, la théorie du chaos montre l'existence de possibles phénomènes fortuits[Note 2].

Selon les auteurs, le théorème de Cauchy-Lipschitz s'exprime de manière plus ou moins forte. Sous une forme plus élaborée, ce théorème assure que la solution varie continûment si la condition initiale est modifiée, et il en est de même si la fonction définissant l'équation dépend continûment d'un paramètre[Note 3]. Si l'équation est définie par une fonction de classe Cp, la solution est de classe Cp+1[Note 4]. Ce théorème peut encore être généralisé au cas où l'équation différentielle n'est plus à valeurs dans un espace vectoriel, mais dans une variété différentielle[Note 5].

Une première version est démontrée par Augustin-Louis Cauchy durant la première moitié du XIXe siècle, à l'aide d'une technique d'approximation découverte par Leonhard Euler au siècle précédent. Rudolf Lipschitz généralise l'énoncé en élargissant un peu la classe des équations qui s'y rapportent. Le théorème n'en reste pas moins uniquement un résultat d'existence locale. C'est à la fin de ce siècle que les techniques de démonstration, ainsi que l'énoncé du théorème, sont profondément modifiés. À la suite des travaux de Lazarus Fuchs, les mathématiciens Émile Picard, Paul Painlevé et Henri Poincaré développent une version moderne de l'analyse des équations différentielles. Cette vision permet d'apporter des éléments de réponse sur les solutions maximales, l'unicité et la régularité de la solution. Une version relativement moderne est publiée en 1894 par Ernst Lindelöf. Le théorème se démontre maintenant généralement à l'aide d'un théorème du point fixe et d'une approche topologique, classique en analyse fonctionnelle.

Cauchy développe une première version du théorème de l'article.
Les graphes des fonctions d'évolution des populations pour les équations de Lotka-Volterra forment une partition de .

Dans tout le reste de l'article, désigne un espace de Banach, un ouvert de et une fonction continue de dans . L'objectif est d'étudier l'équation différentielle du premier ordre suivante :

avec la condition de Cauchy C : x(t0) = x0, où le couple (t0x0) est un élément de Ω. (On ne se préoccupe que des équations différentielles d'ordre 1 parce que celles d'ordre n s'y ramènent.) On peut remarquer[1] que si f est une fonction de classe Cp, la dérivée de x l'est aussi, et les solutions sont donc de classe Cp+1.

Il existe plusieurs manières d'exprimer le théorème de Cauchy-Lipschitz, dont la forme suivante :

On déduit de ce théorème les corollaires suivants[4] :

  • Sous les mêmes conditions que le théorème, toute solution de l'équation différentielle (1) respectant la condition C et définie sur un intervalle est une restriction de la solution maximale.
  • Les graphes des solutions maximales forment une partition de Ω.

Lorsque l'ouvert Ω est un produit I × E, où I est un intervalle ouvert de R, le théorème de Cauchy-Lipschitz global apporte un complément :

  • Si f est lipschitzienne par rapport à la deuxième variable (localement par rapport à la première seulement), alors toute solution maximale est globale (c'est-à-dire définie sur I tout entier).

L'expression théorème de Cauchy-Lipschitz est aussi utilisée pour désigner d'autres résultats plus évolués. Il est possible de considérer non pas seulement la fonction solution s mais aussi la fonction qui au couple (xt) associe l'image de t par la solution égale à x à un instant initial t0. On obtient une fonction appelée flot. Si la fonction f est de classe Cp, le flot l'est aussi. Il est aussi possible d'étudier la régularité des solutions si la fonction f dépend d'un paramètre.

D'autres résultats, qui ne portent pas le nom de théorème de Cauchy-Lipschitz sont présentés dans le paragraphe : Généralisations.

Approche intuitive

[modifier | modifier le code]

L'idée à la base du théorème est la suivante[5] : Certaines équations différentielles possèdent des solutions stationnaires. Par exemple, l'équation possède la solution stationnaire pour la condition initiale . Pour une autre condition initiale , la solution stationnaire est atteinte au bout d'un temps infini, et la solution est unique. Cependant, si la solution stationnaire peut être atteinte en un temps fini, l'unicité est violée. Considérons par exemple l'équation

Pour la condition initiale , nous pouvons avoir la solution ou la solution

On peut noter que la fonction a une pente infinie en et ne respecte pas la condition de continuité de Lipschitz. La condition de continuité de Lipschitz élimine ce type d'équations différentielles.

Déterminisme et chaos

[modifier | modifier le code]
Henri Poincaré montre que le caractère déterministe d'une équation différentielle vérifiant le théorème de Cauchy-Lipschitz n'empêche pas l'impossibilité de certaines prédictions.

Pour le mathématicien Vladimir Arnold, « Les équations différentielles sont le pivot de la conception scientifique du monde »[6]. En physique, les équations différentielles vérifient de manière très générale les hypothèses du théorème de l'article[Note 6], il en est ainsi de celle qui régit la loi de la gravitation universelle ou l'interaction électromagnétique. Ces équations sont intrinsèquement déterministes et c'est l'une des conséquences du théorème de Cauchy-Lipschitz[7]. Ce déterminisme, c'est-à-dire la capacité de la physique à prévoir, par exemple la trajectoire des planètes, était connu bien avant le théorème. La célèbre citation de Voltaire l'atteste : « Mais en apercevant l’ordre, l'artifice prodigieux, les lois mécaniques et géométriques qui règnent dans l’univers […], je suis saisi d’admiration et de respect[8]. ». Il en déduisait que « le Chaos est précisément l'opposé de toutes les lois de la nature »[8]. Curieusement, les analyses fines de la fin du XIXe siècle démontrent la pertinence du caractère déterministe de ces lois physiques et réduisent cependant cette idée de Voltaire à l'état de chimère.

Les travaux mathématiques de cette époque montrent effectivement qu'une trajectoire, suivant une loi physique de cette nature, est unique et parfaitement déterminée[Note 7]. En revanche, les études de Poincaré sur la stabilité du système solaire mettent en évidence la faute de raisonnement. Ce mathématicien précise :

« Une cause très petite, qui nous échappe, détermine un effet considérable que nous ne pouvons pas ne pas voir, et alors nous disons que cet effet est dû au hasard. Si nous connaissions exactement les lois de la nature et la situation de l'univers à l'instant initial, nous pourrions prédire exactement la situation de ce même univers à un instant ultérieur. Mais, lors même que les lois naturelles n'auraient plus de secret pour nous, nous ne pourrons connaître la situation initiale qu'approximativement. Si cela nous permet de prévoir la situation ultérieure avec la même approximation, c'est tout ce qu'il nous faut, nous disons que le phénomène a été prévu, qu'il est régi par des lois ; mais il n'en est pas toujours ainsi, il peut arriver que de petites différences dans les conditions initiales en engendrent de très grandes dans les phénomènes finaux ; une petite erreur sur les premières produirait une erreur énorme sur les derniers. La prédiction devient impossible et nous avons le phénomène fortuit[9]. »

Le théorème de Cauchy-Lipschitz indique bien qu'une prévision parfaite est possible, mais uniquement sous réserve de connaître parfaitement la condition initiale. Certains systèmes dynamiques sont rapidement imprévisibles pour la raison qu'indique Poincaré. On utilise maintenant le terme de chaos pour décrire cette situation. Elle ne se produit pas systématiquement, le théorème de Poincaré-Bendixson précise un contexte où elle ne peut avoir lieu, mais les hypothèses sont restrictives et le résultat peu généralisable[Note 8].

Vocabulaire

[modifier | modifier le code]

Plusieurs termes ne sont pas nécessairement intuitifs, ce paragraphe en propose les définitions.

Vocabulaire générique aux équations différentielles

[modifier | modifier le code]

Une partie du vocabulaire utilisée pour exprimer le théorème est générique aux équations différentielles ou fonctionnelles. Le terme espace de Banach désigne un espace vectoriel normé et complet, c'est-à-dire que pour la métrique associée à la norme, toute suite de Cauchy converge. Un exemple simple est un espace vectoriel réel normé de dimension finie. Pour une compréhension plus facile, le lecteur peut imaginer que E désigne l'ensemble des nombres réels. Dans l'article, tous les espaces de Banach considérés sont des espaces réels.

  • Une solution, ou courbe intégrale[10] de l'équation (1) est une fonction d'un intervalle de R dans E dont le graphe est inclus dans Ω, et qui est solution de l'équation (1).

Équation différentielle autonome du premier ordre

[modifier | modifier le code]

Il existe un cas particulier, celui où la fonction f est définie sur un ouvert de E et non pas sur un ouvert de R×E. L'équation (1) s'écrit alors

Ω désigne un ouvert de E et l'équation est dite autonome.

Vocabulaire spécifique

[modifier | modifier le code]

D'autres termes sont plus spécifiquement utilisés dans le contexte du théorème de Cauchy-Lipschitz. L'équation différentielle (1) possède généralement plusieurs solutions. Pour cette raison, on ajoute parfois une condition particulière :

  • Une condition de Cauchy C est un couple (t0x0) élément de Ω. Une fonction s définie sur un intervalle de R et à valeurs dans E solution de l'équation (1) vérifie la condition de Cauchy C si l'intervalle de définition de s contient t0 et s(t0) = x0.

Remarque : À la place de l'expression condition de Cauchy, on parle parfois de condition initiale[10]. Les deux expressions sont synonymes.

Résoudre le problème de Cauchy[11] consiste à trouver une solution de l'équation (1) vérifiant la condition de Cauchy C. Cette définition est un peu intuitive. Si l'équation différentielle modélise un courant parcourant une étendue d'eau, c'est-à-dire qu'à l'instant t et au point x le courant est égal à f(t,x), il est possible de poser dans l'eau un bouchon à l'instant t0 au point x0, la trajectoire du bouchon est la solution de l'équation. Il existe bien une solution pour chaque couple (t0x0).

Une condition de Cauchy ne suffit pas à rendre la solution unique. Considérons l'ensemble S des solutions de l'équation (1) définies sur un intervalle. Cet ensemble est muni d'une relation d'ordre (partiel). Une solution s1 de S est plus petite qu'une solution s2 de S lorsque s2 est un prolongement de s1.

  • Une courbe intégrale de S est dite maximale si elle est maximale pour la relation d'ordre ci-dessus, c'est-à-dire qu'elle ne peut pas être prolongée en une solution définie sur un intervalle strictement plus grand.

Lorsque f ne remplit pas les conditions du théorème de Cauchy-Lipschitz, en utilisant une forme ou une autre de l'axiome du choix, on montre que toute solution dans S est majorée par une solution maximale (de)[12]. Par conséquent, tout problème de Cauchy possède une solution maximale, et s'il n'en possède qu'une alors elle est maximum (parmi les solutions de ce problème). L'article sur le théorème de Cauchy-Peano-Arzelà donne des exemples montrant que cette unicité n'est généralement pas garantie.

Lorsque tout problème de Cauchy associé à f possède une unique solution locale, on montre directement (sans axiome du choix) qu'il possède une solution maximum. Pour cela, il suffit que f soit suffisamment régulière :

  • La fonction f est dite :
    • lipschitzienne par rapport à la deuxième variable sur une partie W de Ω s'il existe une constante k telle que :
       ;
    • localement lipschitzienne par rapport à la deuxième variable[13] si tout point de Ω possède un voisinage sur lequel f est lipschitzienne par rapport à la deuxième variable ;

Lorsque l'ouvert Ω est un produit I × V, où I est un intervalle ouvert de R et V un ouvert de E, une solution de (1) est dite globale si elle est définie sur I tout entier. Une solution globale est évidemment maximale. Une hypothèse supplémentaire assure la réciproque :

  • La fonction f est dite lipschitzienne par rapport à la deuxième variable localement seulement par rapport à la première variable si tout point de I possède un voisinage J tel que, sur J×V, f soit lipschitzienne par rapport à la deuxième variable.

Exemples et usages

[modifier | modifier le code]

Champ constant

[modifier | modifier le code]

Dans cet exemple[14] E est égal au plan réel R2. L'équation différentielle est autonome ; elle s'écrit x' f(x) où f est la fonction constante de valeur le vecteur v de coordonnées (1, 0), sur Ω = ]–3, 3[2. Ce domaine de f est représenté par le carré bleu de la figure de droite. Une méthode de représentation de la fonction f consiste à dessiner les vecteurs f(x), où x est un point du domaine, en plaçant leurs origines au point x.

On recherche les solutions vérifiant la condition de Cauchy (0, x0), ici les coordonnées de x0 sont (–2, 2). Une solution s est de la forme :

La solution ne peut quitter le domaine Ω, en conséquence, la variable t prend nécessairement ses valeurs dans ]–1, 5[. La fonction f est bien continue et k-lipschitzienne en x, avec dans ce cas particulier k = 0. Le théorème de Cauchy-Lipschitz garantit qu'il n'existe qu'une unique courbe intégrale vérifiant une condition de Cauchy précise, comme ici celle donnée par le couple (0, x0). Le graphe de cette solution est représentée en vert sur la figure.

Équation linéaire

[modifier | modifier le code]

Le théorème de Cauchy-Lipschitz global s'applique : un problème de Cauchy associé à une équation différentielle linéaire possède une solution globale, dont toute autre solution est restriction.

Étude d'une courbe intégrale

[modifier | modifier le code]
Graphe de la fonction logistique.

Le théorème de Cauchy-Lipschitz peut être vu comme un outil permettant l'étude d'une courbe intégrale. Illustrons-le par l'exemple d'une fonction logistique, définie par le problème de Cauchy suivant :

L'équation différentielle s'écrit aussi x' = f(x) avec f(x) = x(1 – x). La fonction f est une fonction polynomiale de degré 2 de zéros 0 et 1 et positive entre ses racines. Le théorème de Cauchy-Lipschitz s'applique car f est continûment dérivable donc localement lipschitzienne : pour toute condition initiale, le problème de Cauchy possède une unique solution maximale. En particulier, toute solution de l'équation différentielle qui prend la valeur 0 ou 1 est constamment égale à cette valeur sur son intervalle de définition.

Soient s la solution maximale du problème de Cauchy ci-dessus et ]ab[ son intervalle de définition (avec –∞a < 0 < b +∞). D'après le théorème des valeurs intermédiaires, s(]ab[) est un intervalle. Il contient s(0) = 1/2 donc, d'après la remarque précédente, ne contient ni 0 ni 1, si bien qu'il est inclus dans ]0, 1[.

Le fait que s prenne ses valeurs entre 0 et 1 montre que sa dérivée est strictement positive. L'application s est donc strictement croissante sur ]ab[. Elle possède donc en b une limite à gauche c ∈ [1/2, 1] et sa dérivée a pour limite c(1 – c), ce qui prouve que b = +∞ (sans quoi, on pourrait prolonger s en une solution définie sur ]ab], ce qui contredirait la maximalité de s). Comme s est bornée, la seule valeur limite possible en +∞ de sa dérivée est 0, ce qui montre que c = 1. Le même raisonnement montre que a = –∞ (le domaine de définition de s est donc égal à R) et que la limite de s en –∞ est 0

Enfin, on remarque que la fonction qui à t associe 1 – s(–t) est une solution du même problème de Cauchy donc est égale à s, ce qui signifie que la fonction s – 1/2 est impaire. L'équation montre que le point d'abscisse 0 est l'unique point d'inflexion de la courbe et que la dérivée de s en 0 est égale à 1/4, ce qui permet d'établir son graphe, représenté à droite.

Dans le cas de l'exemple choisi, on peut résoudre l'équation différentielle et utiliser les méthodes classiques pour l'étude de la courbe intégrale, mais ce n'est pas toujours possible. Une équation différentielle n'a pas nécessairement des solutions s'exprimant sous la forme d'une expression algébrique construite à l'aide des fonctions élémentaires.

Théorème de Poincaré-Bendixson

[modifier | modifier le code]
Dans le plan, une équation différentielle autonome du premier ordre converge vers un point ou un cycle limite, à l'image de l'exemple illustré ici.

L'usage du théorème de Cauchy-Lipschitz ne se limite pas à la résolution pratique des équations. Il sert aussi d'outil théorique, par exemple pour mieux comprendre le comportement qualitatif d'une équation différentielle. On peut considérer le cas d'une équation différentielle autonome dans R2 ayant une solution p périodique. La courbe intégrale est un lacet simple, c'est-à-dire que son graphe forme une boucle sans point double. Soit maintenant une condition de Cauchy C correspondant à un point à l'intérieur de la boucle. Le théorème de Cauchy-Lipschitz indique que la courbe intégrale maximale s vérifiant C ne pourra jamais traverser la boucle, si la fonction f définissant l'équation est localement lipschitzienne. La courbe s est donc bornée et si l'on suppose que le domaine de f contient l'intérieur de la boucle, la courbe s ne s'approche jamais trop du bord du domaine. Ceci suffit à démontrer que le domaine de définition de s est R tout entier.

Le théorème de Poincaré-Bendixson permet d'aller plus loin. Il indique que soit la courbe s est convergente, soit son comportement s'approche de plus en plus d'une fonction périodique. Cette configuration interdit les trajectoires chaotiques.

L'usage fait ici du théorème permet de comprendre qualitativement le comportement d'une courbe intégrale. Pour l'étude d'équations différentielles plus complexes, par exemple certains systèmes dynamiques, cette approche est indispensable. Il n'est en effet plus toujours possible de résoudre explicitement ces équations, ni même d'approcher leur solutions sur des longues périodes de temps.

Fragments d'histoire

[modifier | modifier le code]
Après avoir étudié de nombreux cas particuliers, Euler étudie sous sa forme générale, l'équation différentielle du premier ordre.

L'origine de la question traitée par le théorème est ancienne, elle porte initialement le nom de « problème inverse des tangentes »[15]. À chaque point de l'espace, une droite est associée, le problème à résoudre est de trouver la courbe ayant, comme tangente en chaque point, une de ces droites, ce qui correspond en termes modernes à une équation différentielle autonome. Kepler est un initiateur de cette question[source insuffisante] dans une étude sur la contenance d'un tonneau de vin en 1615[16]. Si cette question est abordée par des mathématiciens comme Descartes, Fermat ou Roberval, qui développent cette approche dans des cas particuliers durant le XVIIe siècle, le progrès essentiel est l'œuvre de Newton et Leibniz avec la découverte du calcul infinitésimal[17]. Newton cherche surtout à obtenir un résultat à l'aide d'une série, Leibnitz recherche aussi des solutions exactes, sous forme de primitives de fonctions connues[18].

Le siècle suivant est l'objet d'une systématisation de l'étude. Dans un premier temps « Des trésors d'ingéniosité ont été dépensés pour ramener à des quadratures d'innombrables équations différentielles particulières et comme l'écrit Paul Painlevé : la vague s'arrêta quand tout ce qui était intégrable, dans les problèmes naturels fut intégré. »[18]. Euler, en 1768 étudie la manière d'approcher une solution[19]. Il étudie le cas particulier x'(t) = f(t) et cherche une solution sur un intervalle [ab]. Pour ce faire, il partitionne l'intervalle à l'aide d'une suite a0 = a, a1, ..., an = b et, si c est élément de l'intervalle [aiai+1], il propose l'approximation suivante :

Dans le cas plus général de l'équation x'(t) = f(t, x(t)), il utilise la même méthode, qui donne :

Euler ne se pose pas la question de la convergence si le découpage est de plus en plus fin.

Les apports de Cauchy et de Lipschitz

[modifier | modifier le code]
Rudolf Lipschitz redémontre le résultat de Cauchy.

Augustin Louis Cauchy (1789 - 1857) établit les premiers résultats généraux. Dans un premier temps, il précise sa méthode : « Dans mes leçons données à l'École Polytechnique, comme dans la plupart des ouvrages ou mémoires que j'ai publiés sur le calcul intégral, j'ai cru devoir renverser cet ordre et placer en premier lieu la recherche, non pas des intégrales générales, mais des particulières ; en sorte que la détermination des constantes ou des fonctions arbitraires [pour l'équation aux dérivées partielles] ne fût plus séparée de la recherche des intégrales[20]. » Ce que Cauchy décrit ici est la démarche formalisée par le problème de Cauchy.

À l'aide de la formalisation de la notion de limite par Bolzano, son approche lui permet d'aller plus loin. La question x' f(x) sur l'intervalle [ab], si on lui ajoute la condition de Cauchy x(a) = x0, change de nature. Ce n'est plus la recherche d'une primitive de f, mais le calcul d'une intégrale. Il montre que, avec les notations du paragraphe précédent, si ai + 1 – ai tend vers 0 et si f est continue, l'approximation converge. Plus précisément, il applique cette démarche à l'équation x' (t) = f(t, x(t)) dans le cas où f, ainsi que sa différentielle partielle par rapport à la seconde variable, sont continues et bornées : avec les mêmes conditions, on obtient encore une convergence. C'est la première version du théorème, démontrée par Cauchy dès 1820[21]. En 1835, sa méthode est généralisée aux fonctions holomorphes[22].

Rudolf Lipschitz (1832 - 1903), sans manifestement connaître la teneur des travaux de Cauchy, démontre un théorème « essentiellement équivalent[23] » au théorème local de son prédécesseur, en introduisant la condition qui porte maintenant son nom[24]. Cauchy utilisait cette condition en la déduisant de son hypothèse sur la différentielle partielle de f, à l'aide de l'une de ses découvertes, qu'il affectionne particulièrement : le théorème des accroissements finis[25].

Le formalisme moderne

[modifier | modifier le code]

La fin du XIXe siècle voit une profonde mutation du théorème, tant dans la manière de le démontrer que dans l'enrichissement de son contenu, nécessaire pour mieux comprendre l'équation différentielle.

À la suite des travaux de Fuchs[26], les objectifs deviennent plus ambitieux. Paul Painlevé et Émile Picard s'intéressent au cas général des équations différentielles de premier et second ordre et donc à leurs singularités[27],[28]. Les objectifs d'Henri Poincaré sont encore plus généraux. À la suite d'une étude sur la stabilité du système solaire, il cherche à établir une théorie générale qui prendra le nom de système dynamique. Devant l'impossibilité d'établir des solutions explicites, Poincaré fonde les bases d'une théorie qualitative[29]. Les objectifs sont, dans un premier temps l'étude des singularités, puis le comportement asymptotique (c'est-à-dire l'étude du comportement une fois le système stabilisé) et la sensibilité à la condition initiale.

Pour atteindre ces nouveaux objectifs, la formulation par Cauchy ou Lipschitz du théorème devient insuffisante. On cherche maintenant des éléments de réponse globaux sur les courbes intégrales et non plus uniquement un résultat local. Les questions sur la régularité de la solution deviennent essentielles. Enfin, on cherche à déterminer la nature de la modification de la courbe intégrale en fonction d'une modification de la condition initiale ou d'un paramètre de l'équation[30]. Les méthodes pour y arriver diffèrent radicalement de l'approche de Cauchy qui étudiait le comportement limite de la fonction polygonale imaginée par Euler. Elles se rapprochent de l'analyse fonctionnelle, le contexte de l'étude étant maintenant un espace de fonctions disposant de propriétés géométriques. Le théorème à la source de la démonstration est celui du point fixe. Sa forme initiale est l'œuvre de Picard[31]. Ce théorème est maintenant vu comme une propriété générale d'espaces vectoriels particuliers, formalisés par Stefan Banach. Son application au théorème de l'article est l'œuvre du mathématicien finlandais Ernst Lindelöf[32] en 1894. Pour cette raison, le théorème nommé en France d'après Cauchy et Lipschitz prend le nom, en anglais, de Picard–Lindelöf theorem[33].

Généralisations

[modifier | modifier le code]

Il existe de nombreuses généralisations du théorème de Cauchy-Lipschitz. Les techniques utilisées pour sa démonstration permettent d'aller plus loin dans l'analyse des solutions d'une équation différentielle. Une rapide analyse montre qu'une solution est continûment dérivable, mais rien n'indique ce qui se produit si la fonction f est plus régulière. La branche des mathématiques étudiant un système dynamique se pose deux questions essentielles : quel est le comportement d'une courbe intégrale si t s'approche des bornes du domaine de définition ? Et quelle est la sensibilité à la condition initiale ? c'est-à-dire que se passe-t-il si x0 subit une petite modification.

Enfin, l'article suppose que l'ensemble E est un espace de Banach, ce qui n'est pas l'unique cas étudié. Dans certaines situations, il est utile de considérer E comme une variété différentielle. Les théorèmes se transposent aisément dans ce nouvel univers[34].

Pour l'étude de la sensibilité initiale, on étudie le flot qui permet d'énoncer une version plus forte du théorème de l'article.

L'un des objectifs de l'étude des systèmes dynamiques est celle de la sensibilité à la condition de Cauchy. Le vocabulaire et la représentation géométrique sont un peu différents de ce qui a été utilisé jusqu'à présent. Pour en comprendre l'origine, le plus simple est d'imaginer que Ω est un plan d'eau et que R représente le temps. Le plan d'eau est agité par un courant, représenté par la fonction f, appelé champ de vecteurs. En dimension 2, on représente ce champ de vecteurs en associant à certains points x de E une représentation graphique du vecteur f(x) (si le champ de vecteurs ne dépend pas du temps t), à l'image de la figure de droite. Une courbe intégrale satisfaisant à la condition de Cauchy C peut s'imaginer comme la trajectoire d'un bouchon placé dans l'eau à l'instant t0 à la position x0. Pour connaître d'un seul coup toutes les solutions de l'équation différentielle, il suffit de connaître le mouvement de la surface de l'eau, appelé flot, coulée ou encore courant[35].

Avec ce concept, le théorème de Cauchy-Lipschitz prend une nouvelle forme :

Si f est continue et localement lipschitzienne par rapport à la deuxième variable, le flot est continu, dérivable par rapport à la première variable et localement lipschitzien par rapport à la deuxième.

Il est possible d'aller plus loin si f est plus régulière.

Si f est de classe Cp, le flot l'est aussi.

Cette forme du théorème est plus forte que la précédente. Elle montre la régularité des solutions sous l'action d'une petite modification de la condition de Cauchy. Cet énoncé garantit l'absence d'une certaine forme de chaos. Les bifurcations sont impossibles et, sous réserve que t ne grandisse pas trop, les trajectoires restent proches si la condition de Cauchy est peu modifiée. Néanmoins, si le champ de vecteurs évolue avec le temps ou si E est de dimension strictement supérieure à deux, une autre forme de chaos peut s'installer.

Les formes précises des théorèmes et les démonstrations sont données dans l'article détaillé.

Théorème de Cauchy-Peano-Arzelà

[modifier | modifier le code]
Une bille roulant sur un demi-cylindre.

À la fin du XIXe siècle, Giuseppe Peano, un mathématicien italien, s'interroge sur les généralisations possibles du théorème de Cauchy-Lipschitz sous des hypothèses plus faibles[36] : que se passe-t-il si la fonction f, définissant l'équation (1), reste continue mais n'est pas localement-lipschitzienne par rapport à la deuxième variable ?

Une situation physique correspondant à ce cas est une bille roulant sans frottement sur l'arête d'un toit en V inversé aux branches de pente constante. Notons x la coordonnée transversale (perpendiculairement à l'arête) et y la coordonnée longitudinale (parallèlement à l'arête). En appliquant les lois de la mécanique, on obtient une équation différentielle autonome du premier ordre dans R2, si l'on ne considère que les solutions qui penchent vers les valeurs positives de x :

Si t0 désigne un réel positif, toutes les solutions suivantes vérifient l'équation précédente, pour la même condition de Cauchy, à savoir que le solide est à l'instant 0, à la position (0,0) :

D'autres exemples sont donnés dans l'article détaillé.

Ici, on remarque que si l'unicité n'est plus valable, l'existence reste vraie. De manière plus générale, si la fonction f de l'équation (1) est continue et bornée et si E est de dimension finie, l'existence d'une solution est garantie. Ce résultat est appelé théorème de Cauchy-Peano-Arzelà.

Quand on lui adjoint le critère d'unicité d'Osgood[37], on obtient la même conclusion que Cauchy-Lipschitz, sous des hypothèses plus faibles.

Extension aux équations aux dérivées partielles

[modifier | modifier le code]

La généralisation du théorème pour les équations aux dérivées partielles suppose des hypothèses plus fortes pour un résultat plus faible. La fonction f définissant l'équation doit être analytique ainsi que les conditions aux limites qui remplacent celle de Cauchy. Aucune information n'est fournie dans le cas d'une modification des conditions aux limites ou d'un paramètre. Ce théorème est appelé : théorème de Cauchy-Kowalevski.

Démonstrations

[modifier | modifier le code]

Les preuves du théorème utilisent de façon fondamentale un théorème d'analyse fonctionnelle : ou bien le théorème d'Ascoli[38], ou bien le théorème du point fixe de Banach. C'est le second qui sera invoqué ici.

La suite (u n) converge uniformément sur un intervalle contenant [-5/2, 5/2]. La limite est illustrée en rouge.

Pour comprendre le mécanisme de la preuve, reprenons l'exemple de l'équation différentielle définissant la courbe logistique, avec la condition de Cauchy C :

.

On définit une suite de fonctions polynomiales (un) par récurrence :

Sur l'intervalle [–5/2, 5/2], la suite (un) converge uniformément. Sa limite est un point fixe de la fonction φ qui à une fonction continue f de [–5/2, 5/2] dans R associe la fonction φf :

.
En réitérant la même méthode, on finit par obtenir une solution maximale.

En dérivant l'égalité φu = u, on vérifie que u est bien une solution de l'équation différentielle étudiée et par construction u(0) = 1/2. Cette démarche est celle de la démonstration de Lindelöf. Il constate que si l'intervalle est bien choisi, la fonction φ vérifie la condition de Lipschitz avec un coefficient strictement plus petit que 1, elle est donc contractante, ce qui permet de faire usage du théorème du point fixe. Comme une application contractante n'admet qu'un unique point fixe, l'unicité d'une solution locale est démontrée.

Cette méthode permet de trouver localement une solution. En revanche, pour la valeur 3, la suite (un) diverge. Cependant rien n'empêche de répéter la même démarche avec les deux conditions de Cauchy (5/2, u(5/2)) et (–5/2, u(–5/2)), il devient ainsi possible de prolonger la solution. Quitte à réitérer la démarche une infinité de fois, on finit par obtenir une solution maximale.

L'intérêt de la démarche est surtout théorique. Dans le cas particulier de l'exemple, il est aisé d'intégrer directement l'équation différentielle. Dans le cas général, il existe des méthodes plus rapides pour obtenir une approximation de la solution, comme celle d'Euler décrite dans la partie « Fragments d'histoire » ou encore celle de Runge-Kutta. En revanche, il est possible de démontrer dans le cadre général du théorème de l'article qu'une fonction construite de la même manière que φ est contractante, ce qui montre l'existence et l'unicité d'un point fixe, solution de l'équation différentielle. Cette démarche, caractéristique de l'analyse fonctionnelle, permet donc de démontrer un résultat plus fort que celui qu'avait démontré Cauchy.

Solution locale

[modifier | modifier le code]

L'objectif de ce paragraphe est d'expliquer la méthode permettant de montrer[39] que l'équation (1) admet localement une unique solution satisfaisant la condition de Cauchy C. Par translations, on se ramène sans peine au cas (t0, x0) = (0, 0). La condition C s'écrit alors : x(0) = 0.

On suppose que f est localement lipschitzienne par rapport à la seconde variable et continue[Note 9]. Comme Ω est un ouvert, il existe un réel strictement positif a tel que le produit du segment [–a, a] par la boule fermée B de centre 0 et de rayon a soit inclus dans Ω et tel que sur ce produit, f soit k-lipschitzienne par rapport à la deuxième variable pour un certain k, et de norme majorée par un réel m. Soit enfin ba un réel strictement positif, assez petit pour que bma et bk < 1. Ce réel b permet de définir un espace F de fonctions sur lequel on construit une application Φ satisfaisant au théorème du point fixe :

  • F est l'espace des applications continues de [–bb] dans B, muni de la norme de la convergence uniforme. Il est complet car B l'est
  • Φ est l'application qui à toute fonction u de F associe la fonction Φu définie par intégration (à valeurs dans E) :

On démontre alors[39] que la fonction Φ est à valeurs dans F, et qu'elle est bk-lipschitzienne donc contractante, puisque bk < 1.

Les hypothèses du théorème du point fixe étant réunies, on en déduit que Φ admet un unique point fixe dans F. D'après le théorème fondamental de l'analyse (étendu aux espaces de Banach), cela revient à dire que le problème de Cauchy admet sur [–bb] une unique solution à valeurs dans B.

On montrerait de même que pour tout ε de [0, b], il existe sur [–ε, 0] et sur [0, ε], une unique solution à valeurs dans B du problème de Cauchy. Pour finir de démontrer l'unicité locale à gauche et à droite, on montre de plus[39] qu'une solution sur [–ε, 0] ou [0, ε] du problème de Cauchy est nécessairement à valeurs dans B.

Tout ceci se résume en un premier théorème :

Théorème de Cauchy-Lipschitz local —  Il existe sur [–bb] une solution du problème de Cauchy constitué de l'équation (1) et de la condition initiale C, et toute solution sur un sous-intervalle (contenant 0) en est une restriction.

Une méthode pratique pour trouver le point fixe est de construire une suite (un) qui vérifie la relation de récurrence : un+1 = Φun, la suite converge nécessairement vers le point fixe. Cette technique est celle utilisée dans le préambule.

Solution maximale

[modifier | modifier le code]

À l'exception de l'unicité de la solution locale, le paragraphe précédent résume le résultat démontré à l'époque de Cauchy. Il n'offre aucune information sur l'existence ou l'unicité d'une solution maximale vérifiant la condition de Cauchy C. Ces résultats, plus tardifs, sont les deux points suivants, qui se déduisent[39],[40] respectivement de l'existence et de l'unicité du théorème local ci-dessus :

Corollaire — 

  • L'intervalle de définition d'une solution maximale de l'équation (1) est ouvert.
  • Il existe une unique solution maximale du problème de Cauchy constitué de l'équation (1) et de la condition C.

Autrement dit, (cf. § « Vocabulaire spécifique ») : ce problème possède une solution non seulement maximale mais maximum, c'est-à-dire dont toute solution définie sur un intervalle est une restriction. Ainsi, grâce à l'unicité locale, on a redémontré directement à peu de frais que toute solution possède un prolongement en une solution maximale.

Équation différentielle non autonome

[modifier | modifier le code]

Signalons accessoirement qu'à l'aide d'un jeu d'écriture, il est possible de généraliser le cas particulier des équations autonomes aux équations dépendantes du temps. Soit

.

En désignant par y0 le point (t0x0) de Ω, on considère le problème de Cauchy suivant :

La fonction g est localement lipschitzienne dès que f l'est[41]. Cependant, le théorème général ne se déduit pas immédiatement de cette remarque car son énoncé ne suppose pas que f est localement lipschitzienne, mais seulement qu'elle est continue et localement lipschitzienne par rapport à sa deuxième variable.

Solutions maximales et solutions globales

[modifier | modifier le code]

On suppose ici que l'ouvert Ω est de la forme I × E, où I est un intervalle ouvert de R. Toute solution globale (c'est-à-dire définie sur I tout entier) de l'équation (1) est évidemment maximale, mais la réciproque est fausse en général, comme le montre l'exemple de l'équation x' = x2. Divers théorèmes « d'échappement » ou « d'explosion », parfois joints au lemme de Grönwall, donnent des conditions suffisantes pour une telle réciproque, le plus connu étant le lemme des bouts, ou théorème d'explosion en temps fini. L'énoncé suivant, qui suffit par exemple dans la théorie des équations différentielles linéaires, se démontre directement[42] :

Théorème de Cauchy-Lipschitz global — Si f (définie sur I × E) est, localement par rapport à sa première variable, lipschitzienne par rapport à la seconde, alors toute solution maximale de (1) est globale.

Notes et références

[modifier | modifier le code]
  1. La régularité minimale demandée est la continuité de la fonction et son caractère localement lipschitzien par rapport à la deuxième variable.
  2. Ou, plus précisément, impossibles à prévoir compte tenu d'imprécisions inévitables dans les mesures, et du phénomène de sensibilité aux conditions initiales.
  3. Ces deux aspects ne sont pas traités dans cet article, mais dans l'article « Flot ».
  4. Ceci n'est vrai que si l'équation est sous forme « résolue », c'est-à-dire si elle est donnée sous la forme x' f (tx), et non sous une forme « implicite » comme f (txx' ) = 0.
  5. Cet aspect n'est pas traité dans cet article.
  6. Il existe des exceptions, cf. § Théorème de Cauchy-Peano-Arzelà.
  7. Les références sont données dans la partie histoire.
  8. Les idées de ce paragraphe proviennent de : A. D. Dalmedico, J.-L. Chabert, K. Chemla, Chaos et déterminisme, Seuil, 1992 (ISBN 2020151820), où elles sont largement développées.
  9. Compte tenu de la condition de Lipschitz précédente, la continuité de f par rapport à sa première variable suffit à assurer sa continuité par rapport au couple : voir par exemple cet exercice corrigé de la leçon « Topologie générale » sur Wikiversité.

Références

[modifier | modifier le code]
  1. Voir par exemple cet exercice corrigé de la leçon « Calcul différentiel » sur Wikiversité.
  2. On trouve ce résultat ainsi que les différents corollaires dans Berger Gostiaux, p. 42-52.
  3. On trouve l'étude du théorème à l'aide de ces hypothèses dans Mercier 2006, p. 354.
  4. H. Cartan, Cours de calcul différentiel, Hermann, (1re éd. 1977), 355 p. (ISBN 978-2-7056-6702-3).
  5. V. Arnold, Équations différentielles ordinaires, Éditions Mir, 1968.
  6. Cette citation est extraite de Leborgne 1982, p. 218.
  7. Pour plus de précision, voir : V. Arnold, Mathematical Methods of Classical Mechanics, Springer-Verlag (2e éd 1989) (ISBN 0387968903).
  8. a et b Voltaire, Le philosophe ignorant, chap. XV et XIV, disponible sur Wikisource.
  9. H. Poincaré, Science et Méthode, 1908, livre 1, chap. IV : Le hasard, p. 68.
  10. a et b Berger Gostiaux, p. 40.
  11. Mawhin 1988, p. 233.
  12. Mercier 2006, p. 358 et Laudenbach 2009, p. 2 invoquent le lemme de Zorn. Demailly 2006, p. 128 utilise implicitement l'axiome du choix dépendant ; si E=R (ou plus généralement un espace de dimension finie), l'axiome du choix n'est pas nécessaire ; voir à ce sujet cette discussion sur MathOverflow (en).
  13. Mercier 2006, p. 355, Paulin 2008, p. 255-256.
  14. Il s'inspire du premier exemple donné dans Berger Gostiaux, 1.2.4.
  15. Mawhin 1988, p. 231.
  16. (la) J. Kepler, Nova Stereometria doliorum vinariorum, J. Plancus, 1615.
  17. A. Dahan-Dalmedico et J. Peiffer, Une histoire des mathématiques : Routes et dédales, [détail des éditions] p. 178-197.
  18. a et b Mawhin 1988, p. 232.
  19. (la) L. Euler, Institutionum calculi integralis, .
  20. Augustin Cauchy, « Note sur la nature des problèmes que présente le calcul intégral », dans Exercices d'analyse et de physique mathématique, vol. 2, Bachelier, , p. 230-237, rééd. dans Œuvres complètes, série 2, tome 12, 1916, p. 263-271.
  21. Mawhin 1988, p. 234, Chatterji 1998, p. 58-59, Kolmogorov et Yushkevich 1998, p. 86-95.
  22. Mawhin 1988, p. 235.
  23. Chatterji 1998, p. 58.
  24. (it) R. Lipschitz, « Disamina della possibilità d'integrare completamente un dato sistema di equazioni differenziali ordinarie », dans Annali di Matematica Pura ed Applicata, vol. 2, 1868-1869, p. 288-302, (fr) en 1876.
  25. Pierre Dugac, « Histoire du théorème des accroissements finis », Archives internationales d'histoire des sciences, vol. 30, no 105, 1980, p. 86-101.
  26. Pour Manheim, les travaux de Fuchs forment un pont entre les recherches fondamentales de Cauchy, Riemann, Abel et Gauss et la théorie moderne des équations différentielles découverte par Poincaré, Painlevé et Picard : (en) Jerome H. Manheim, « Fuchs, Immanuel Lazarus », dans Dictionary of Scientific Biography, 1970-1980 (ISBN 978-0-68410114-9).
  27. P. Painlevé, Leçons sur la théorie analytique des équations différentielles, Hermann, Paris, 1897.
  28. Émile Picard et Georges Simart, Théorie des fonctions algébriques de deux variables indépendantes, t. 1, Gauthier-Villars, 1897.
  29. J. Palis, « Une perspective globale pour la dynamique non-conservative », dans Annales de l'Institut Henri Poincaré (C) : Non Linear Analysis, 2005, p. 485-507.
  30. Pour une formulation moderne du théorème, voir Malliavin 1972, p. 293-301.
  31. Émile Picard, « Sur l'application des méthodes d'approximations successives à l'étude de certaines équations différentielles ordinaires », Journal de Mathématiques,‎ , p. 217 (lire en ligne).
  32. E. Lindelöf, « Sur l'application de la méthode des approximations successives aux équations différentielles ordinaires du premier ordre », CRAS, vol. 114,‎ , p. 454-457 (lire en ligne).
  33. Voir le théorème I.3.1 de (en) Earl A. Coddington et Norman Levinson, Theory of Ordinary Differential Equations, McGraw-Hill, , 429 p. (ISBN 978-0-07-099256-6).
  34. Leborgne 1982, p. 220-230.
  35. Leborgne 1982, p. 228.
  36. (it) G. Peano, « Sull’integrabilità delle equazioni differenziali del primo ordine », Atti Accad. Sci. Torino, vol. 21,‎ , p. 677-685.
  37. (en) Gerald Teschl, Ordinary Differential Equations and Dynamical Systems, Providence, AMS, , 356 p. (ISBN 978-0-8218-8328-0, lire en ligne), p. 58.
  38. Franck Boyer, « Agrégation externe de mathématiques – Équations différentielles ordinaires : 2.2.4 Existence : la preuve via la méthode d'Euler », , p. 8-9.
  39. a b c et d Voir par exemple Bernard Randé, Équations différentielles, Techniques Ingénieur (lire en ligne), p. 3-6 ou le chapitre « Équations différentielles » de la leçon de calcul différentiel sur Wikiversité.
  40. Berger Gostiaux, p. 45-46, dans le cas autonome.
  41. Voir Berger Gostiaux, p. 49, qui ne traite que ce cas.
  42. Voir par exemple le chapitre « Équations différentielles » du cours de calcul différentiel sur Wikiversité.

Ouvrages cités

[modifier | modifier le code]
  • Marcel Berger et Bernard Gostiaux, Géométrie différentielle : variétés, courbes et surfaces [détail des éditions]
    Ce livre présente une approche un peu plus complète que Arnaudiès 2000. Elle se limite au cas où E est un espace vectoriel de dimension finie, mais va plus loin que la présentation générale car traite aussi de l'équation sous forme de flot et montre la continuité du flot.
  • Srishti D. Chatterji, Cours d'analyse, vol. 3 : Équations différentielles ordinaires et aux dérivées partielles, PPUR, (lire en ligne)
  • Jean-Pierre Demailly, Analyse numérique et équations différentielles [détail des éditions]
  • (en) A. N. Kolmogorov et A. P. Yushkevich, Mathematics of the 19th Century, vol. 3 : Function Theory According to Chebyshev: Constructive Function Theory, Ordinary Differential Equations, Calculus of Variations, Theory of Finite Differences, Birkhäuser, (lire en ligne)
  • (en) S. Lang, Analysis, vol. II, Addison-Wesley,
    Cette référence est relativement complète, et d'orientation moins géométrique que Malliavin 1972.
  • François Laudenbach, « Équations différentielles », dans Nicole Berline et Claude Sabbah, Aspects des systèmes dynamiques, Éditions de l’École polytechnique, (ISBN 978-2-73021560-2), p. 1-16
  • D. Leborgne, Calcul différentiel et géométrie, PUF, (ISBN 978-2-13-037495-4)
    Ce livre suppose déjà connu le théorème dans le cas des espaces de Banach ; il le généralise aux variétés différentielles.
  • P. Malliavin, Géométrie différentielle intrinsèque, Hermann, (ISBN 978-2-7056-5696-6)
    Cette référence est encore plus complète, mais plus ardue que Lang 1977. On y trouve les démonstrations associées au cas où le champ de vecteurs est infiniment différentiable.
  • Jean Mawhin, « Problème de Cauchy pour les équations différentielles et théorie de l'intégration : influences mutuelles », Cahiers du séminaire d'histoire des mathématiques, vol. 9,‎ (lire en ligne)
  • Dany-Jack Mercier, L'épreuve d'exposé au CAPES mathématiques, vol. 2, Publibook, (ISBN 978-2-74833001-4)
  • F. Paulin, Topologie, analyse et calcul différentiel, École Normale Supérieure, (lire en ligne), chap. 7.5 (« Théorie de Cauchy-Lipschitz »), p. 255-272
    Ce cours propose une vision complète de la théorie. Elle est plus générale que l'article car elle traite aussi de l'équation différentielle linéaire et du flot.

Articles connexes

[modifier | modifier le code]

Bibliographie

[modifier | modifier le code]
  • J.-M. Arnaudiès, Équations différentielles de fonctions de variable réelle ou complexe, Ellipses, (ISBN 978-2-7298-0045-1)
    Ce livre présente une première approche du théorème. Il correspond à un contenu général sur les équations différentielles, commun à tous les cours de licences sur cette question.
  • S. Lang, Analyse Réelle, Paris, InterEditions, , 230 p. (ISBN 978-2-7296-0059-4)
    Ce livre est plus complet que Arnaudiès 2000, Berger&Gostiaux 1992 et Demailly 2006 puisque le cas général des espaces de Banach est traité, ainsi que le caractère Cp du flot.
  • Lev Pontriaguine, Équations différentielles ordinaires, Moscou, Éditions Mir, 1969
    Un des meilleurs livres, en français, sur le sujet avec un exposé très clair sur l'application de Poincaré utilisée dans la théorie du chaos.
  • Nicolas Rouche et Jean Mawhin, Équations différentielles ordinaires (vol. 1 : Théorie générale, vol. 2 : Stabilité et solutions périodiques), Masson, Paris, 1973

Liens externes

[modifier | modifier le code]

Mathématiques

[modifier | modifier le code]
  • A. Popier et O. Wintenberger, Équations différentielle, École Polytechnique
    Ce document propose une vision plus partielle de la théorie que Paulin 2008. Seule la régularité de la courbe intégrale est étudiée, celle du flot n'est pas abordée. En revanche, l'hypothèse de la seule continuité de f est étudiée et la version de Peano-Arzelà est démontrée.
  • N. Petit et P. Rouchon, Théorème de Cauchy, École des Mines de Paris, p. 203
    Ce document présente une vision plus simple. La méthode de l'approximation d'Euler est utilisée au détriment de celle du point fixe. Seuls les théorèmes d'existence de solutions intégrales sont traités.
  • R. Rolland, Équations différentielles ordinaires,
    Cours de niveau licence présentant tout d'abord une vision géométrique puis les théorèmes généraux (méthode du point fixe et méthode de compacité), les variations des intégrales en fonction des données, une première approche des méthodes numériques.