変分法

汎函数の最大化や最小化を扱う分野
変分問題から転送)

解析学の一分野、変分法(へんぶんほう、: calculus of variations, variational calculus; 変分解析学)は、汎函数函数の集合から実数への写像)の最大化や最小化を扱う。汎函数はしばしば函数とその導函数を含む定積分として表される。この分野の主な興味の対象は、与えられた汎函数を最大・最小とするような「極値」函数、あるいは汎函数の変化率を零とする「停留」函数である。

そのような問題のもっとも単純な例は、二点を結ぶ最短の曲線を求める問題である。何の制約も無ければ二点を結ぶ直線が明らかにその解を与えるが、例えば空間上の特定の曲面上にある曲線という制約が与えられていれば、解はそれほど明らかではないし、複数の解が存在し得る。この問題の解は測地線と総称される。関連する話題としてフェルマーの原理は「光は二点を結ぶ最短の光学的長さを持つ経路を通る。ただし光学的長さは間にある物質によって決まる」ことを述べる。これは力学における最小作用の原理に対応する。

重要な問題の多くが多変数函数を含む。ラプラス方程式の境界値問題の解はディリクレの原理を満足する。 プラトーの問題英語版は空間内の与えられた周回路の張る面積が最小の曲面(極小曲面)を求める問題であり、しばしばその解を石鹸水に浸した枠が張る石鹸膜として見つけるデモンストレーションを目にする。こうした経験は比較的容易に実験できるけれども、その数学的解釈は簡単とはほど遠い(局所的に最小化する曲面は複数存在し得るし、非自明な位相を持ち得る)。

歴史

編集

変分法は、ヨハン・ベルヌーイが1696年に取り挙げた最速降下曲線問題によって始まったといわれている[1]。 この問題はすぐにヤコブ・ベルヌーイおよびロピタルの目に留まることになるが、1733年にレオンハルト・オイラーによって初めて詳細に述べられた。 ラグランジュはオイラーの著作に影響を受け、この理論へ大きく貢献した。 1755年に当時19歳だったラグランジュの研究を見た後、オイラーは自身の多少幾何学的であったアプローチを放棄し、ラグランジュによる純粋に解析的なアプローチを採用した。 そして、1756年の講義 "Elementa Calculi Variationum" において、このテーマを変分法と改名した[2][3]

ルジャンドルは1786年に最大値と最小値とを区別するための手法を確立したが、これは完全に十分なものとは言えなかった。 この主題に関しては、アイザック・ニュートンゴットフリート・ライプニッツも早くから注目していた[4]。 この判別法に対する貢献は、Brunacci英語版 (1810), ガウス (1829), ポアソン (1831), オストログラツキー (1834), ヤコビ (1837) など数多く存在する。 一般的である重要な成果として1842年におけるサラスの著作があり、これは1844年にコーシーによって要約・改良された。 その他にも重要な研究論文や回顧録が Strauch英語版 (1849), Jellett英語版 (1850), ルートヴィヒ・オットー・ヘッセ (1857), Clebsch英語版 (1858), Carll (1885) などに書かれているが、19世紀において最も重要な成果はおそらくワイエルシュトラスによるものである。 その高名な講座は画期的なものであり、彼によってこの理論は確固たる疑いようのない基礎の上に置かれたと言える。 1900年に発表されたヒルベルトの23の問題20番目英語版23番目英語版は、この分野の更なる発展を促した[4]

20世紀に入ると、ヒルベルトネーターレオニダ・トネリ英語版ルベーグアダマールらが多大な貢献をした[4]マーストン・モース英語版は、今日モース理論と呼ばれるものに変分法を応用した[5]ポントリャーギンラルフ・ロッカフェラー英語版および F. H. Clarke は、最適制御理論において変分法に対する新しい数学的な道具を開発した[5]リチャード・ベルマン動的計画法は、変分法の代替となるもののひとつである[6][7][8]

極値

編集

変分法は汎函数の極大と極小(総称して「極値」と呼ばれる)に注目する。函数が数値的な変数に依存して決まるのとある意味同じように、汎函数は函数に依存して決まり、またその意味で函数の函数としても記述される。 固定された定義域の上で定義された函数からなる函数空間が与えられたとき、その元を動く函数変数 y に関して汎函数は極値を持つ。汎函数 J[ y ] が函数 f において極値を持つとは、増分 ΔJ = J[y] - J[f]f の任意に小さな近傍に属する任意の y に対して同じ符号を持つときに言う[Note 1]。このとき函数 f は極値函数あるいは極値点 (extremal) と呼ばれる。極値 J[f] が極大であるとは f の任意に小さな近傍の各点において ΔJ ≤ 0 を満たすときに言う。また極小であるとは同様に ΔJ ≥ 0 であるときに言う。連続函数の空間に対して、対応する汎函数の極値は、連続函数の一階導函数が全て連続となるかまたは否かに従って、それぞれ弱極値 (weak extrema) または強極値 (strong extrema) と呼ばれる[10]

汎函数の強極値・弱極値はともに連続函数の空間に対するものだが、弱極値はその空間に属する函数の一階導函数が連続という追加の要件を持つ。強極値は弱極値でもあるが、逆は真ではない。強極値を求めることは弱極値を求めることよりも困難である[11]。弱極値を求めるために用いる必要条件の一つの例として、オイラー=ラグランジュ方程式がある[12] [Note 2]

変分および極小値に関するある十分条件

編集

変分法は、汎函数の引数である函数のわずかな変化によって生じる小さな変動としての汎函数の変分に注目する。一次変分[Note 3]は汎函数の増分の一次成分(線型部分)として定義され、二次変分[Note 4]は汎函数の増分の二次成分として定義される[13]

例えば J[y] は函数 y = y(x) を引数とする汎函数とし、h = h(x)y と同じ函数空間に属する函数として引数を y から y + h へわずかに変化させるとき、対応する汎函数の増分は ΔJ[h] = J[y + h] − J[y] で与えられる[Note 5]

汎函数 J[y]微分可能であるとは、線型汎函数 φ[h] が存在して[Note 6] ΔJ[h] = φ[h] + ε‖ h ‖ とできるときに言う。ただし、‖ h ‖hノルム[Note 7]であり、ε‖ h ‖ → 0 のとき ε → 0 を満たすものとする。このとき、線型汎函数 φJ[y]一次変分英語版とよび δJ と表す[17]:

 

また汎函数 J[y]二回微分可能とは、一次変分 φ1[h] および二次汎函数[Note 8] φ2[h] が存在して ΔJ[h] = φ1[h] + φ2[h] + ε‖ h ‖2 とできるときに言う。ただし、ε‖ h ‖ → 0 のとき ε → 0 である。二次汎函数 φ2J[y]二次変分と呼び、 δ2J と書く[19]:

 

二次変分 δ2J[h] が強く正 (strongly positive) であるとは、適当な定数 k > 0 が存在して、任意の h に対し δ2J[h] ≥ k‖ h ‖2 を満たすときに言う[20]

極小値の十分条件
汎函数 J[y]y = ŷ において極小となるには、y = ŷ において一次変分が δJ[h] = 0 かつ二次変分 δ2J[h] が強く正となることが十分である[21] [Note 9]

関連項目

編集

注釈

編集
  1. ^ f の近傍とは、与えられた函数空間の元 y で定義域の全体において |y - f| < h を満たすもの全体の成す部分集合を言う。ここで正の数 h は近傍の大きさを決める定数である[9]
  2. ^ 十分条件は後述
  3. ^ 一次変分 (first variation) は、変分、微分、一次の微分などとも呼ばれる。
  4. ^ 二次変分もまた二次の微分などとも呼ばれる。
  5. ^ 増分 ΔJ[h] および以下に現れる変分はy および h の双方に依存することに注意せよ。記述の簡素化のために、引数 y は省略されているが、例えば ΔJ[h]ΔJ[y; h] のように書くのが意味の上では自然である[14]
  6. ^ 汎函数 φ[h]線型とは、函数 h, h1, h2 と実数 αに関して、φ[αh] = αφ[h] および φ[h1 +h2] = φ[h1] + φ[h2] を満たすことを言う[15]
  7. ^ 函数 h = h(x) は実数 a, b に対して区間 axb 上で定義されているものとすると、h のノルムはその最大の絶対値 ‖ h ‖ = max{|h(x)| : axb}[16]
  8. ^ 汎函数が二次 (quadratic) であるとは、それが双線型汎函数の二つの引数を等しいと置いて得られることをいう。双線型汎函数は一方の変数について(他方の変数は固定して)それぞれ線型であることをいう[18]
  9. ^ 他の十分条件については Gelfand & Fomin 2000 を参照。弱極小値に対する十分条件は Chapter 5: "The Second Variation. Sufficient Conditions for a Weak Extremum". p. 116. の定理、強極小値に対する十分条件は Chapter 6: "Fields. Sufficient Conditions for a Strong Extremum". p. 148. の定理で与えられている。

出典

編集
  1. ^ Gelfand, I. M.; Fomin, S. V. (2000). Silverman, Richard A.. ed. Calculus of variations (Unabridged repr. ed.). Mineola, New York: Dover Publications. p. 3. ISBN 978-0486414485. http://store.doverpublications.com/0486414485.html 
  2. ^ Thiele, Rüdiger (2007). “Euler and the Calculus of Variations”. Leonhard Euler: Life, Work and Legacy. Elsevier. p. 249. ISBN 9780080471297. https://books.google.com/books?id=75vJL_Y-PvsC&pg=PA249 
  3. ^ Goldstine, Herman H. (2012). A History of the Calculus of Variations from the 17th through the 19th Century. Springer Science & Business Media. p. 110. ISBN 9781461381068. https://books.google.com/books?id=_iTnBwAAQBAJ&q=%22Indeed+after%22&pg=110 
  4. ^ a b c van Brunt, Bruce (2004). The Calculus of Variations. Springer. ISBN 0-387-40247-0 
  5. ^ a b Ferguson, James (2004). "Brief Survey of the History of the Calculus of Variations and its Applications". arXiv:math/0402357
  6. ^ Dimitri Bertsekas. Dynamic programming and optimal control. Athena Scientific, 2005.
  7. ^ Bellman, Richard E. (1954). “Dynamic Programming and a new formalism in the calculus of variations”. Proc. Nat. Acad. Sci. 40 (4): 231–235. PMC 527981. PMID 16589462. http://www.ncbi.nlm.nih.gov/pmc/articles/PMC527981/pdf/pnas00731-0009.pdf. 
  8. ^ Kushner, Harold J. (2004年). “Richard E. Bellman Control Heritage Award”. American Automatic Control Council. http://a2c2.org/awards/richard-e-bellman-control-heritage-award 2013年7月28日閲覧。  See 2004: Harold J. Kushner: regarding Dynamic Programming, "The calculus of variations had related ideas (e.g., the work of Caratheodory, the Hamilton-Jacobi equation). This led to conflicts with the calculus of variations community."
  9. ^ Courant, R; Hilbert, D (1953). Methods of Mathematical Physics. Vol. I (First English ed.). New York: Interscience Publishers, Inc. p. 169. ISBN 978-0471504474 
  10. ^ Gelfand & Fomin 2000, pp. 12–13
  11. ^ Gelfand & Fomin 2000, p. 13
  12. ^ Gelfand & Fomin 2000, pp. 14–15
  13. ^ Gelfand & Fomin 2000, pp. 11–12, 99
  14. ^ Gelfand & Fomin 2000, p. 12, footnote 6
  15. ^ Gelfand & Fomin 2000, p. 8
  16. ^ Gelfand & Fomin 2000, p. 6
  17. ^ Gelfand & Fomin 2000, pp. 11–12
  18. ^ Gelfand & Fomin 2000, pp. 97–98
  19. ^ Gelfand & Fomin 2000, p. 99
  20. ^ Gelfand & Fomin 2000, p. 100
  21. ^ Gelfand & Fomin 2000, p. 100, Theorem 2

関連文献

編集

外部リンク

編集