آمار, ریاضی 374 بازدید

یکی از شاخه‌های پر اهمیت ریاضی و نظریه‌های متعدد آن، تئوری به نام «نظریه ارگودیک» (Ergodic Theory) است. این نظریه مربوط به خصوصیات «سیستم‌های پویا» (Dynamic Systems) بوده و بخصوص در مباحث «فرآیندهای تصادفی» (Random Process) به کار گرفته می‌شود. به همین علت، در این نوشتار از مجله فرادرس به خاطر نقش نظریه ارگودیک در بیان رفتار سیستم‌های دینامیک، به بررسی این تئوری یا نظریه خواهیم پرداخت.

از آنجایی که نظریه ارگودیک، مانند «نظریه احتمال» (Probability Theory)، برحسب «اندازه» (Measure) بیان می‌شود، بهتر است ابتدا مطالب دیگر مجله فرادرس با عناوین  نظریه اندازه در ریاضیات — مفاهیم و کاربردها و فضای توپولوژیک در ریاضیات — به زبان ساده را مطالعه کنید. همچنین خواندن نوشتارهای اندازه لبگ در نظریه اندازه | به زبان ساده و مجموعه بورل در نظریه اندازه | به زبان ساده نیز خالی از لطف نیست.

نظریه ارگودیک چیست؟

همانطور که در ابتدای متن اشاره کردیم، هدف اصلی در «نظریه ارگودیک» (Ergodic Theory) بیان خصوصیات آماری و رفتار سیستم‌های پویا یا دینامیک در طول یا بازه زمانی طولانی است. در واقع در نظریه ارگودیک قرار است متوسط تغییرات چنین سیستم مورد بررسی قرار گیرد.

در این حوزه مطالعاتی، منظور از «خصوصیات آماری» (Statistical Properties)، خواصی است که از طریق معدل رفتار توابع مختلف در طول زمان، تغییرات سیستم دینامیک یا سامانه‌های پویا بیان می‌شود. این ویژگی‌ها ممکن است توزیع (Distribution)، «میانگین» (Mean) یا «واریانس» (Variance) و همچنین «همبستگی» (Correlation) نقاط فرآیند در نظر گرفته شوند. به یاد دارید که مشخصات یک «فرآیند تصادفی» (Random Process) یا «سری زمانی» (Time Series) به این مشخصات و ویژگی‌ها بستگی داشت.

henry poincare
هنری پوانکاره (Jules Henri Poincaré)، ریاضیدان فرانسوی

در «سیستم‌های پویای قطعی» (Deterministic Dynamical Systems) فرض می‌شود که معادلات تعیین کننده رفتار دینامیکی در حالت ایده‌آل، هیچ گونه آشفتگی تصادفی، یا در حقیقت متغیر تصادفی نوفه (Noise) را در بر نمی‌گیرند و همه تغییرات ناشی از رفتار سیستم پویا است. نظریه ارگودیک، مانند «نظریه احتمال» (Probability Theory)، مبتنی بر مفاهیم کلی «نظریه اندازه» (Measure Theory) است و مفاهیم اولیه و ویژگی‌های آن براساس مطالعه و بررسی مسائل فیزیک آماری صورت پذیرفته است.

اولین گام در مطالعات نظریه ارگودیک، نتیجه تحقیقات «هنری پوانکاره»  (Jules Henri Poincaré) بود که منجر به اثبات «قضیه برگشتی پوانکاره» (Poincare Recurrence Theorem) شد. از این جهت، قضیه «پوانکاره» مهم است که ادعا می‌کند تقریباً تمامی نقاط در هر زیر مجموعه از «فضای حالت» (Phase Space) در نهایت به مجموعه باز خواهند گشت.

جزئیات بیشتر در این زمینه توسط قضیه‌های مختلف نظریه ارگودیک ارائه می‌شود. این قضایا ادعا می‌کنند، تحت شرایط خاص، میانگین زمان یک تابع در طول مسیر، «تقریباً در همه جا» (Almost Every Where) وجود داشته و مرتبط با میانگین آن فضا است.

دو قضیه بسیار مهم در نظریه ارگودیک مطرح است. قضیه اول که به «قضیه بیرکهوف» (Birkhoff Theorem) معروف است در سال 1931 مطرح گردید. قضیه دوم نیز به «قضیه فون نویمان» (von Neumann Theorem) شهرت دارد که وجود «میانگین ​​زمان» (Time Average) را در طول هر مسیر مورد بررسی قرار می‌دهد. برای کلاس ویژه‌ای از سیستم‌های ارگودیک، این میانگین زمان، تقریباً برای همه نقاط اولیه یکسان است. به بیان آماری و طبق «نظریه آمار» (Statistical Theory)، سیستمی که برای مدت طولانی در حال تغییر است، حالت یا نقطه اولیه خود را فراموش می‌کند.

خواص قوی‌تر، مانند «ترکیب» (Mixing) و «توزیع به شکل یکنواخت» (Uniformly Distribution) سیستم‌های دینامیکی نیز در نظریه ارگودیک قابلیت مطالعات بیشتری دارند. طبقه‌بندی سیستم‌های از طریق نظریه اندازه‌، یکی دیگر از بخش‌های کاربردی در نظریه ارگودیک محسوب می‌شود که به فرایندهای تصادفی و نمایش سیستم‌های دینامیکی منجر خواهد شد.

مفهوم ارگودیک و فرض ارگودیک، مرکز و اساس کاربردی نظریه ارگودیک را تشکیل می‌دهند. ایده اصلی برای این منظور آن است که برای اغلب سیستم‌ها، میانگین زمانی برای ویژگی‌های آن‌ها با میانگین روی کل فضا برابر است. این موضوع نشانگر پایداری سیستم‌های دینامیکی خواهد بود.

George David Birkhoff
جورج دیوید بیرکهوف (George David Birkhoff)

تبدیل ارگودیک

معمولا هنگام صحبت از نظریه ارگودیک، پای مفهوم دیگری به نام «تبدیل ارگودیک» (Ergodic Transformation) نیز به میان می‌آید. تبدیل ارگودیک اغلب برای تحرک یا جابجایی عناصر یک مجموعه به کار می‌روند.

یک قابلمه پر از لوبیای داغ را در نظر بگیرید. اگر یک قاشق روغن زیتون به آن اضافه کنیم. تکرار تبدیل معکوس ارگودیک روی خوراک لوبیا، اجازه نمی‌دهد که روغن زیتون در یک محل خاص از ظرف باقی بماند و آن را تقریبا به طور یکنواخت در خوراک لوبیا پخش و توزیع می‌کند. از طرف دیگر تکرار این عمل باعث فشردگی یا انبساط هیچ یک از قسمت‌های خوراک لوبیا نیز نخواهد شد. در این صورت این تبدیل، حافظ اندازه یا همان چگالی خواهد بود.

تعریف رسمی تبدیل ارگودیک به صورت زیر است.

فرض کنید که $$T$$ یک تبدیل از $$X$$ به $$X$$ است که «حافظ اندازه» (Measure-Preserving Transformation) روی فضای اندازه $$(X,\Sigma,\mu)$$ باشد. درست مانند فضای احتمال در نظر بگیرید که $$\mu(X) = 1$$ باشد. در این صورت $$T$$ را یک تبدیل ارگودیک می‌نامیم، اگر برای هر $$E$$ در $$\Sigma$$ که برایش $$T^{-1}(E) = E$$ باشد، آنگاه $$\mu(E) = 0 $$ یا $$\mu(E) = 1$$ است.

در ادامه چند مثال در این زمینه را مورد بررسی قرار خواهیم داد.

مثال ۱

یک چرخش روی دایره‌ای $$R/Z$$ را در نظر بگیرید. عناصر $$R/Z$$، مجموعه مقادیر یا اعداد گنگ هستند. این تبدیلات به صورت زیر در نظر گرفته می‌شوند.

$$ \large T_\theta : [0,1] \rightarrow [0,1],\quad T_\theta(x) \triangleq x + \theta \mod 1 $$

چنین تبدیلی یک تبدیل ارگودیک است. توجه داشته باشید که در اینجا $$\theta$$، یک «مقدار گنگ» (Irrational) است. در مقابل اگر $$\theta = \frac{p}{q}$$ یک عدد گویا باشد، آنگاه $$T$$ تناوبی بوده و دوره تناوب آن نیز $$q$$ خواهد بود. در نتیجه ارگودیک محسوب نمی‌شود.

irrational rotation
چرخش براساس زاویه گنگ $$\theta$$

مثال ۲

«جابجایی برنولی» (Bernoulli Shift)، که حالت تعمیم یافته فرآیند برنولی است دارای خاصیت ارگودیک است. جابجایی برنولی، یک «فرآیند تصادفی زمان-گسسته» (Discrete-time Stochastic Process) است که هر یک از متغیرهای تصادفی مستقل آن فقط یکی از مقادیر ۱ تا N را می‌گیرند.

فضای نمونه برای چنین فرآیندی به صورت زیر است.

$$ \large X = \{ 1 , \ldots  , N \}^{ { \mathbb {Z} } } $$

که البته به شکل زیر نیز قابل نمایش است.

$$ \large X = \{ x = (\ldots , x_{{-1}} , x_{0} , x_{1} , \ldots ) : x_{k} \in \{1 , \ldots , N \} \; \forall k \in {\mathbb {Z}} \} $$

اگر احتمال برای رخداد هر یک از این مقادیر را برابر $$p_i$$ در نظر بگیریم، شرط زیر برای مجموع آن‌ها صادق است.

$$ \large \sum_{{i = 1}}^{N}p_{i} = 1$$

به طور کلی می‌توان تبدیلات جابجایی که روی دنباله‌ای از متغیرهای تصادفی مستقل و هم توزیع (i.i.d. Random Variables) روی می‌دهند، یک تبدیل ارگودیک محسوب می‌شوند، به شرطی که «فرآیندهای ایستا» (Stationary Process) بوده و از «قانون صفر و یک کولموگروف» (Kolmogrov’ Zero-one Law)، تبعیت ‌کنند.

نکته: قضیه یا قانون صفر و یک کولموگروف مربوط به دنباله‌ای نامتناهی از پیشامدها است که در مورد احتمال رخداد پیشامدهای خاص در این دنباله بحث می‌کند. پیشامدهای مربوط به «قانون صفر و یک کولموگروف» را «پیشامدهای دمی» (tail Events) می‌نامند که احتمال رخداد آن‌ها به طور تقریبا همه جا، یا صفر است یا یک.

مثال ۳

ارگودیک بودن برای «سیستم‌های پویای پیوسته» (Continuous Dynamic System) به این معنی است مسیرها، همگی در فضای حالت گسترده شده‌اند. یک سیستم با «فضای حالت فشرده» (Compact Phase System) که انتگرال اولشان غیر ثابت باشد، ارگودیک محسوب نمی‌شود.

قضیه‌های ارگودیک

تبدیل $$T$$ که «حافظ اندازه» (Measure-Preserving Transformation) است را به شکل زیر روی فضای اندازه $$(X, \Sigma, \mu)$$ در نظر بگیرید.

$$ \large T : X \rightarrow X $$

همچنین فرض کنید که تابع $$f$$ یک تابع $$\mu$$-انتگرال‌پذیر است. به این معنی که $$f \in L^1(\mu)$$ است. میانگین‌های زیر را تعریف می‌کنیم.

میانگین زمان: این میانگین را به صورت مقدار متوسط (اگر موجود باشد) روی تکرارهای $$T$$ در نظر می‌گیریم که از نقطه آغازین $$x$$ شروع شده است.

$$ \large {\displaystyle {\hat{f}}(x) = \lim_{n \rightarrow \infty }\; {\frac{1}{n}} \sum_{k = 0}^{n – 1} f(T^{k}x)} $$

میانگین فضا: اگر $$\mu(X)$$ مقداری متناهی و مخالف صفر باشد، «میانگین فضا» (Space Average) یا «میانگین فاز» (Phase Average) برای تابع $$f$$ را به شکل زیر تعریف می‌کنیم.

$$ \large {\displaystyle {\bar{f}} = {\frac{1}{\mu (X)}} \int f \, d \mu \quad } $$

البته توجه داشته باشید که در «فضای احتمال» (Probability Space) برای اندازه $$\mu$$ داریم: $$\mu(X) = 1$$.

در حالت کلی میانگین زمان با میانگین فضا برابر نیست ولی اگر تبدیل $$T$$، یک «تبدیل ارگودیک» (Ergodic Transformation) و «حافظ اندازه» (Measure Invariant) باشد، میانگین زمان و فضا «تقریبا همه جا» (Almost Everywhere) با یکدیگر برابر خواهند بود.

نکته: قضیه ارگودیک شبیه «قضیه حد مرکزی» (CLT) یا «قانون قوی اعداد بزرگ» (Law of Large Numbers) برای دنباله‌ای از متغیرهای تصادفی است.

ergodic systems

تعریفی که در بالا ارائه شد، چکیده قضیه ارگودیک است که توسط «جورج دیوید بیرکهوف» (George David Birkhoff) ارائه شد. البته او در واقع این موضوع را نه از طریق حل در حالت مجرد، بلکه برای حالتی از سیستم‌های پویا و از طریق معادلات دیفرانسیل روی «سطح هموار منیفولد» (Smooth Manifold) مورد اثبات قرار داد. به این نکته نیز توجه داشته باشید که «قضیه توزیع در حالت یکنواخت» (Equidistribution Theorem)، حالت خاصی از قضیه ارگودیک بوده که براساس تابع توزیع احتمال و روی فاصله‌‌ای به طول یک نوشته می‌شود.

«قضیه ارگودیک قوی» (Strong Ergodic Theorem) یا «نقطه‌ای» (Pointwise) بیان می‌داد که حد معرفی شده در تعریف «میانگین زمان» برای تابع $$f$$ موجود بوده و حد تابع $$\hat{f}$$ نیز انتگرال‌پذیر است.

$$ \large {\hat{ f}} \in L^{1}( \mu ) $$

علاوه بر آن $$\hat{f}$$ یک تابع است که نسبت به تبدیل $$T$$، پایا است. به این ترتیب رابطه زیر تقریبا همه جا، برقرار است.

$$ \large {\hat f} \circ T = {\hat f} $$

البته اگر اندازه $$\mu$$، متناهی باشد، حالت نرمال شده رابطه بالا به صورت انتگرال زیر در خواهد آمد.

$$ \large \int {\hat f} \, d \mu = \int f \, d \mu $$

از طرفی برای آنکه $$T$$، ارگودیک باشد، لازم است $$\hat{f}$$، تقریبا همه جا ثابت باشد و در نتیجه داریم:

$$ \large {\bar f} = { \hat f} \, $$

توجه داشته باشید که رابطه بالا، «تقریبا همه جا» برقرار است. به این ترتیب اگر ادعای اول و دوم را در یک عبارت برای اندازه متناهی و غیر صفر $$\mu(X)$$ بنویسیم به رابطه زیر خواهیم رسید. بدیهی است که تساوی زیر تقریبا برای همه $$x$$ ها به جز آن‌هایی که اندازه صفر دارند، برقرار است.

$$ \large {\displaystyle \lim_{n \rightarrow \infty }\; {\frac {1}{n}} \sum_{k = 0}^{n – 1}f(T^{k} x) = {\frac {1}{\mu (X)}} \int f \, d \mu } $$

برای درک شهودی بهتر از قضیه ارگودیک به یک مثال توجه کنید.

مثال ۴

فرض کنید فضای اندازه $$(X, \Sigma , \mu)$$ برای مدل‌سازی حرکت ذرات در یک گاز ساخته شده است. همچنین تابع $$f(x)$$ را نشانگر سرعت حرکت یک ذره در موقعیت $$x$$ در نظر بگیرید. به کمک قضیه ارگودیک می‌توانیم بگوییم، اگر مدل دارای خاصیت ارگودیک باشد، آنگاه سرعت متوسط همه ذرات در یک بازه زمانی تقریبا همه جا برابر با متوسط سرعت یک ذره روی آن بازه زمانی است.

قضیه بیرکهوف و خینچین (Birkhoff-Khinchin Theorem)

تابع اندازه‌پذیر $$f$$ را در نظر بگیرید که $$E(|f|) < \infty$$ است. منظور از $$E(x)$$، امید ریاضی (Mathematical Expectation) متغیر تصادفی $$X$$ است.  همچنین تبدیل $$T$$ را یک نگاشت حافظ اندازه محسوب کنید. به این ترتیب با احتمال ۱، رابطه زیر برقرار خواهد بود.

$$ \large {\displaystyle \lim_{n \rightarrow \infty } \; {\frac {1}{n}} \sum_{k = 0}^{n – 1}f(T^{k} x ) = E(f \mid {\mathcal {C}})(x)} $$

نماد $$E(f\mid {\mathcal {C}})(x)$$ امید ریاضی شرطی تحت سیگما میدان $${\mathcal{C}}$$ روی مجموعه ناوردای $$T$$ محاسبه شده است.

نتیجه قضیه بیرکهوف و خینچین (قضیه ارگودیک نقطه‌ای)

اگر $$T$$ یک تبدیل ارگودیک و $${\mathcal{C}}$$، سیگما-میدان بدیهی روی $$T$$ باشد، آنگاه با «احتمال یک» (With Probability One)، رابطه زیر برقرار خواهد بود.

$$ \large {\displaystyle \lim_{n \rightarrow \infty } \; {\frac {1}{n}} \sum_{k = 0}^{n – 1}f(T^{k}x) = E(f) }$$

خلاصه و جمع‌بندی

در این نوشتار مفهوم‌هایی مربوط با نظریه ارگودیک و خاصیت بازگشتی (Recurrence) برای فرآیندها یا سیستم‌های دینامیک و پویا مورد بررسی قرار گرفت. شرایط مربوط به وجود خاصیت ارگودیک برای چنین فرآیندهایی نیز مشخص شد. همانطور که دیدید، بحث مربوط به خاصیت ارگودیک ابتدا برای سیستم‌های پویا و معادلات دیفرانسیل روی منیفلودهای هموار مطرح و مورد بررسی قرار گرفت. در نوشتار دیگری از مجله فرادرس به فرآیندهای ارگودیک و ویژگی‌های اساسی آن‌ها خواهیم پرداخت.

اگر این مطلب برای شما مفید بوده است، آموزش‌ها و مطالب زیر نیز به شما پیشنهاد می‌شوند:

آرمان ری بد (+)

«آرمان ری‌بد» دکتری آمار در شاخه آمار ریاضی دارد. از علاقمندی‌های او، یادگیری ماشین، خوشه‌بندی و داده‌کاوی است و در حال حاضر نوشتارهای مربوط به آمار و یادگیری ماشین را در مجله فرادرس تهیه می‌کند.

بر اساس رای 2 نفر

آیا این مطلب برای شما مفید بود؟

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *