توزیع لجستیک و متغیر تصادفی آن — به زبان ساده

۱۵۶۱ بازدید
آخرین به‌روزرسانی: ۱۳ خرداد ۱۴۰۲
زمان مطالعه: ۵ دقیقه
دانلود PDF مقاله
توزیع لجستیک و متغیر تصادفی آن — به زبان ساده

در نظریه آمار و احتمال، توزیع لجستیک (Logistic Distribution) و متغیر تصادفی آن (Logistic Distribution Random Variable) از اهمیت زیادی برخوردار هستند. بخصوص در مبحث مربوط به رگرسیون لجستیک، از این توزیع و متغیر تصادفی آن بسیار استفاده می‌شود. متغیر تصادفی لجستیک، دارای یک توزیع پیوسته بوده و تابع توزیع احتمال تجمعی (Cumulative Distribution Function) آن یک تابع لجستیک (Logistic Function) است. جالب است که بدانید رگرسیون لجستیک در شبکه عصبی و دسته‌بندی (Classification) نیز به کار گرفته می‌شود.

997696

از آنجایی که در این نوشتار از متغیر تصادفی و تابع احتمال صحبت به میان خواهد آمد، بهتر است ابتدا مطلب متغیر تصادفی، تابع احتمال و تابع توزیع احتمال را مطالعه کرده باشید. همچنین اگر به رگرسیون لجستیک و خصوصیات آن علاقه‌مند باشید، می‌توانید مطلب رگرسیون لجستیک (Logistic Regression) — مفاهیم، کاربردها و محاسبات در SPSS را بخوانید.

توزیع لجستیک و متغیر تصادفی آن

توزیع متغیر تصادفی لجستیک، شبیه توزیع نرمال است ولی در دم‌ها، میزان احتمال بیشتر از توزیع نرمال است. بنابراین می‌توان توزیع لجستیک را در گروه توزیع‌های دم-سنگین در نظر گرفت. توزیع لجستیک نوع خاصی از «توزیع لاندا توکی» (Tukey Lambda Distribution) است.

به عنوان یک تعریف رسمی می‌توان گفت که متغیر تصادفی XX دارای توزیع لجستیک است اگر تابع چگالی احتمال (Probability Density Function) آن به صورت زیر نوشته شود.

f(x;μ,s)=e(xμ)/ss(1+e(xμ)/s)2=1s(e(xμ)/(2s)+e(xμ)/(2s))2=14ssech2(xμ2s)\large {\displaystyle {\begin{aligned}f(x;\mu ,s)&={\frac {e^{-(x-\mu )/s}}{s\left(1+e^{-(x-\mu )/s}\right)^{2}}}\\[4pt]&={\frac {1}{s\left(e^{(x-\mu )/(2s)}+e^{-(x-\mu )/(2s)}\right)^{2}}}\\[4pt]&={\frac {1}{4s}}\operatorname {sech} ^{2}\left({\frac {x-\mu }{2s}}\right)\end{aligned}}}

پارامترهای این توزیع μ\mu یا پارامتر مکان (Location) و ss نیز پارامتر مقیاس (Scale) بوده و تابع چگالی حول میانگین متقارن است. در نتیجه می‌توان گفت که میانگین (Mean)، میانه (Median) و نما (Mode) برای این متغیر تصادفی همگی با μ\mu برابر خواهد بود. تکیه‌گاه متغیر تصادفی لجستیک، مجموعه اعداد حقیقی است. بنابراین اگر متغیر تصادفی XX دارای توزیع لجستیک باشد، می‌نویسیم،

XLogistic(μ,s)\large X \sim \mathrm{Logistic}(\mu , s)

‌و می‌خوانیم XX دارای توزیع لجستیک با پارامترهای مکان μ\mu و مقیاس ss است.

از آنجایی که این تابع چگالی برحسب تابع «سکانت هایپربولیک» (Sech) است، گاهی به آن توزیع سکانت هایپربولیک (Hyperbolic Secant Distribution) نیز می‌گویند.

نکته: زمانی که میانگین توزیع صفر بوده (μ=0\mu=0) و پارامتر مقیاس نیز برابر با ۱ باشد (s=1s=1)، آنگاه توزیع لجستیک را استاندارد می‌نامیم و می‌نویسیم.

f(x;0,1)=ex(1+ex)2=1(ex/2+ex/2)2=14sech2(x2).\large {\displaystyle {\begin{aligned}f(x;0,1)&={\frac {e^{-x}}{(1+e^{-x})^{2}}}\\[4pt]&={\frac {1}{(e^{x/2}+e^{-x/2})^{2}}}\\[5pt]&={\frac {1}{4}}\operatorname {sech} ^{2}\left({\frac {x}{2}}\right).\end{aligned}}}

در تصویر ۱ نمودارهای چگالی احتمال متغیر تصادفی لجستیک با پارامترهای مختلف مرکزی و مقیاس نمایش داده شده است.

Logistic pd function
تصویر ۱: نمودارهای تابع چگالی احتمال متغیر تصادفی لجستیک با پارامترهای مکان و مقیاس مختلف

تابع توزیع تجمعی احتمال متغیر تصادفی لجستیک

توزیع لجستیک نام خود را از توزیع تجمعی (انباشته) گرفته است، که نمونه‌ای از خانواده توابع لجستیک است. به این ترتیب تابع توزیع تجمعی متغیر تصادفی XX به صورت زیر نوشته خواهد شد.

F(x;μ,s)=11+e(xμ)/s=12+12tanh(xμ2s)\large{\displaystyle F(x;\mu ,s)={\frac {1}{1+e^{-(x-\mu )/s}}}={\frac {1}{2}}+{\frac {1}{2}}\operatorname {tanh} \left({\frac {x-\mu }{2s}}\right)}

در تصویر ۲ نیز نمودار تابع توزیع تجمعی احتمال برای متغیر تصادفی لجستیک با پارامترهای مختلف ترسیم شده است. همانطور که انتظار داریم، شکل این منحنی‌ها به صورت SS بوده و کمترین مقدار برابر با صفر و بیشترین مقدار این تابع برابر با ۱ است. شیب این تغییرات وابسته با پارامتر مقیاس است به طوری که برای مقدار s=4s=4، شیب تغییرات کم بوده و به ازاء s=1s=1 شیب تغییرات، بیشتر است.

Logistic_cdf
تصویر ۲: تابع توزیع تجمعی لجستیک با پارامترهای مکان و مقیاس مختلف

ارتباط با توزیع‌های دیگر

توزیع متغیر تصادفی لجستیک با دیگر توزیع‌های آماری در ارتباط است. در ادامه به بعضی از این توزیع‌ها اشاره خواهیم کرد.

  • اگر XLogistic(μ,s)X\sim \operatorname{Logistic} (\mu , s) آنگاه kX+lLogistic(kμ+l,ks)kX+l\sim \operatorname{Logistic} (k\mu+l,ks)
  • اگر XU(0,1)X\sim \mathrm{U}(0,1) آنگاه μ+s(log(X)log(1X))Logistic(μ,s)\mu+s(\log(X)-\log(1-X)) \sim \operatorname{Logistic} (\mu,s).
  • اگر XGumbel(αX,s)X\sim \mathrm{Gumbel}(\alpha X,s) و YGumbel(αY,s)Y\sim \mathrm{Gumbel}(\alpha Y,s) آنگاه XYLogistic(αXαY,β){\displaystyle X-Y\sim \mathrm {Logistic} (\alpha _{X}-\alpha _{Y},\beta )\,}.
  • برای دو متغیر X و YGumbel(α,β) X \text{ و } {\displaystyle Y\sim \mathrm {Gumbel} (\alpha ,\beta )}، داریم X+YLogistic(2α,β) {\displaystyle X+Y\nsim \mathrm {Logistic} (2\alpha ,\beta )} به این معنی که مجموعه دو توزیع گامبل، دارای توزیع لجستیک نیست هر چند که تفاضل‌ آن‌ها دارای توزیع لجستیک است.
  • امید ریاضی در توزیع لجستیک خاصیت جمعی ندارد به این معنی که

E(X+Y)=2α+2βγ2α=E(Logistic(2α,β)) \large {\displaystyle \operatorname{E}(X+Y)=2\alpha +2\beta \gamma \neq 2\alpha =\operatorname{E}\left(\mathrm {Logistic} (2\alpha ,\beta )\right)}

  • اگر XLogistic(μ,s)X\sim \mathrm{Logistic}(\mu,s) آنگاه تابع نمایی از XX دارای توزیع لگ‌لجستیک خواهد بود.

exp(X)LogLogistic(α=eμ,β=1s) \large \exp(X) \sim \operatorname{LogLogistic}{\displaystyle \left(\alpha =e^{\mu },\beta ={\frac {1}{s}}\right)}

  • اگر XExp(1)X\sim \mathrm{Exp}(1) (توزیع نمایی) باشد، آنگاه

μ+βlog(eX1)Logistic(μ,β). \large {\displaystyle \mu +\beta \log(e^{X}-1)\sim \operatorname {Logistic} (\mu ,\beta ).}

  • همچنین اگر XX و YY دارای توزیع نمایی با پارامتر ۱ باشند، آنگاه

μβlog(XY)Logistic(μ,β). \large {\displaystyle \mu -\beta \log \left({\frac {X}{Y}}\right)\sim \operatorname {Logistic} (\mu ,\beta ).}

کاربرد توزیع لجستیک

از نکات مهم و کاربردی برای توزیع و متغیر تصادفی لجستیک می‌توان به ارتباط آن با تابع لجستیک (Logistic Function) اشاره کرد. تابع ss شکل به فرم زیر را تابع لجستیک یا منحنی سیگموئید (Sigmoid Curve) می‌نامیم.

f(x)=L1+ek(xx0) \large {\displaystyle f(x)={\frac {L}{1+e^{-k(x-x_{0})}}}}

که در آن x0x_0 نقطه مرکزی نمودار سیگموئید و LL نیز حداکثر این تابع را مشخص می‌کند. پارامتر kk نیز نرخ تغییرات در بین حداکثر و حداقل این تابع را تعیین می‌کند.

Logistic-curve
تصویر ۳: تابع سیگموئید

همچنین در بحث یادگیری عمیق (Deep Learning) تابع لوجیت (Logit Function) نیز که به مانند تابع لجستیک حالت ss شکل دارد، به کار گرفته می‌شود. اگر pp نشان دهنده تابع احتمال باشد، آنگاه رابطه زیر را تابع لوجیت می‌نامند.

logit(p)=log(p1p)=log(p)log(1p)=log(1p1)\large {\displaystyle \operatorname {logit} (p)=\log \left({\frac {p}{1-p}}\right)=\log(p)-\log(1-p)=-\log \left({\frac {1}{p}}-1\right)}

رگرسیون لجستیک (Logistic Regression)

یکی از رایج ترین کاربردهای توزیع لجستیک و متغیر تصادفی آن، رگرسیون لجستیک است که برای مدل‌سازی متغیرهای وابسته از نوع طبقه‌ای (مثلاً گزینه‌های بله-خیر ) مورد استفاده قرار می‌گیرد. این امر درست به مانند حالتی است که از رگرسیون خطی ساده برای مدل‌سازی متغیرهای وابسته از نوع پیوسته کمک گرفته می‌شود.

به طور خاص، رگرسیون لجستیک می‌تواند به عنوان مدل‌هایی براساس «متغیر پنهان» (Latent Variable) و «متغیرهای خطا» (Error Variables) با توزیع لجستیک، بیان شود. به این ترتیب توزیع لجستیک همان نقشی را در رگرسیون لجستیک خواهد داشت که در رگرسیون باینری (Probit Regression)، توزیع نرمال (Normal Distribution) ایفا می‌کند.

از آنجایی که توزیع لجستیک دارای دم‌های سنگین‌تری نسبت به توزیع نرمال است، اغلب، تحلیل‌ها و برآوردهای استوارتری (Robust) نسبت به تحلیل‌های با توزیع نرمال ایجاد می‌کند.

کاربرد در فیزیک

تابع چگالی احتمال متغیر تصادفی لجستیک (PDF) دارای فرم عملکردی مشابه با مشتق تابع فِرمی (Fermi Function) است. مشتق این تابع در نظریه خواص الکترون در نیمه هادی‌ها و فلزات، وزن‌های متفاوتی را برای انرژی الکترون‌های مختلف محاسبه می‌کند. توجه داشته باشید که توزیع احتمال مربوط به این پدیده شبیه توزیع لجستیک است.

توزیع لجستیک را می‌توان به عنوان توزیع حدی سرعت نهایی حرکت تصادفی میرای یک ذره در فرآیند برنولی در نظر گرفت که در آن تغییرات سرعت در زمان‌های تصادفی رخ داده و دارای توزیع نمایی با پارامترهای صعودی خطی است.

کاربرد در علوم آب

در هیدرولوژی و علوم آب، توزیع تخلیه رودخانه و بارندگی در طولانی مدت (به عنوان مثال، در مقاطع ماهانه و سالانه) غالباً طبق قضیه حد مرکزی (Central Limit Theorem) به طور مجانبی دارای توزیع نرمال است.

از آنجای که توزیع لجستیک، مشابه توزیع نرمال، دارای روش‌های تحلیلی است، در بسیاری از موارد می‌تواند جایگزین توزیع نرمال شود. در تصویر ۴، از توزیع لجستیک برای برآورد کردن میزان بارندگی در ماه اکتبر، استفاده شده و نمونه تصادفی جمع‌آوری شده به خوبی با توزیع لجستیک با یک فاصله اطمینان ۹۰ درصدی، همخوانی دارد.

Fit Logistic distribution
تصویر ۴: برازش توزیع لجستیک برای بارندگی ماه اکتبر

خلاصه و جمع‌بندی

در این نوشتار با تابع توزیع لجستیک و متغیر تصادفی آن آشنا شدیم و خصوصیات آن را مورد بررسی قرار دادیم. از طرفی ارتباط این متغیر تصادفی را با توزیع‌های دیگر مشخص کردیم. همچنین کاربردهای مختلف این توزیع را در علوم دیگر متذکر شدیم. از آنجایی که این توزیع نسبت به توزیع نرمال دارای دم‌های سنگین‌تری در چگالی احتمال است، در مواردی که با داده‌ها دم-سنگین (Heavy Tail Data) مواجه هستیم، استفاده از این توزیع و مدل‌سازی برمبنای آن باعث افزایش دقت در برآوردها خواهد شد.

اگر این مطلب برای شما مفید بوده است، آموزش‌های زیر نیز به شما پیشنهاد می‌شوند:

^^

بر اساس رای ۰ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع:
Wikipedia
نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *