نرم افزار آماری Statistica – قابلیت ها و کاربردها
با توجه به پیچیدگی و حجم زیاد محاسبات آماری، استفاده از رایانهها و نرمافزارهای محاسبات آماری، از ابزارهای اصلی تحلیلگرهای داده (Data Scientists) و دانشمندان آمار، محسوب میشود. در این نوشتار به معرفی نرم افزار آماری Statistica پرداخته و با خصوصیات و قابلیتهای آن آشنا میشویم. هر چند گونههای مختلفی از نرمافزارهای محاسبات آماری دیگری مانند SAS یا SPSS نیز وجود دارند که به صورت بسته نرمافزاری Package عمل میکنند ولی شاید نوع نگاه Statistica به مفهوم و جنبههای دستهبندی تحلیلهای آماری آن را نسبت به بقیه نرمافزارها متمایز کند.


معرفی نرم افزار آماری Statistica
این نرمافزار توسط شرکت StatSoft در سال 1980 توسعه یافت و براساس بستههای نرمافزاری مجزا یا بستههای محاسباتی مختلف به بازار عرضه شد. در سال ۱986 نسخه کامل و به روز شده آن برای کامپیوترهای اپل نیز آماده شد و نسخه سیستم عامل داس آن نیز که با نام امروزی Statistica به فروش میرفت در سال 1991 تولید و به بازار آمد.
ارائه گزارشات آماری در قالب جدول و نمودارهای آماری از خصوصیات بارز این نرمافزار در سالهای 1990 تا به امروز بوده است. همچنین نسخه قابل اجرا در سیستمهای ۳۲ و ۶۴ بیتی نیز در ۲۰۰۹ در دسترس کاربران قرار گرفت. این نسخه از Statistica به نام نسخه ۱۰ شهرت داشت.
نسخه ۱۳.۰ این نرمافزار در سال 2014 ارائه شده و از آن به بعد این نرمافزار به تملک شرکت TIBCO در آمده و آن را به صورت مجتمع با نرمافزار Spotfire Data Science TIBCO در آورده است ولی به صورت مجزا نیز قابل خریداری است.
از ویژگیهای مهم این نرمافزار میتوان به موارد زیر اشاره کرد.
- تحلیل دادهها
- مدیریت دادهها
- محاسبات آماری و آزمونهای پارامتری و ناپارامتری چند متغیره
- محاسبات مربوط به کنترل کیفیت آماری
- دادهکاوی
- یادگیری ماشین
- تحلیل متن
- تصویر سازی داده و رسم نمودارهای واضح و موثر
دستورات یا تحلیلها در این نرمافزار از طریق انتخاب یکی از گزینهها از فهرست دستورات امکانپذیر است. با ظاهر شدن پنجره مربوط به تحلیل مورد نظر، متغیرهای لازم برای تحلیل معرفی شده و نتیجه محاسبات طی جداول و نمودارهای مختلف آماری ظاهر میشود. این نتایج نیز قابل ذخیرهسازی یا انتقال به نرمافزارها دیگر مانند Word یا Excel هستند.

در ادامه به فهرستی از تواناییهای این نرمافزار اشاره خواهد شد.
طیف کاملی از تحلیلها
نرمافزار Statistica با بهرهگیری از صدها تابع و الگوریتمهای مختلف قادر است گزارشات آماری و محاسباتی را به راحتی انجام دهد که شامل موارد زیر هستند.
- تحلیلهای سری زمانی
- رگرسیون
- خوشهبندی
- درخت تصمیم
- تحلیل آمار چند متغیره
- کنترل فرآیند آماری
- طرح آزمایشها
- تحلیل گراف/شبکه
- تحلیل متن
یادگیری ماشین روی کلان داده
براساس مدلهای خودکاری که در Statistica قرار دارد قادر هستید که الگوریتمهای مربوط به یادگیری ماشین را اجرا کرده و قابلیتها و کارایی خود را در به کارگیری یادگیری ماشین روی کلان داده افزایش دهید. به این ترتیب میتوانید به تشکیل الگوهای تصمیمگیری جدید بدون نیاز به نوشتن برنامه به زبانهای R یا پایتون بپردازید. در تصویر زیر، دستورات مرتبط با یادگیری ماشین و دادهکاوی در این نرمافزار را مشاهده میکنید.

هماهنگی تیمی
کار گروهی به کمک ارتباط نرمافزار Statistica با منابع داده پویا، راحتتر صورت میگیرد. به این ترتیب چرخه تولید، تحلیل و به کارگیری الگوهای حاصل از دادهها سادهتر شده و گزارشات و نتایج حاصل معتبرتر و در زمان کوتاهتری آماده میشوند.
قابلیت گسترش و انعطافپذیری
چرخه تولید داده و تحلیلهای آماری با توجه به هماهنگی و امکان ارتباط Statistica با Jupyter Notebooks، پایتون، #C و همچنین R بسیار ساده است و تعامل با این موارد قدرت گسترش این نرمافزار را کامل میکند.
اگر نوشته بالا برای شما مفید بوده، آموزشها و مطالب زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای داده کاوی و یادگیری ماشین
- آموزش برنامهنویسی R و نرمافزار R Studio
- مجموعه آموزشهای آمار و احتمالات
- روش انتخاب الگوریتم داده کاوی — راهنمای کاربردی
- داده کاوی (Data Mining) — از صفر تا صد
- وکا (WEKA) ابزاری برای یادگیری ماشین و داده کاوی — راهنمای شروع به کار
^^













سلام وقت بخیر
آیا این نرم افزار میتواند داده های یک طرح رو بررسی و داده پرتی که ممکنه نتیجه آزمایش رو تغییر بده مشخص و تصحیح کنه. یا خودش پیشنهاد حدف بده. اگر نه نرم افزاری وجود داره که برای دادههای علوم زیستی که نمیشه با قطعیت داده رو حذف کرد تحلیل و تصحیح کند.
با سلام خدمت شما همراه گرامی؛
نرمافزارهای آماری جامعی مانند STATISTICA یا SPSS و زبانهای قدرتمندی مانند R و Python قابلیتهای لازم برای شناسایی دادههای پرت را فراهم میکنند. این نرمافزارها با استفاده از روشهایی نظیر رسم نمودار جعبهای یا پیدا کردن Z-score، دادههای مشکوک را مشخص میکنند تا محقق در مورد آنها تصمیمگیری کند. نرمافزارها بطور خودکار حذف قطعی را پیشنهاد نمیدهند، زیرا این تصمیم باید بر اساس دانش تخصصی علوم زیستی اتخاذ شود. با این حال برای دادههایی که نمیتوان آنها را حذف کرد، نرمافزارهای مبتنی بر R با استفاده از آمارههای مقاوم (Robust Statistics)، تحلیل را بدون حذف دادههای پرت انجام داده و نتایج دقیقتری ارائه میکنند. تکنیکهای پیشرفته جایگزینی داده (Imputation) نیز در این محیطها برای تصحیح دادهها بکار میروند.
از بازخورد و همراهی شما با مجله فرادرس سپاسگزاریم.
سلام و تشكّر از مطالب مفيد ايشان. پايدار باشيد و پويا
آموزش کامل statistica رو هم لطفا جزو برنامه فرادرس بگذارید