تصویر سازی داده ها – نمودار پراکنش

در ادامه مطلب قبل در رابطه با تصویرسازی داده‌ها، پس از ارائه سه نکته کوتاه دیگر در رابطه با نمودارهای آماری، سریعاً معرفی نمودارهای چندمتغیره آماری را ابتدا با نمودار پراکَنش (Scatterplot) شروع می نماییم.

⭕️ نکته ی دیگری که دانشمندان بیان می کنند این است که‌ ” عالی‌ترین ارزش یک تصویر، زمانی است که ما را مجبور می‌کند تا توجه کنیم به آنچه که هرگز انتظار نداشتیم ببینیم”

? شاید برای نمایش گرافیکی یا ترسیمی چهار هدف وجود داشته باشد:

  • ارائه‌ی یک بررسی اجمالی؛
  • بیان یک موضوع؛
  • پیشنهاد فرضیه‌ها؛
  • انتقاد از یک مدل.

که ما در مطالب آینده بیشتر با سه هدف اول سر و کار داریم.

نمایش‌های ترسیمیِ توسعه یافته در دو دهه گذشته، برای شکار عوامل خاص در داده‌ها، نشان دادن داده‌های پرت، شناسایی الگوها، تشخیص مدل‌ها و به طور کلی جستجو برای پدیده‌های جدید و شاید غیر منتظره هستند.

? و نکته آخر اینکه اکنون با وجود دستگاه‌ها و کامپیوترها این سؤال وجود ندارد که “ما باید رسم کنیم؟” بلکه باید پرسید که “ما چه چیزی باید رسم کنیم؟”.

بسیاری از امکانات مهیج شامل نمودارهای حرکتی و پویا وجود دارد اما معمولاً بایستی از نمودارهای ساده و ایستا شروع کرد. نمودار شروع برای داده های چندمتغیره نمودار پراکَنش است.


✅نمودار پَراکنش (Scatterplot)✅

نمودار پراکنش از نوع نمودارهای رابطه‌ای است. این نمودارها رابطه حداقل دو متغیر با هم را نمایش می‌دهند.

◾️نمودار پراکنش برای نمایش داده های دو متغیره پیوسته (متغیرهای کمی با مقیاس فاصله ای و نسبی مانند نمره، دمای هوا و…) استاندارد است اما با روش های مختلف می تواند برای جمع آوری اطلاعات در مورد متغیرهای دیگر نیز توسعه می‌یابد.

در برنامه R دستور (plot(x,y یا (plot(x‍~y نمودار پراکنش دو متغیر را رسم می‌کند.در فرمول ذکرشده، متغیر طرف چپِ تیلدا (‍~) محور عمودی یا طول نمودار و متغیر طرف راست تیلدا محور افقی یا عرض نمودار را مشخص می‌کند.

برای تابع ()plot آرگومان‌ها یا پارامترهای دیگر نیز وجود دارد که هر کدام با کاما (,) جدا می‌شوند و به عنوان مثال می‌توان برای محورها برچسب تعیین نمود.


در عکس زیر یک نمونه کد دستوری و نمودار ترسیم شده مشاهده می‌شود.
??

mlab <- “Manufacturing enterprises with 20 or more workers”
plab <- “Population size (1970 census) in thousands”

plot(popul ~ manu, data = USairpollution, xlab = mlab, ylab = plab)

ما در نمودار فوق، رابطه جمعیت با تعداد شرکت‌های تولیدی را که رابطه‌ی مستقیم و هماهنگ است و نیز نقاط دور افتاده (پرت) را مشاهده می‌نماییم.

ممکن است بپسندید...

پست های محبوب

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *