آموزش زبان برنامه نویسی R- قسمت سوم

آموزش زبان برنامه نویسی R- قسمت سوم

در قسمت دوم آموزش نصب R را انجام دادیم و معروف‌ترین IDE مربوط آن را نصب کردیم. در این جلسه قصد داریم آموزش مقدماتی کد نویسی در RStudio را آموزش دهیم. با فیسیت همراه باشید.


مزایای استفاده از Rstudio
شما بدون استفاده از IDE هم می‌توانید به زبان R  کد بزنید و اجرا کنید، اما استفاده از IDE مزایایی دارد که شاید مایل باشید از آن استفاده کنید. البته مزایای ارایه شده در ادامه تنها زمانی ایجاد می‌شوند که شما در Rstudio پروژه بسازید. مزیت‌هایی از قبیل:
•    وقتی پروژه‌ای را باز می‌کنید یک نشست (پروسه) جدید از R را برای شما اجرا می‌کند.
•    اگر فایلی با نام .Rprofile در مسیر اصلی دایرکتوری پروژه وجود داشته  باشد آن را اجرا می‌کند (در این فایل اسکریپتی به زبان R وجود دارد).
•    اگر فایلی با نام .RData  در دایرکتوری پروژه وجود داشته باشد آن را بارگذاری می‌کند (این فایل مربوط به آبجکت‌هایی است که در R ساخته‌اید و موقع بستن Rstudio از شما سؤال پرسیده که آن‌ها را ذخیره کنید. البته شما می‌توانید در تنظیمات Rstudio بارگذاری این فایل را غیرفعال کنید).
•    فایل .RHistory را بارگذاری می‌کند تا وقتی در قسمت خط فرمان Rstudio کلید‌های بالا و پایین را فشرده می‌سازید بتوانید دستوراتی را که قبلاً استفاده کرده‌اید، تکرار کنید.
•    دایرکتوری پیش‌فرض اجرایی R به دایرکتوری اصلی پروژه تغییر می‌یابد.
•    فایل‌های اسکریپتی که قبلاً داشته‌اید و تغییرات خود را روی آن‌ها اعمال می‌کردید، هر کدام در یک زبانه جداگانه باز می‌کند.
•    و تنظیمات دیگری در Rstudio انجام داده‌اید را برای شما بارگذاری می‌کند.
•    زمان بستن Rstudio فایل‌هایی از قبیل .RData و .Rhistory و لیست فایل‌های اسکریپتی که در حال حاضر باز هستند و تنظیمات Rstudio را برای شما ذخیره می‌کند.

توجه: برای استفاده از مزایای فوق همیشه در Rstudio پروژه بسازید.

ساختن پروژه در Rstudio
برای ساختن پروژه در منوی File گزینه New Project را انتخاب کرده سپس برای ساختن پروژه در یک دایرکتوری موجود از existing directory در غیر این صورت new directory  را انتخاب کنید. سپس Empty project را انتخاب کنید و اسم دایرکتوری و مسیر آن را تعیین کنید تا پروژه برای شما ساخته شود.
پس از ساخته شدن پروژه، فایلی به اسمی که ایجاد کردید در دایرکتوری تعیین شده، با پسوند Rproj ساخته می‌شود که اگر در اجراهای بعدی Rstudio آن را انتخاب کنید پروژه شما باز می‌شود.

پس از ساختن پروژه نوبت به ایجاد فایل اسکریپت R می‌رسد.

Nikkhah24

طبق تصویر بالا یک فایل اسکریپت R ایجاد می‌کنیم و آن را ذخیره می‌کنیم تا پنجره انتخاب اسم برای این فایل باز شود و سپس نام مورد نظر را می‌نویسیم. حال می‌خواهیم با چند دستور کاربردی آشنا شویم.

استفاده از help و example
با این دو تابع می‌توانید توضیحات توابع موجود در  بسته‌های الگوریتم‌های متعدد و نحوه استفاده از‌ آن‌ها را ببینید. برای اینکار  اسم تابعی که می‌خواهید نحوه کار کردن با آن را یاد بگیرید را به عنوان آرگومان به help یا example بفرستید. برای مثال:

help("read.csv")
example("data.frame")

دستور اول توضیحاتی در مورد دستور read.csv ارايه می‌دهد و دستور دوم نحوه استفاده از data.frame را با چند مثال نشان می‌دهد.

استفاده از کتابخانه‌ها
وقتی R  را نصب می‌کنید کتابخانه‌های base آن نیز نصب می‌شوند که هر آنچه در این کتابخانه وجود داشته باشد را به صورت پیش‌فرض در تمامی برنامه‌ها می‌توانید استفاده کنید. اما زمانی که می‌خواهید از یک الگوریتم استفاده کنید که در کتابخانه‌ای دیگر تعریف شده است باید مانند زبان‌های برنامه‌نویسی دیگر ابتدا کتابخانه را بارگذاری کنید. این کار که شبیه include در سی یا import در جاوا است که به صورت زیر انجام مي‌شود.

library(MASS)

دستور فوق کتابخانه MASS که برای کشیدن parallel coordinate از آن استفاده می‌شود را بارگذاری می‌کند. بعد از اجرای دستور فوق می‌توانیم از توابع موجود در این کتابخانه استفاده کنیم.

توجه:اگر دستور ذکر شده را نوشتید و با خطا مواجه شدید (کتابخانه را نصب نداشتید)، ابتدا باید توسط دستور زیر آن را از طریق اینترنت نصب کنید:

install.packages(“MASS”)

دستور بالا کتابخانه MASS را از اینترنت دانلود و به صورت خودکار نصب می‌کند. پس از آن می‌توانید کتابخانه ذکر شده را بارگذاری کنید.

انتساب مقادیر در R
در اکثر زبان‌های برنامه‌نویسی برای انتساب از مساوی استفاده می‌شود، اما در R برای انتساب از دستور زیر استفاده می‌شود.

var <- 2+4

در دستور بالا ۲ با ۴ جمع شده و نتیجه در متغیر var ریخته می‌شود. در R از مساوی نیز می‌توان برای انتساب استفاده کرد اما بهتر است همانند دستور بالا برای انتساب از علامت -> استفاده شود.

تذکر: در زبان R نیازی به تعریف نوع متغیر نداریم و خود مفسر نوع آن را تعیین می‌کند.

خواندن فایل و دیتاست
در اکثر مسائل آنالیز، داده‌هایی داریم که یا در پایگاه داده ذخیره شده‌اند و یا اینکه در فایل‌هایی با فرمت خاص داده‌ها ذخیره شده‌اند. زبان R می‌تواند دیتاست را هم از پایگاه داده بخواند و هم از فایل.
توجه: به دلیل اینکه اکثر دیتاست‌ها به صورت فایلی ارائه شده‌اند فعلاً از خواندن از پایگاه داده صرف نظر می‌کنیم. در صورت وجود درخواست، آموزشی مختص خواندن از پایگاه داده در سایت قرار می‌دهیم.

برای خواندن فایل‌ها یک دستور کلی وجود دارد که پارامترهای زیادی می‌گیرد و هر پارامتر تعیین کننده روش خوانده شدن فایل را نشان می‌دهد.

برای فایل‌های csv که توسط کاما ستون‌های آن جدا شده‌اند از دستور زیر می‌توان استفاده کرد.

women <- read.csv(file="/home/amin/projects/faceit_R/women.csv",header = TRUE)

همان‌طور که در دستور بالا می‌بینید از read.csv که از مشتقات read.table می‌باشد استفاده کردیم زیرا یک سری پارمترهای پیش‌فرض در آن مقدار دهی شده‌اند تا برای خواندن فایل csv آماده شود. پارامتر file با آدرس کامل دیتاست آورده شده است اگر دیتاست در دایرکتوری پروژه باشد تنها کافی است در پارامتر file نام فایل ذکر شود و نیازی به آدرس کامل آن نیست.

پارامتر header تعیین می‌کند که در فایل csv از سرتون استفاده شده است یا خیر.

توجه: به بزرگ و کوچک بودن حروف در کدها دقت کنید زیاد TRUE و true در زبان R با هم متفاوتند. به عبارت دیگر R زبانی case sensitive است.
توجه: برای تمرین می‌توانید از دیتاست‌های موجود در آدرس datasets استفاده کنید.

اگر دیتاست شما excel باشد نمی‌توانید از دستورات گفته شده در بالا استفاده کنید و باید از کتابخانه gdata استفاده کرده و فایل xls را بخوانید.

library(gdata)
df <- read.xls ("myfile.xlsx"), sheet = 1, header = TRUE)

توجه: در صورتی که کتابخانه gdata را نصب ندارید ابتدا آن را با install.package نصب کنید.

چاپ کردن محتویات آبجکت‌ها
برای چاپ کردن محتویات یک متغیر از دستور print استفاده کنید.

 

print(df)

سومین جلسه از آموزش زبان برنامه نویسی R نیز به پایان رسید. برای دسترسی به جلسات قبلی آموزش زبان برنامه نویسی R، می توانید به لینک های زیر مراجعه کنید.

قسمت اول آموزش زبان برنامه نویسی R
قسمت دوم آموزش زبان برنامه نویسی R

امین  خزاعی

امین خزاعی

امین، برنامه نویس سیستمی و امنیت و ساکن شیراز. عاشق گنو/ لینوکس و نرم افزار آزاد. امین اعتقاد دارد همیشه باید برای توسعه نرم افزارهای آزاد و گسترش فرهنگ آزادی در نرم افزار وقت گذاشت.


0 نظر درباره‌ی این پست نوشته شده است.

ثبت نظر