در قسمت دوم آموزش نصب R را انجام دادیم و معروفترین IDE مربوط آن را نصب کردیم. در این جلسه قصد داریم آموزش مقدماتی کد نویسی در RStudio را آموزش دهیم. با فیسیت همراه باشید.
مزایای استفاده از Rstudio
شما بدون استفاده از IDE هم میتوانید به زبان R کد بزنید و اجرا کنید، اما استفاده از IDE مزایایی دارد که شاید مایل باشید از آن استفاده کنید. البته مزایای ارایه شده در ادامه تنها زمانی ایجاد میشوند که شما در Rstudio پروژه بسازید. مزیتهایی از قبیل:
• وقتی پروژهای را باز میکنید یک نشست (پروسه) جدید از R را برای شما اجرا میکند.
• اگر فایلی با نام .Rprofile در مسیر اصلی دایرکتوری پروژه وجود داشته باشد آن را اجرا میکند (در این فایل اسکریپتی به زبان R وجود دارد).
• اگر فایلی با نام .RData در دایرکتوری پروژه وجود داشته باشد آن را بارگذاری میکند (این فایل مربوط به آبجکتهایی است که در R ساختهاید و موقع بستن Rstudio از شما سؤال پرسیده که آنها را ذخیره کنید. البته شما میتوانید در تنظیمات Rstudio بارگذاری این فایل را غیرفعال کنید).
• فایل .RHistory را بارگذاری میکند تا وقتی در قسمت خط فرمان Rstudio کلیدهای بالا و پایین را فشرده میسازید بتوانید دستوراتی را که قبلاً استفاده کردهاید، تکرار کنید.
• دایرکتوری پیشفرض اجرایی R به دایرکتوری اصلی پروژه تغییر مییابد.
• فایلهای اسکریپتی که قبلاً داشتهاید و تغییرات خود را روی آنها اعمال میکردید، هر کدام در یک زبانه جداگانه باز میکند.
• و تنظیمات دیگری در Rstudio انجام دادهاید را برای شما بارگذاری میکند.
• زمان بستن Rstudio فایلهایی از قبیل .RData و .Rhistory و لیست فایلهای اسکریپتی که در حال حاضر باز هستند و تنظیمات Rstudio را برای شما ذخیره میکند.
توجه: برای استفاده از مزایای فوق همیشه در Rstudio پروژه بسازید.
ساختن پروژه در Rstudio
برای ساختن پروژه در منوی File گزینه New Project را انتخاب کرده سپس برای ساختن پروژه در یک دایرکتوری موجود از existing directory در غیر این صورت new directory را انتخاب کنید. سپس Empty project را انتخاب کنید و اسم دایرکتوری و مسیر آن را تعیین کنید تا پروژه برای شما ساخته شود.
پس از ساخته شدن پروژه، فایلی به اسمی که ایجاد کردید در دایرکتوری تعیین شده، با پسوند Rproj ساخته میشود که اگر در اجراهای بعدی Rstudio آن را انتخاب کنید پروژه شما باز میشود.
پس از ساختن پروژه نوبت به ایجاد فایل اسکریپت R میرسد.
طبق تصویر بالا یک فایل اسکریپت R ایجاد میکنیم و آن را ذخیره میکنیم تا پنجره انتخاب اسم برای این فایل باز شود و سپس نام مورد نظر را مینویسیم. حال میخواهیم با چند دستور کاربردی آشنا شویم.
استفاده از help و example
با این دو تابع میتوانید توضیحات توابع موجود در بستههای الگوریتمهای متعدد و نحوه استفاده از آنها را ببینید. برای اینکار اسم تابعی که میخواهید نحوه کار کردن با آن را یاد بگیرید را به عنوان آرگومان به help یا example بفرستید. برای مثال:
help("read.csv")
example("data.frame")
دستور اول توضیحاتی در مورد دستور read.csv ارايه میدهد و دستور دوم نحوه استفاده از data.frame را با چند مثال نشان میدهد.
استفاده از کتابخانهها
وقتی R را نصب میکنید کتابخانههای base آن نیز نصب میشوند که هر آنچه در این کتابخانه وجود داشته باشد را به صورت پیشفرض در تمامی برنامهها میتوانید استفاده کنید. اما زمانی که میخواهید از یک الگوریتم استفاده کنید که در کتابخانهای دیگر تعریف شده است باید مانند زبانهای برنامهنویسی دیگر ابتدا کتابخانه را بارگذاری کنید. این کار که شبیه include در سی یا import در جاوا است که به صورت زیر انجام ميشود.
library(MASS)
دستور فوق کتابخانه MASS که برای کشیدن parallel coordinate از آن استفاده میشود را بارگذاری میکند. بعد از اجرای دستور فوق میتوانیم از توابع موجود در این کتابخانه استفاده کنیم.
توجه:اگر دستور ذکر شده را نوشتید و با خطا مواجه شدید (کتابخانه را نصب نداشتید)، ابتدا باید توسط دستور زیر آن را از طریق اینترنت نصب کنید:
install.packages(“MASS”)
دستور بالا کتابخانه MASS را از اینترنت دانلود و به صورت خودکار نصب میکند. پس از آن میتوانید کتابخانه ذکر شده را بارگذاری کنید.
انتساب مقادیر در R
در اکثر زبانهای برنامهنویسی برای انتساب از مساوی استفاده میشود، اما در R برای انتساب از دستور زیر استفاده میشود.
var <- 2+4
در دستور بالا ۲ با ۴ جمع شده و نتیجه در متغیر var ریخته میشود. در R از مساوی نیز میتوان برای انتساب استفاده کرد اما بهتر است همانند دستور بالا برای انتساب از علامت -> استفاده شود.
تذکر: در زبان R نیازی به تعریف نوع متغیر نداریم و خود مفسر نوع آن را تعیین میکند.
خواندن فایل و دیتاست
در اکثر مسائل آنالیز، دادههایی داریم که یا در پایگاه داده ذخیره شدهاند و یا اینکه در فایلهایی با فرمت خاص دادهها ذخیره شدهاند. زبان R میتواند دیتاست را هم از پایگاه داده بخواند و هم از فایل.
توجه: به دلیل اینکه اکثر دیتاستها به صورت فایلی ارائه شدهاند فعلاً از خواندن از پایگاه داده صرف نظر میکنیم. در صورت وجود درخواست، آموزشی مختص خواندن از پایگاه داده در سایت قرار میدهیم.
برای خواندن فایلها یک دستور کلی وجود دارد که پارامترهای زیادی میگیرد و هر پارامتر تعیین کننده روش خوانده شدن فایل را نشان میدهد.
برای فایلهای csv که توسط کاما ستونهای آن جدا شدهاند از دستور زیر میتوان استفاده کرد.
women <- read.csv(file="/home/amin/projects/faceit_R/women.csv",header = TRUE)
همانطور که در دستور بالا میبینید از read.csv که از مشتقات read.table میباشد استفاده کردیم زیرا یک سری پارمترهای پیشفرض در آن مقدار دهی شدهاند تا برای خواندن فایل csv آماده شود. پارامتر file با آدرس کامل دیتاست آورده شده است اگر دیتاست در دایرکتوری پروژه باشد تنها کافی است در پارامتر file نام فایل ذکر شود و نیازی به آدرس کامل آن نیست.
پارامتر header تعیین میکند که در فایل csv از سرتون استفاده شده است یا خیر.
توجه: به بزرگ و کوچک بودن حروف در کدها دقت کنید زیاد TRUE و true در زبان R با هم متفاوتند. به عبارت دیگر R زبانی case sensitive است.
توجه: برای تمرین میتوانید از دیتاستهای موجود در آدرس datasets استفاده کنید.
اگر دیتاست شما excel باشد نمیتوانید از دستورات گفته شده در بالا استفاده کنید و باید از کتابخانه gdata استفاده کرده و فایل xls را بخوانید.
library(gdata)
df <- read.xls ("myfile.xlsx"), sheet = 1, header = TRUE)
توجه: در صورتی که کتابخانه gdata را نصب ندارید ابتدا آن را با install.package نصب کنید.
چاپ کردن محتویات آبجکتها
برای چاپ کردن محتویات یک متغیر از دستور print استفاده کنید.
print(df)
سومین جلسه از آموزش زبان برنامه نویسی R نیز به پایان رسید. برای دسترسی به جلسات قبلی آموزش زبان برنامه نویسی R، می توانید به لینک های زیر مراجعه کنید.
قسمت اول آموزش زبان برنامه نویسی R
قسمت دوم آموزش زبان برنامه نویسی R
ثبت نظر