Quản lý dự án phân tích trong R với Project

Tác giả: Hoàng Đức Anh | 2018-07-15

Khi triển khai một dự án phân tích dữ liệu với R, thông thường, chúng ta sẽ cho toàn bộ code, kết quả đầu ra vào một folder chung. Khi đó, ta sẽ phải đổi toàn bộ thư mục làm việc working directory sang địa chỉ của thư mục dự án.

Ví dụ, ta có dự án phân tích marketing đặt trên ổ D với đường dẫn như sau D:\marketing. Khi đó, toàn bộ code, để đơn giản, sẽ phải thay đổi thư mục làm việc. Các bạn sẽ phải đặt thư mục làm việc trong các file code như sau:

setwd("D:/marketing")

Tuy nhiên, đây không phải là cách tối ưu. Trong RStudio, ta có thể sử dụng Project để quản lý hiệu quả hơn code, kết quả, dữ liệu và các tài liệu có liên quan như sau.

  • Bước 1: Tạo project mới: File >> New project
  • Bước 2: Chọn đường dẫn cho project
    • New directory >> New project >> Directory name - với project hoàn toàn mới
    • Existing directory - với project đang quản lý theo cách

Trong ví dụ này, mình sẽ lựa chọn là New directory và tạo một project mới có tên là marketing:

  • Chọn Directory namemarketing
  • Chọn đường dẫn tại ổ D

  • Bước 3: Tạo project mới Create project

Như vậy, chúng ta đã vừa tạo xong 1 project với Rstudio. Toàn bộ các file, data, kết quả đầu ra chúng ta có thể lưu thẳng vào folder của project.

Ví dụ, ta tạo 1 script có tên là script1.R, ta có thể lưu thẳng vào folder code trong project (folder này do chúng ta tự tạo). Các bạn có thể xem ví dụ minh họa dưới đây.

Khi khởi động project, ta chỉ cần truy cập vào foder và khởi động file .Rproj (trong trường hợp này là marketing.Rproj). Khi đó, ta không cần phải đặt lại working directory nữa, working directory mặc định chính là đường dẫn của thư mục.

Với việc sử dụng project, việc tái sử dụng, bàn giao code sẽ rất thuận tiện do chỉ việc copy toàn bộ project và bàn giao cho đồng nghiệp. Khi đó, người được bàn giao chỉ việc khởi động file .Rproj.

Việc sử dụng Project sẽ giúp các bạn quản lý và làm việc hiệu quả hơn rất nhiều với các dự án phân tích dữ liệu. Chúc các bạn học và làm việc hiệu quả với Ranalytics.vn!

comments powered by Disqus