Tùy chỉnh các thành phần cơ bản trong GGPLOT2

Tác giả: Hoàng Đức Anh | 2018-07-31

Khi mới bắt đầu làm việc với GGPLOT2, sẽ rất khó để có thể tùy chỉnh các thành phần cơ bản trong biểu đồ. Trong bài viết này, Ranalytics sẽ hướng dẫn các bạn tùy chỉnh những thành phần cơ bản nhất của biểu đồ với GGPLOT2.


Khi đã tạo được các biểu đồ cơ bản, ta còn cần phải làm chủ được các thành phần khác của biểu đồ, trong đó quan trọng nhất gồm có:

  • Tên biểu đồ
  • Trên các trục tọa độ (x, y)
  • Nội dung phần chú giải
  • Phần text trong từng trục

Để thay đổi các thành phần này, ta dùng hàm theme để tạo layer theme mới cho biểu đồ đã tạo. Các thành phần tương ứng của hàm theme là:

  • Tên biểu đồ: plot.title
  • Trên các trục tọa độ (x, y): axis.title.x, axis.title.y
  • Nội dung phần text trong từng trục: axis.text.x, axis.text.y
  • Phần chú giải: legend.title, legend.text

Dữ liệu sử dụng vẽ biểu đồ

library(dplyr)
library(ggplot2)
data <- diamonds %>% sample_n(5000)
data %>% summary
##      carat               cut       color       clarity         depth      
##  Min.   :0.2100   Fair     : 143   D: 634   SI1    :1250   Min.   :52.20  
##  1st Qu.:0.4000   Good     : 464   E: 868   VS2    :1200   1st Qu.:61.10  
##  Median :0.7000   Very Good:1096   F: 916   SI2    : 802   Median :61.80  
##  Mean   :0.8005   Premium  :1273   G:1045   VS1    : 751   Mean   :61.75  
##  3rd Qu.:1.0500   Ideal    :2024   H: 762   VVS2   : 454   3rd Qu.:62.50  
##  Max.   :3.6500                    I: 550   VVS1   : 324   Max.   :79.00  
##                                    J: 225   (Other): 219                  
##      table           price             x               y        
##  Min.   :49.00   Min.   :  340   Min.   :0.000   Min.   : 3.78  
##  1st Qu.:56.00   1st Qu.:  945   1st Qu.:4.710   1st Qu.: 4.73  
##  Median :57.00   Median : 2410   Median :5.700   Median : 5.71  
##  Mean   :57.52   Mean   : 3954   Mean   :5.737   Mean   : 5.75  
##  3rd Qu.:59.00   3rd Qu.: 5484   3rd Qu.:6.550   3rd Qu.: 6.54  
##  Max.   :73.00   Max.   :18766   Max.   :9.530   Max.   :58.90  
##                                                                 
##        z        
##  Min.   :0.000  
##  1st Qu.:2.917  
##  Median :3.530  
##  Mean   :3.543  
##  3rd Qu.:4.040  
##  Max.   :8.060  
## 

Tạo biểu đồ gốc

#Tạo theme
theme_set(theme_minimal())

p <- ggplot(data, aes(x=carat, y = price)) +
  geom_point(aes(col=cut))
p

#Bước 2: Tạo thêm "layer" cho phép tùy chỉnh các thành phần trong biểu đồ
#Sử dụng layer "theme" để tùy chỉnh

#Bước 2.1: Tạo biểu đồ có title & subtitle
p1 <- p + 
  labs(title = "Diamonds - price vs. carat")
p1

Thay đổi title của biểu đồ với hàm “theme”

  • Trường hợp 1: Cho to cỡ chữ và làm tên biểu đồ dạng “bold”
p1 + 
  theme(plot.title = element_text(size = 15, face = "bold"))

  • Trường hợp 2: Thay đổi font chữ cho tên biểu đồ
#library(extrafont)
p1 + 
  theme(plot.title = element_text(size = 20, 
                                  face = "bold", 
                                  family = "serif"))

  • Trường hợp 3: Xuống dòng cho tên trong biểu đồ
p + 
  ggtitle("Diamonds \nprice vs. carat") + 
  theme(plot.title = element_text(size = 20, 
                                  face = "bold", 
                                  family = "serif"))

Tùy chỉnh tiêu đề trên từng trục biểu đồ

  • Trường hợp 1: Thay đổi cỡ chữ, làm đậm chữ của tiêu đề trục x
p + 
  theme(axis.title.x = element_text(size = 11, 
                                    face = "bold"))

  • Trường hợp 2: Thay đổi font chữ của trục x
p + 
  theme(axis.title.x = element_text(family = "serif", 
                                    face = "bold"))

  • Trường hợp 3: Thay đổi kích cỡ, font chữ ở cả 2 trục
p + 
  theme(axis.title = element_text(family = "serif", 
                                      face = "bold"))

Tùy chỉnh thành phần text trên từng trục biểu đồ

  • Trường hợp 1: Thay đổi kích thước, làm đậm chữ trên trục
p + 
  theme(axis.text.x = element_text(size = 13, face = "italic"))

  • Trường hợp 2: Làm nghiêng chữ trên trục
p + 
  theme(axis.text.x = element_text(size = 13, angle = 45))

  • Trường hơp 3: Thay đổi cả 2 trục
p + 
  theme(axis.text = element_text(size = 13, angle = 45))

Tùy chỉnh phần chú giải của biểu đồ

  • Trường hợp 1: Xóa toàn bộ legend
p + theme(legend.position = "none")

  • Trường hợp 2: Xóa tiêu đề của legend
p + theme(legend.title = element_blank())

  • Trường hợp 3: Thay đổi kích thước, màu sắc của tên legend
p + 
  theme(legend.title = element_text(size = 14, 
                                    face = "bold", 
                                    color = "red"))

  • Trường hợp 4: Thay đổi tên trong legend
p + scale_colour_discrete(name = "Type of diamonds")

  • Trường hợp 5: Thay đổi kích cỡ chữ trong phần legend
p + 
  theme(legend.text = element_text(size =12, 
                                   face = "bold", 
                                   family = "serif"))

 


Tùy chỉnh khung màu trong biểu đồ

Các màu mặc định của GGPLOT2 đáp ứng phần lớn các yêu cầu trong phân tích và báo cáo. Tuy nhiên, khi cần tùy chỉnh màu sắc mặc định này lại có thể rất khó khăn nếu ta không biết cách làm. Trong thực tế, các biểu đồ của các công ty lớn, hoặc các báo cáo phân tích đều phải tuân theo chuẩn màu sắc của cả công ty. Do đó, ta cần phải nắm được cách tùy chỉnh màu sắc của biểu đồ trong R.

Một số mã màu sắc của R có thể tham khảo tại link

Màu của biến rời rạc

  • Trường hợp 1: Tự điền mã màu
p + 
  scale_color_manual(values = c("darkred", "darkblue", "violet", "darkgreen", "orange"))

  • Trường hợp 2: Thay đổi màu sắc theo 1 số chế độ mặc đinh
#Sử dụng Brewer
p + 
  scale_colour_brewer(palette = "Set1")

#Sử dụng bảng màu của Tableau
library(ggthemes)
p + 
  scale_colour_tableau() + 
  theme_tufte()

Màu của biến liên tục

Màu trên GGPLOT2 có thể thay đổi với dài màu liên tục. Xem ví dụ sau.

# Tạo biểu đồ gốc
p <- ggplot(data, aes(x = carat, y = price)) +
  geom_point(aes(col=price))
p

  • Tạo màu theo biến liên tục với scale_color_gradient
p + scale_color_gradient(low = "darkblue", high = "darkred")

  • Tạo màu theo biến liên tục với scale_color_gradient2
p + scale_color_gradient2(midpoint = mean(data$price), 
                          low = "blue4", 
                          mid = "white", 
                          high = "red4")


Như vậy, chúng ta đã vừa biết xong những cách thay đổi các thuộc tính cơ bản nhất của biểu đồ với ggplot2. Chúc các bạn học và làm việc hiệu quả với Ranalytics.vn!

comments powered by Disqus