Hiểu và phân tích các mối tương quan khác nhau có thể mang lại lợi ích cho các ngành khác nhau. Chẳng hạn nếu bạn sở hữu một tiệm bánh, bạn có thể quyết định sẽ làm nhiều donut dừa hơn vào các ngày thứ Sáu dựa trên mối tương quan giữa nhu cầu donut dừa và ngày trong tuần.
Nói chung, mối tương quan (Correlation) giữa hai biến số có thể giúp bạn đưa ra quyết định có tác động tích cực đến doanh nghiệp của bạn.
Bài viết dưới đây sẽ thảo luận vấn đề tương quan correlation là gì, các loại hệ số tương quan khác nhau và giải thích cách tính toán nó.
1. CORRELATION LÀ GÌ?
Thuật ngữ Correlation (Tương quan) đề cập đến mối quan hệ thống kê giữa hai thực thể. Nói cách khác, đó là cách hai biến di chuyển trong mối quan hệ với nhau. Tương quan cũng có thể được sử dụng cho các tập dữ liệu khác nhau.
Trong một số trường hợp, bạn có thể đã dự đoán được mọi thứ sẽ tương quan như thế nào, trong khi ở những trường hợp khác, mối quan hệ đó sẽ khiến bạn bất ngờ. Điều quan trọng là phải hiểu rằng mối tương quan không có nghĩa là mối quan hệ nhân quả.
Để hiểu mối tương quan hoạt động như thế nào, điều quan trọng là phải hiểu các thuật ngữ sau:
- Tương quan dương: Tương quan dương sẽ là 1. Điều này có nghĩa là hai biến cùng di chuyển lên hoặc xuống theo cùng một hướng.
- Tương quan âm: Tương quan âm là -1. Điều này có nghĩa là hai biến di chuyển theo hướng ngược nhau.
- Bằng 0 hoặc không có tương quan: Tương quan bằng 0 có nghĩa là không có mối quan hệ nào giữa hai biến. Nói cách khác, khi một biến di chuyển theo một hướng thì biến kia sẽ di chuyển theo một hướng khác không liên quan.
2. CÁC LOẠI HỆ SỐ TƯƠNG QUAN
Trong khi mối tương quan nghiên cứu cách hai thực thể liên quan với nhau thì hệ số tương quan đo lường mức độ mạnh mẽ của mối quan hệ giữa hai biến. Trong thống kê, có ba loại hệ số tương quan. Các loại này bao gồm:
- Tương quan Pearson: Tương quan Pearson là phép đo được sử dụng phổ biến nhất cho mối quan hệ tuyến tính giữa hai biến. Mối tương quan giữa hai tập dữ liệu này càng mạnh thì nó càng gần với +1 hoặc -1.
- Tương quan Spearman: Loại tương quan này được sử dụng để xác định mối quan hệ đơn điệu hoặc liên kết giữa hai tập dữ liệu. Không giống như hệ số tương quan Pearson, nó dựa trên các giá trị được xếp hạng cho từng tập dữ liệu và sử dụng các biến lệch hoặc thứ tự thay vì các biến được phân phối thông thường.
- Tương quan Kendall: Loại tương quan này đo lường mức độ phụ thuộc giữa hai tập dữ liệu.
Biết các biến của bạn sẽ hữu ích trong việc xác định loại hệ số tương quan nào bạn sẽ sử dụng. Sử dụng phương trình tương quan phù hợp sẽ giúp bạn hiểu rõ hơn về mối quan hệ giữa các tập dữ liệu bạn đang phân tích.
3. CÁCH TÍNH HỆ SỐ TƯƠNG QUAN
Bạn có thể sử dụng phương trình sau để tính tương quan:
∑ (x(i) – x̅)(y(i) – ȳ) / √ ∑(x(i) – x̅) ^2 ∑(y(i) – ȳ)^2
Khi tính toán mối tương quan, hãy ghi nhớ các biểu diễn sau:
- x(i) = giá trị của x
- y(i) = giá trị của y
- x̅ = giá trị trung bình của giá trị x
- ȳ = giá trị trung bình của giá trị y
Thực hiện theo các bước sau để tính hệ số tương quan:
3.1. Xác định tập dữ liệu của bạn
Khi bắt đầu tính toán, hãy xác định các biến của bạn sẽ là gì. Bạn có thể sắp xếp chúng thành biểu đồ nếu điều đó giúp bạn hình dung rõ hơn về chúng. Phân tách chúng bằng các biến x và y. Ví dụ:
x: (1, 2, 3, 4) và y: (2, 3, 4, 5)
3.2. Tính giá trị trung bình của biến x và y
Để tính giá trị trung bình, hãy cộng các giá trị của từng biến lại với nhau và chia cho số giá trị trong tập dữ liệu đó.
Sử dụng ví dụ này, nếu bạn tính giá trị trung bình của x, bạn phải cộng 1, 2, 3 và 4 với nhau rồi chia cho 4 vì bạn có bốn giá trị cho x.
Làm tương tự với các biến y. Sử dụng ví dụ trên, bạn sẽ cộng 2, 3, 4 và 5 rồi chia cho 4 vì bạn có bốn giá trị cho y.
3.3. Trừ đi giá trị trung bình
Đối với biến x, hãy trừ giá trị trung bình khỏi mỗi giá trị của biến x và gọi nó là “a”. Đối với biến y, hãy trừ giá trị trung bình khỏi mỗi giá trị của biến y và gọi nó là “b”.
3.4. Nhân và tìm tổng
Nhân mỗi giá trị a với giá trị b tương ứng. Sau khi bạn làm xong việc này, hãy tìm tổng, số này sẽ trở thành tử số của công thức.
3.5. Lấy căn bậc hai
Tại thời điểm này, bạn có thể bình phương mọi giá trị a và xác định tổng của kết quả. Sau khi thực hiện xong, hãy tính căn bậc hai của giá trị bạn vừa xác định. Đây sẽ là mẫu số của công thức.
3.6. Chia
Chia tử số (giá trị bạn xác định ở bước 4) cho mẫu số (giá trị bạn xác định ở bước 5). Điều này sẽ cho ra kết quả là hệ số tương quan.
Nếu bạn thích tính toán bằng kỹ thuật số, có các công cụ tính tương quan trực tuyến. Phương pháp này hiệu quả hơn khi bạn có bộ dữ liệu lớn hơn.
4. VÍ DỤ THỰC TẾ CORRELATION LÀ GÌ?
Sử dụng các ví dụ tương quan sau đây để giúp bạn phân tích tốt hơn các kết quả tương quan từ bộ dữ liệu của riêng bạn.
4.1. Positive correlation là gì?
Dưới đây là một số ví dụ về mối tương quan dương:
- Bạn càng dành nhiều thời gian cho một dự án thì bạn càng bỏ ra nhiều công sức hơn.
- Bạn càng kiếm được nhiều tiền thì bạn càng phải trả nhiều thuế.
- Bạn càng tử tế với nhân viên thì họ càng tôn trọng bạn.
- Càng học nhiều, bạn càng thông minh hơn.
- Càng làm thêm giờ, bạn càng kiếm được nhiều tiền.
4.2. Negative correlation là gì?
Dưới đây là một số ví dụ về mối tương quan âm:
- Bạn càng trả nhiều tiền cho khoản vay thì số tiền bạn nợ càng ít.
- Khi số lượng nhân viên của bạn giảm đi, bạn sẽ càng có nhiều vị trí việc làm được mở.
- Càng làm việc nhiều ở văn phòng, bạn càng có ít thời gian ở nhà.
- Càng thuê nhiều nhân viên, bạn càng có ít tiền.
- Bạn càng dành nhiều thời gian cho một dự án thì bạn càng có ít thời gian hơn.
4.3. Correlation bằng 0
Dưới đây là một số ví dụ về các thực thể có tương quan bằng 0:
- Bạn càng đối xử tốt với nhân viên của mình thì lương của họ sẽ càng cao.
- Bạn càng thông minh thì bạn sẽ đến nơi làm việc càng muộn.
- Bạn càng giàu thì bạn càng hạnh phúc.
- Bạn đến nơi làm việc càng sớm thì nhu cầu về nguồn cung cấp của bạn càng tăng lên.
- Bạn càng đầu tư nhiều tiền vào doanh nghiệp của mình thì càng có nhiều nhân viên nghỉ việc sớm.
5. ĐIỂM KHÁC BIỆT CỦA COVARIANCE VÀ CORRELATION LÀ GÌ?
Mặc dù cả hiệp phương sai và tương quan đều đo lường mối quan hệ giữa hai biến, nhưng hai giá trị này có thể cung cấp cho bạn thông tin khác nhau.
Khi đo hiệp phương sai, bạn đang tính tổng biến thiên giữa hai biến ngẫu nhiên khi tính chúng từ các giá trị dự đoán. Sử dụng phép đo này, bạn có thể xác định xem hiệp phương sai là dương hay âm. Tuy nhiên, hiệp phương sai không tập trung vào loại mối quan hệ giữa các biến hoặc liệu một biến có phụ thuộc vào biến kia hay không.
Tuy nhiên, mối tương quan sẽ đánh giá mối quan hệ và liệu một biến độc lập có ảnh hưởng đến biến phụ thuộc hay không. Không giống như hiệp phương sai, hệ số tương quan vẫn là một giá trị thuần túy chứ không phải là phép đo đơn vị. Điều này trở nên quan trọng khi xác định các yếu tố gây ra sự kiện hoặc kết quả trong một tập hợp dữ liệu mẫu.
6. TÓM LƯỢC
Tính toán mối tương quan đặc biệt hữu ích nếu bạn là nhà quản lý đầu tư hoặc nhà phân tích.
7. CÂU HỎI THƯỜNG GẶP (FAQ)
Trong thống kê correlation là gì?
Trong thống kê, mối tương quan là một thống kê thiết lập mối quan hệ giữa hai biến. Nói cách khác, nó là thước đo sự liên kết của các biến.
Correlation bằng 1 là gì?
Mối tương quan 1 hoặc +1 cho thấy mối tương quan dương hoàn hảo, có nghĩa là cả hai biến đều di chuyển theo cùng một hướng.
Hệ số tương quan -1 cho thấy mối tương quan nghịch hoàn toàn, có nghĩa là khi một biến giảm thì biến kia tăng.
Correlation bằng 0,45 có nghĩa là gì?
Chúng ta biết rằng hệ số tương quan bằng 1 có nghĩa là hai biến có mối tương quan dương, trong khi nếu hệ số tương quan bằng 0 thì không có mối tương quan giữa hai biến. Do đó, hệ số tương quan 0,45 có nghĩa là 45% phương sai của một biến, giả sử x, được tính bởi biến thứ hai, giả sử y.
Một ví dụ correlation là gì?
Có thể quan sát được mối tương quan dương, âm hoặc không có giữa hai biến. Một ví dụ về mối tương quan dương sẽ là kích thước và trọng lượng. Những vật lớn trông nặng hơn và ngược lại. Ngoài ra, các vật nhỏ có xu hướng trông mỏng.