Các đơn hàng có theo mô hình phân phối chuẩn (đường cong Gauss)?

Công việc chính của mình liên quan đến quảng cáo, tuy nhiên vì nhóm làm rất nhỏ nên cũng thường phải kiêm việc, việc phụ là kế toán.

Hiển nhiên công việc này làm mình để ý đến giá trị cũng như số lượng của đơn hàng, và một phát hiện thú vị nhưng chắc chắn là không mới (với những người từng bán hàng và cả người mua hàng tinh ý):

Có những đơn hàng có giá trị lớn, có những đơn hàng có giá trị nhỏ, và cả hai cái này có số lượng không nhiều. Phần lớn các đơn hàng có giá trị trung bình.

Cái này nghe rất quen phải không?

Tuổi thọ, chiều cao, cân nặng, huyết áp, điểm các bài thi đều có kiểu tương tự như vậy.

Nhà toán học Gauss đã phát hiện ra mô hình này, ngày nay nó có tên gọi là phân phối chuẩn – rất quan trọng khi làm thống kê. Trên đồ thị, nó có hình giống như cái chuông, còn gọi là đường cong Gauss, như hình bên dưới.

phan-phoi-chuan
Ảnh của mathsisfun

Chúng ta thấy là phần lớn nằm quanh giá trị trung bình, và giảm dần khi đi xa khỏi trung tâm. Như phần lớn mọi người có chiều cao quanh giá trị trung bình, sau đó giảm dần về cả hai bên, có tỉ lệ rất ít người cao 2m, tương tự vậy, hiếm lắm mới có người cao 1m.

Công thức toán học của phân phối chuẩn trông rất phức tạp với ai không quen với toán, và trong bài này mình cũng không viết ra vì thấy không cần thiết (nói thực với mình nó cũng phức tạp).

Tìm hiểu thêm về phân phối chuẩn, bạn có thể tham khảo một số bài dưới đây:

  • Phân phối chuẩn – bác sĩ Nguyễn Văn Tuấn viết: http://bomonoiydhue.edu.vn/upload/file/lstk11_phanphoichuan.pdf
  • Toán học có gì thu hút (phụ đề tiếng Việt) – Cédric Villani (bác này từng giành được Fields Medal giống bác Bảo Châu nhé). Đoạn đầu bác nói khá nhiều về đường cong Gauss https://www.ted.com/talks/cedric_villani_what_s_so_sexy_about_math?language=vi
  • Một trò chơi minh hoạ cho phân phối chuẩn: https://www.mathsisfun.com/data/quincunx.html
  • Bài viết khá đơn giản và dễ hiểu: https://www.mathsisfun.com/data/standard-normal-distribution.html

Quay trở lại câu hỏi lúc ban đầu dựa trên cảm tính: liệu các đơn hàng mà bên mình bán có tuân theo quy luật của phân phối chuẩn không?

Sau khi phân tích từ cơ sở dữ liệu (mình lấy toàn bộ luôn, không phải lấy mẫu nhỏ), hình bên dưới là kết quả, với trục tung là số lượng đơn hàng, trục hoành là giá trị đơn (các con số cụ thể không được ghi trong hình):

phan-phoi-don-hang-thang-7

Bức hình đã tiết lộ tất cả, mặc dù đúng là hầu hết các đơn hàng giá trị lớn nhất (bên phải) ít dần, cũng vậy với các đơn hàng nhỏ nhất (bên trái) ít dần, và rất nhiều đơn giá trị trung bình nằm ở giữa, nhưng đây KHÔNG phải là phân phối chuẩn! Nó trông như có hai đỉnh lớn và một đỉnh nhỏ – hoàn toàn khác với đường cong Gauss mềm mại.

Hơi thất vọng một tí, nhưng cũng thấy hay, vì nếu không làm đến nơi thì vẫn đinh ninh nó là phân phối chuẩn!

Câu hỏi tiếp theo: Vì sao lại thế?

Các nghiên cứu nói rằng nhiều quy luật trong thiên nhiên tuân theo phân phối chuẩn.

Đoán mò thôi: dù sao bán hàng cũng là hoạt động ít nhiều bị chi phối bởi yếu tố nhân tạo.

Leave a Comment