Nghĩ lại trong thống kê học có những hằng số hết sức lí thú và quan trọng. Chúng ta đã biết những con số như 0.05 (trị số P), 1.96 (hằng số của phân bố chuẩn) có ảnh hưởng đến cuộc sống như thế nào. Nhưng có lẽ ít ai biết đến qui luật 37%. Đây là một qui luật mới được tái khám phá, nhưng có nhiều ứng dụng trong y khoa, khoa học, tìm nhân viên, thậm chí ... tình yêu.
Qui luật 37% bắt đầu từ một vấn đề hết sức nan giải, có tên là "The Secretary Problem" (Vấn đề Thư kí). Vấn đề này được phát biểu như sau:
• Có một vị trí thư kí trống;
• Công ti có n ứng viên xin vào vị trí đó;
• Các ứng viên được phỏng vấn tuần tự, nhưng thứ tự hoàn toàn ngẫu nhiên, và do đó, xác suất người thích hợp nhất là 1/n;
• Một khi ứng viên được phỏng vấn và bị từ chối, thì ứng viên đó sẽ không được quay lại tham gia vào qui trình tìm;
• Tương tự, khi một ứng viên được chấp nhận, thì qui trình tìm người thư kí sẽ chấm dứt.
Vấn đề là n có thể lớn, và công ti không có đủ thì giờ cũng như tài nguyên để phỏng vấn tất cả. Do đó, câu hỏi đặt ra là công ti cần phải phỏng vấn bao nhiêu người (k) để có xác suất chọn đúng người cao nhất.
Lời đáp cho câu hỏi này hoá ra hết sức đơn giản: 36.79%, hay làm chẵn là 37%. Nói cụ thể hơn, công ti nên phỏng vấn 37% số ứng viên đầu tiên, bỏ qua tất cả số ứng viên đó, và chọn ứng viên đầu tiên sau 37% có kinh nghiệm tốt hơn những ứng viên trước. Đáp số này còn cho phép công ti kết luận rằng xác suất mà công ti chọn được ứng viên tốt nhất là 37%. Con số 37% thật ra là 1/e (e ở đây là hằng số Euler, tức là 2.718). Chi tiết tính toán (không khó) có thể tham khảo qua trang này (1).
Lịch sử cận đại của Vấn đề Thư kí có lẽ bắt đầu từ thập niên 1950s, nhưng người đầu tiên giải vấn đề này thì chưa rõ. Trên tập san khoa học, người đầu tiên chứng minh Qui luật 37% là nhà thống kê học lừng danh Dennis Lindley (2, hình) vào năm 1961. Mới đây, Qui luật 37% được tái khám phá qua cuốn sách rất thú vị có tựa đề là "The Mathematics of Love" (Toán học của tình yêu) của tác giả Hannah Fry (University College of London), và cuốn Risk Savvy của Giáo sư tâm lí học Gerg Gigerenzer (một "hero" của tôi). Đây là hai cuốn sách được viết cho đại chúng, rất dễ hiểu, rất giải trí cho những dịp nghỉ hè. Nhưng tác giả cũng tự chứng tỏ là những người rất am hiểu về xác suất trong cuộc sống, đặc biệt là áp dụng lí thuyết xác suất trong ... tình yêu.
Dennis Lindley
Thật vậy, Qui luật 37% cũng có thể ứng dụng trong việc tìm người bạn đời. Như các bạn có thể đoán được, theo Qui luật này, bạn không nên kết hôn với người mình mới quen lần đầu, mà phải cố gắng làm quen và "đánh giá" một số n người. Sau đó, bạn làm quen và "tìm hiểu" n/e người, và chọn người sau n/e có phẩm hạnh tốt nhất so với n/e người kia.
Giả dụ như bạn có "cỡ mẫu" là 50 người (hơi nhiều!), bạn nên làm quen với 18 người trước để thu thập thông tin, sau đó bạn chọn người 19 trở đi có phẩm hạnh tốt hơn 18 người kia. Do đó, "người tình trăm năm" của bạn có thể là người 19, hay 20, hay thậm 25. Dĩ nhiên, sau khi đã chọn được người thích hợp sau người thứ 18 thì phải ngưng, không cần tìm thêm nữa.
Một khó khăn là xác định bạn cần bao nhiêu n ứng viên. Chúng ta có thể áp dụng công thức ước tính cỡ mẫu để xác định n với một sai số mẫu e%. Tuy nhiên, việc chọn bạn tình là chuyện rất nghiêm trọng, nên có thể sai số mẫu phải hạ thấp xuống cỡ e = 1% hay 2%.
Dĩ nhiên, trong giới nghiên cứu y khoa "hardcore", thì chẳng ai mà không biết đến Qui luật 37%, vì nó đã từng được lí giải và ứng dụng trong thực tế nghiên cứu lâm sàng. Trong y khoa học, qui luật này có tên là "Stopping rule" và được ứng dụng trong các nghiên cứu lâm sàng giai đoạn I, nhưng cái "twist" hơi phức tạp hơn một chút.
Cố nhiên, Qui luật 37% không chỉ ứng dụng trong y khoa, tìm người bạn tình tối ưu, hay tìm nhân viên, mà còn được ứng dụng trong nhiều lĩnh vực và tình huống khác, tuỳ vào sự sáng tạo của người ứng dụng. Nên nhớ rằng Qui luật 37% cho chúng ta kết quả với xác suất tối ưu chỉ 37%, tức vẫn có thể sai 63%. Nhưng với nhiều ứng viên mà chúng ta không biết gì về họ, thì Qui luật 37% vẫn là giải pháp tốt nhất và rẻ nhất để tìm đúng người.
Một ứng dụng sáng tạo khác của Qui luật 37% là tìm tuổi thành hôn tối ưu. Nếu độ tuổi thành hôn trong khoảng 18-40, chúng ta có khoản thời gian 22 năm để chọn. Như vậy Qui luật 37% cho biết chúng ta nên chọn tuổi 27, tức là sau tuổi 26 (0.37*22 + 18). Bởi vì nếu thành hôn trước tuổi 26 sẽ có thể sẽ bỏ mất các ứng viên tốt.
Bởi vì bản chất của kết quả vẫn là xác suất, nên cần phải xem xét các khía cạnh dương tính giả (tức chọn sai người) và âm tính giả (tức bỏ sót người tốt), nhưng đây là chủ đề của một cái note khác. Hi vọng rằng qua Qui luật 37% các bạn đã tiết kiệm thì giờ để tìm nhân viên hay tìm người tình trăm năm.
===
(1) https://plus.maths.org/content/solution-optimal-stopping-problem
(2) Dennis Lindley (1923-2013) là một trong những nhà thống kê học distinguished nhất trên thế giới, đứng chung hàng với các "đại thụ" như David Cox, C. R. Rao, H. Jeffreys, Sam Wilks, I. J. Good, Fred Mosteller. Khác với những người cùng thời theo trường phái tần số, Giáo sư Lindley theo trường phái Bayes và có những đóng góp quan trọng. Trong một bài báo năm 2008 trên Stat Sci, Dennis Lindley đặt nền móng cho khoa học thống kê trong thế kỉ 21: thống kê học là một khoa học của bất định; bất định nên được "đo" bằng xác suất; sự bất định của dữ liệu là điều kiện của tham số; và do đó, suy luận thống kê phải theo trường phái ... Bayes. Phải có trải nghiệm thực tế mới thấy ý tưởng này của ông rất đúng và rất thích hợp.
Không có nhận xét nào:
Đăng nhận xét