توقع الدوري المصري
رحلة إحصائية من التوافيق البسيطة إلى التحديث البايزي في الدوري المصري الممتاز.
الدوري المصري السنادي بيشهد جولة ختامية تاريخية لم تحدث من 34 سنة. 3 فرق بتنافس على اللقب حتى النهاية. في إحدى الليالي العادية، ومع حلول منتصف الليل راودني سؤال بدون مقدمات:
"هي ايه احتمالات فوز الأهلي بالدوري؟"
سؤال غريب شوية لأن أي حد متابع الدوري المصري هيبقى عارف إن السيناريو المطلوب عشان الأهلي يكسب البطولة لازم يكون "إعجازي". بس إحنا بتوع إحصاء، تعالوا نحاول نجاوبه.
حاليًا، ترتيب الدوري: 1- الزمالك، 53 نقطة 2- بيراميدز، 51 نقطة 3- الأهلي، 50 نقطة
فاضل مباراة واحدة فقط ونسدل الستار على الموسم. الزمالك هيواجه نادي سيراميكا كليوباترا (المركز الرابع)، بيراميدز هيواجه نادي سموحة (المركز الخامس)، الأهلي هيواجه النادي المصري (المركز السادس). مواجهات كلها قوية، منقدرش نقول نادي هيفوز اللقاء أكيد.
المرحلة الأولى: التوافيق البسيطة
لكل مباراة من دول 3 أحداث ممكن تحصل: فوز، تعادل، أو هزيمة. نتائج المباريات مستقلة عن بعضها. مثلًا، لو الأهلي فاز مش هيخلي الزمالك يخسر.
27 نهاية مختلفة محتملة.
طب عشان الأهلي يكسب الدوري؟ لازم الأهلي يكسب، لازم الزمالك يخسر، ولازم بيراميدز ميكسبش (تعادل أو هزيمة). كده بنتكلم في [فوز، هزيمة، تعادل] أو [فوز، هزيمة، هزيمة]. سيناريوهين بس من الـ27. يعني نقدر نقسم 2 على 27 مباشرة.
يبقى الحسابات دي أظهرت إن احتمال فوز الأهلي بالدوري حوالي 7%. اللي احنا عملناه ده كله ماهو إلا تطبيق بسيط للاحتمالات التوافقية (combinatorial probability).
احتمال حدث ما = عدد النواتج الممكنة اللي عايزينها ÷ إجمالي النواتج كلها.
مستكشف الكون التفاعلي
قم بتثبيت نتائج مباريات معينة لتصفية الكون. لاحظ كيف تتغير الاحتمالات عندما تنهار الاحتمالات الأخرى.
بس مشكلة الأسلوب ده ايه؟ إننا افترضنا -- ضمنيًا -- تساوي احتمالات الأحداث عند الـ 3 فرق. هل احتمال فوز الأهلي وهزيمته وتعادله واحد وبيساوي 33%؟ الإجابة هي غالبًا لا.
المرحلة الثانية: إضافة الأوزان (الأهداف المتوقعة)
هل احتمال فوز الأهلي قدام المصري نفس احتمال هزيمته؟ هل احتمال تعادل الزمالك قدام سيراميكا نفس احتمال فوزه؟ هل كل سيناريوهات الدوري متساوية؟
إذًا احتمالية الفوز لا تساوي احتمالية التعادل، ولا تساوي احتمالية الهزيمة. يبقى الاحتمالات مش كلها متساوية (33%)، وأكيد في حاجة أعلى من التانية.
هنا يأتي دور الحقائق والبيانات: فورمة الفريق (آخر 5 مباريات)، نسبة الفوز في المرحلة، متوسط الأهداف المسجلة والمستقبلة، المواجهات المباشرة بين الفريقين.
كل فريق بنحسبله رقمين من بيانات الموسم كله (25 مباراة) -> قوة الهجوم وقوة الدفاع. الأهلي مثلاً: هجوم 1.19 ودفاع 0.68. المصري: هجوم 0.99 ودفاع 0.76.
من الرقمين دول بنطلع الأهداف المتوقعة (Expected Goals أو xG) للمباراة. المصري متوقعله 0.95 هدف، الأهلي متوقعله 1.28 هدف.
نستخدم توزيع بواسون (توزيع إحصائي شهير جدًا في تحليل مباريات كرة القدم)، حيث نعتبر أن الـxG يمثل قيمة ، وهو معدل الأهداف المتوقع لكل فريق خلال المباراة.
المصري vs الأهلي -> فوز الأهلي 44.1% الزمالك vs سيراميكا -> خسارة الزمالك 25.9% بيراميدز vs سموحة -> عدم فوز (تعادل أو خسارة) بيراميدز 53.8%
بافتراض استقلال النتائج:
قريب من الـ7.4% اللي طلعنا بيها بالتوافيق، بس دلوقتي الرقم مبني على بيانات حقيقية.
النموذج ده بيجاوب على سؤال واحد: إيه المتوقع يحصل؟ بس في عالم النمذجة الإحصائية، ماذا لو جربنا كل التوليفات الممكنة الاف المرات ونشوف ايه اللي بيحصل؟
المرحلة الثالثة: محاكاة مونت كارلو
ماذا يحدث لو لعبنا المباراة الأخيرة آلاف المرات بدل مرة واحدة؟ هنا يدخل واحد من أشهر أساليب المحاكاة والإحصاء في العالم: Monte Carlo Simulation.
الفكرة ببساطة: بدل ما نحسب كل الاحتمالات يدويًا، نخلي الكمبيوتر "يلعب" الجولة الأخيرة آلاف المرات، وفي كل مرة يختار نتائج المباريات بناءً على الاحتمالات اللي طلعناها من نموذج بواسون.
بعد آلاف المحاكاة، كانت النتيجة المبدئية: الزمالك: 65.1% بيراميدز: 11.9% الأهلي: 0% تعادل في النقاط: 23%
الأهلي فاز في 44% من المحاكاة، والزمالك خسر في 26% منها، بس الموديل قال صفر! السبب إن الموديل المبدئي كان بيعامل أي تعادل في النقاط كـ"نتيجة مجهولة" من غير ما يحسم مين بيكسب في النهاية.
وبمجرد ما أضفنا قاعدة الفصل الأهم، المواجهات المباشرة، الصورة اتغيرت تماماً: الزمالك: 81.9% بيراميدز: 11.9% الأهلي: 6.2%
محرك مونت كارلو
المدهش إن نسبة الأهلي النهائية طلعت شبه مطابقة تقريبًا للرقم اللي حسبناه يدويًا (6.1%). وده معناه إن النموذج كان متماسك جدًا حتى بعد آلاف التجارب العشوائية.
Monte Carlo لا يحاول "التنبؤ بالمستقبل" بشكل سحري. هو فقط يسأل: "إذا كانت هذه الاحتمالات صحيحة… فما الذي سيحدث لو أعدنا التجربة آلاف المرات؟"
المرحلة الرابعة: تحديث الاعتقاد (نظرية بايز)
حتى الآن، كل الاحتمالات اللي استخدمناها اعتبرناها ثابتة. كأن العالم لا يتغير. ماذا لو ظهرت معلومة جديدة قبل المباراة؟ إصابة مفاجئة؟ غياب لاعب؟ هل نتمسك بالأرقام القديمة أم نقوم بتحديث قناعتنا بالكامل؟
إحنا آخر حاجة وصلنا ليها احتمالات فوز كل فريق بالدوري كانت: الزمالك 81.9%، بيراميدز 11.9%، الأهلي 6.2%. طيب المفروض لو الأهلي فاز قدام المصري إيه اللي يغير في احتمالات فوزه؟
فرضنا اللي عايزين نقيسه هو فوز الأهلي بالدوري وليكن A باحتماله: 6.2%. واحتمال فوز الأهلي على المصري: 44.1%.
القانون البسيط لنظرية بايز:
إيه احتمالية فوز الأهلي بالمباراة بشرط إنهم خدوا الدوري؟ "لازم يكسب" يعني أكيد، والأكيد احتماله 1.
1. الاعتقاد السابق P(A)
الفرصة الأولية للفوز بالدوري
2. الدليل P(B)
احتمالية الفوز بالمباراة
3. الاحتمالية P(B|A)
ثابتة عند 100% (مباراة لا بد من الفوز بها)
الاستنتاج الديناميكي
قم بتعديل الاعتقاد السابق أو احتمالية الدليل الجديد لترى كيف تقوم نظرية بايز بتحديث اعتقادنا بفوز الأهلي باللقب.
اتضاعف الاحتمال تقريباً، وهنا يكمن سر جمال نظرية بايز (Bayes' Theorem)؛ إن بناءً على دليل وجدته، غيّرت مفهومك واعتقادك بشكل كبير.
خاتمة
من التخمين إلى المحاكاة المنطقية
جمال الإحصاء
ربما لا يكون السؤال الحقيقي "من سيفوز بالدوري؟"، بل "كيف نحاول قياس شيء بهذه الفوضى؟" الإحصاء بيحول الفوضى العشوائية لرحلة منطقية في بناء الاحتمالات وتحديث القناعات.
وراء الأرقام
النموذج "لا يفهم" كرة القدم، فقط يرى فيها أنماطًا. النمذجة هي محاولة مطابقة الماضي مع الحاضر عشان يدي نظرة على المستقبل.