ملخص
سيهدف المشروع إلى توسيع أسلوب POT في النمذجة الإحصائية للقيم المتطرفة لدمج العديد من العناصر القابلة للملاحظة (مثل ملوثات الهواء المختلفة) عندما تكون البيانات غير ثابتة بسبب البيئة المتغيرة. سوف يعتمد الحساب على عمليات محاكاة MCMC للحصول على تقديرات لاحقة لمعلمات النموذج. من المرجح أن تتطلب المعالجة المسبقة للبيانات المدخلة تقليل الأبعاد، حيث من المتوقع أن تكون تقنيات التعلم الآلي الحديثة حاسمة.
الوصف الكاملطريقة الذروة فوق العتبة (POT) هي الطريقة الحديثة المفضلة لتحليل القيم المتطرفة في سلسلة زمنية. ويرجع ذلك إلى الاستخدام الأفضل للمعلومات مقارنة بطريقة الكتلة القصوى الكلاسيكية (التي تستخدم قيمة قصوى واحدة فقط في كل كتلة، على سبيل المثال السنة). علاوة على ذلك، في العديد من التطبيقات، غالبًا ما يتم تنفيذ تأثير الحدود المتطرفة من خلال عدد قليل من القيم الكبيرة إلى حد ما وليس بسبب حد أقصى واحد.
تتبع تجاوزات العتبة تقريبًا توزيع باريتو المعمم (GPD) مع معلمتين (المقياس والشكل)، والتي تكون ثابتة إذا كانت البيانات ثابتة (أي أن العملية المرصودة في حالة توازن إحصائي). ومع ذلك، في العديد من المواقف العملية بما في ذلك تلوث الهواء، من المرجح أن تتغير معلمات النظام بشكل كبير مع مرور الوقت. وفقًا لدافيسون وسميث (1990)، ينبغي صياغة تجاوزات العتبات في البيانات غير الثابتة من خلال التعامل مع بارامترات الناتج المحلي الإجمالي كوظائف للمتغيرات المشتركة (المعتمدة على الوقت) (مثل ظروف الطقس وحركة المرور لملوثات الهواء). ومع ذلك، فإن نموذج انحدار دافيسون سميث ليس عتبة مستقرة، مما يعني أنه يجب إعادة تقدير معلمات النموذج مع كل عتبة جديدة (والتي قد تحتاج إلى التغيير مع مرور الوقت). في الآونة الأخيرة، اقترح جيارماتي-زابو وبوجاشيف وتشين (2017) نموذجًا جديدًا لـ POT غير الثابت والذي يكون مستقرًا عند العتبة. يتمتع هذا بإمكانية قوية لتحسين الكفاءة الحسابية لنموذج POT بشكل كبير، مما يجعله أداة قوية ومتعددة الاستخدامات للتقدير الديناميكي والتنبؤ بالظواهر المتطرفة. على وجه الخصوص، قد يكون هذا النهج بمثابة الأساس لأداة حسابية شبه أو مؤتمتة بالكامل مصممة للتقدير الفعال عبر الإنترنت والتنبؤ الدقيق بالأحداث المتطرفة المستقبلية. ونظرًا لخاصية استقرار العتبة، ستعمل هذه الأساليب بكفاءة مع تحديد العتبة المتغيرة.
سيهدف المشروع الحالي إلى تطوير منهجية أكثر عمومية للنمذجة المشتركة للعديد من العناصر التي يمكن ملاحظتها، مثل ملوثات الهواء المختلفة، على سبيل المثال. NO2، NO، O3 وما إلى ذلك، والتي ترتبط بشكل كبير بسبب التفاعلات الكيميائية الضوئية المعقدة في الغلاف الجوي في وجود ضوء الشمس. الابتكار الرئيسي الذي يتعين تحقيقه هو تصميم نموذج POT مناسب متعدد المتغيرات للبيانات غير الثابتة التي من شأنها الحفاظ على خاصية استقرار العتبة. سيتضمن تحليل البيانات بناءً على مثل هذا النموذج عمليات محاكاة MCMC (Markov Chain Monte Carlo) للحصول على توزيعات خلفية لمعلمات النموذج. نظرًا لزيادة العبء الحسابي، قد تتطلب المعالجة المسبقة لبيانات الإدخال تقليل الأبعاد، حيث من المتوقع أن تكون تقنيات التعلم الآلي الحديثة حاسمة.
المراجع
- Beirlant, J., Goegebeur, Y., Teugels, J. and Segers, J. إحصائيات النهايات: النظرية والتطبيقات. وايلي، 2004، https://doi.org/10.1002/0470012382
- نماذج دافيسون، إيه سي وسميث، آر إل للتجاوزات على الحدود العالية. مجلة الجمعية الإحصائية الملكية، سير. ب 52 (1990)، 393–442، http://www.jstor.org/stable/2345667
- جيرماتي-زابو، جيه.، بوجاشيف، إل.في. and Chen, H. نمذجة POT غير الثابتة لتركيزات تلوث الهواء: التحليل الإحصائي لتأثير حركة المرور والأرصاد الجوية. قياس البيئة 28 (2017)، لا. 5، ورقة e2449، 15 صفحة، https://doi.org/10.1002/env.2449
إمكانية تحقيق نتائج عالية التأثير
يعد تحسين جودة الهواء أحد الأهداف الرئيسية للسياسات الحكومية الحالية والبحث الأكاديمي في العلوم البيئية. يتمتع المشروع بإمكانية قوية لإشراك التعاون مع المنظمات الخارجية، مثل مجلس مدينة ليدز، وDEFRA، ووكالة البيئة. من المتوقع أن يحقق المشروع نتائج مهمة قد تكون مفيدة للتقدير الديناميكي والتنبؤ بالأحداث المتطرفة المستقبلية في تلوث الهواء.
التدريب
سيتم الإشراف على هذا المشروع بشكل مشترك من قبل قسم الإحصاء وكلية الحاسب الآلي في ليدز. كما أن لديها إمكانات قوية لإشراك التعاون مع المنظمات الخارجية مثل مكتب الأرصاد الجوية. وسيتضمن الإشراف اجتماعات أسبوعية بين المشرفين والطالب. سيتم توفير التدريب الكامل في التخصصات والمهارات ذات الصلة من خلال الدورات التعليمية والتدريب العمليعلى. وعلى وجه الخصوص، سيتمكن الطالب من الوصول إلى مجموعة واسعة من ورش العمل التدريبية التي تقدمها الكلية والتي تتضمن نطاقًا واسعًا من التدريب في تطوير النظريات والنمذجة العددية وتحليل البيانات.
الملف التعريفي للطالب
يجب أن يتمتع مرشح الدكتوراه الناجح بخلفية قوية في الرياضيات والإحصاء، مع اهتمام قوي وميل إلى النمذجة الإحصائية للقيم المتطرفة. سيكون تقدير مدى تعقيد نمذجة تركيزات تلوث الهواء ميزة، بالإضافة إلى أسس سليمة في التحليل الإحصائي متعدد المتغيرات والإحصاءات البايزية. تشمل المهارات الأساسية المطلوبة للمشروع الاستخدام الكفء لـ R والخبرة في البرمجة والحوسبة الإحصائية بشكل عام، بما في ذلك عمليات محاكاة MCMC.
