ملخص
تمثل نمذجة الأنشطة الجراحية والتعرف عليها في الفيديو مشكلة بحثية مثيرة للاهتمام. على الرغم من أن عددًا من الأعمال الحديثة درست التعرف التلقائي على الأنشطة الجراحية، إلا أن تعميم هذه الأعمال عبر مهام مختلفة ومجموعات بيانات مختلفة لا يزال يمثل تحديًا.
على سبيل المثال، قد يتم وضع عقدة التعادل أثناء مهمة خياطة الأنسجة وأيضًا أثناء المهمة الأكثر تحديدًا وتحديًا المتمثلة في مفاغرة مجرى البول (UVA) التي تتضمن خياطة وإعادة ربط بنيتين تشريحيتين معًا. إذا اعتمدنا بشكل كبير على إشارات الصور للمشهد الجراحي، فإن تمثيل هذه الأنشطة الجراحية يختلف بشكل كبير.
علاوة على ذلك، تتزايد الحاجة إلى تمثيلات ذات قوة تعبيرية أكبر يمكننا استخدامها ليس فقط للتعرف على الأنشطة الجراحية ولكن أيضًا لسد الفجوة بين التعرف والتحكم في الأنظمة المستقلة.
في هذا المشروع سوف نستكشف طرائق مختلفة، والتمثيلات المكانية والزمانية، ونماذج البروز والانتباه لفهم النشاط الجراحي. من المتوقع أن يكون لديك معرفة جيدة بالموضوعات الأساسية في رؤية الكمبيوتر والتعلم العميق، إلى جانب مهارات البرمجة القوية في لغة بايثون. يفضل الخبرة في موضوعات التعلم العميق المتقدمة.
سيسمح المشروع باستكشاف أفكار وموضوعات مختلفة، وسيوفر فرصة للعمل مع متعاونين من تخصصات مختلفة (الطب والروبوتات والتعليم الجراحي والإدراك).
