نیورهاب: سیستم رِیابِلی در بازتوانی رباتیک

Rohail T.
NeuRehab Overview
پژوهشگران در مؤسسه فناوری اطلاعات بین‌المللی (IIIT) بنگلور، یک چارچوب نوآورانه به نام نیورهاب معرفی کردند؛ این چارچوب، یادگیری تقویتی عمیق را با شبکه‌های عصبی پفکی (SNN) کم‌مصرف ترکیب می‌کند تا در خارج از کلینیک، بازتوانی رباتیک را به صورت زمان‑واقعی و با مصرف انرژی پایین فراهم کند. با تقسیم وظایف سنگین به ایستگاه docking مجهز به GPU و نگه‌داری تنها بخش استنتاج روی دستگاه ایج، سیستم مصرف انرژی و تاخیر کنترل را بیش از ششده درصد کاهش داده و عملکرد معادل کنترل‌کننده‌های ANN را ارائه می‌دهد.

اصلی‌ترین نوآوری نیورهاب، معماری هیبریدی آن است. فاز آموزش – شامل بهینه‌سازی سیاست، برآورد ارزش و تنظیمات متغیرهای هِپر – روی ایستگاه docking محاسبه می‌شود. پس از بهینه‌سازی، سیاست به یک عامل پفکی تبدیل می‌شود که بر روی اسلات رُدویی ایج اجرا می‌شود. کرِیتیک، به‌عنوان یک ANN باقی می‌ماند تا پیش‌بینی‌های دقیق ارزش را حفظ کند؛ این طراحی به عنوان Hybrid‑SAC (HSAC) شناخته می‌شود. در حین استنتاج، سیستم از دو بهینه‌سازی سبک وزن استفاده می‌کند: Spiking Post‑Training Temporal Quantisation (SPTTQ) و Sequent Leaky (SLeaky) neurons، که هر دو تعداد پفک‌های مورد نیاز و مقدار ریست حافظه را کاهش می‌دهند و مستقیماً به کاهش مصرف انرژی و سرعت پاسخ‌گویی منجر می‌شوند.

برای اعتبارسنجی چارچوب، تیم دو محیط شبیه‌سازی سفارشی، Kinematic Environment (KENV) و Dynamic Environment (DENV)، هر دو بر اساس API Gymnasium طراحی کرده‌اند. KENV حرکات گام‌دار موتورهای استپر را مدل‌سازی می‌کند، در حالی که DENV فیزیک قفلی گشتاور را شبیه‌سازی می‌کند و بازخوردهای بالینی مانند زوایای مفصل، گشتاور بیمار و تنش را ارائه می‌دهد. سیگنال‌های پاداش، نیروهای بیش‌ازحد، تکان‌های ناگهانی و عدم هم‌راستاگی را مجازات می‌کنند تا کمک نرم و متمرکز بر بیمار را تشویق کنند.

نیورهاب بر روی یک نمونه آزمایشی حرکت شانه در پلتفرم XoRehab آزمایش شد. سیستم از یک موتور استپر با کاهنده 1:15 استفاده می‌کند که می‌تواند موقعیت را بدون مصرف انرژی نگه دارد، این موضوع باعث کاهش مصرف باتری می‌شود. حسگرهای نیرو جایگزین سیگنال‌های EMG نامطمئن شده و بازخورد قابل اعتماد در مورد تلاش بیمار ارائه می‌دهند؛ این اجازه را می‌دهد تا کنترل‌کننده به‌صورت زمان‑واقعی میزان کمک را تنظیم کند. آزمایش‌های اولیه نشان می‌دهد ربات به‌طور خودکار با پیشرفت هر بیمار تنظیم می‌شود، سرعت را تنظیم می‌کند و از تمرین بیش‌ازحد جلوگیری می‌کند، که ایمنی و کارایی بازتوانی سکته را افزایش می‌دهد.

این پژوهش نشان می‌دهد شبکه‌های عصبی پفکی می‌توانند نیازهای زمان‑واقعی و کم‌مصرفی بازتوانی رباتیک را برآورده کنند. با تبدیل سیاست‌های یادگیری تقویتی عمیق به SNN و اعمال بهینه‌سازی‌های معماری، نیورهاب یک معامله انرژی‑عملکرد ارائه می‌دهد که هم به‌ صورت بالینی ارزشمند و هم به‌ صورت فنی پایدار است. کارهای آتی گسترش چارچوب به مفاصل و پروفایل‌های بیمار بیشتری را هدف قرار می‌دهد، راهی برای راه‌حل‌های بازتوانی خودکار، مقرون‌به‌صرفه و گسترده فراهم می‌کند.

منبع: https://quantumzeitgeist.com/60-percent-improvement-reinforcement-learning-neurehab-achieves-robotic-rehabilitation/

Leave a Comment