

پژوهشگران در مؤسسه فناوری اطلاعات بینالمللی (IIIT) بنگلور، یک چارچوب نوآورانه به نام نیورهاب معرفی کردند؛ این چارچوب، یادگیری تقویتی عمیق را با شبکههای عصبی پفکی (SNN) کممصرف ترکیب میکند تا در خارج از کلینیک، بازتوانی رباتیک را به صورت زمان‑واقعی و با مصرف انرژی پایین فراهم کند. با تقسیم وظایف سنگین به ایستگاه docking مجهز به GPU و نگهداری تنها بخش استنتاج روی دستگاه ایج، سیستم مصرف انرژی و تاخیر کنترل را بیش از ششده درصد کاهش داده و عملکرد معادل کنترلکنندههای ANN را ارائه میدهد.
اصلیترین نوآوری نیورهاب، معماری هیبریدی آن است. فاز آموزش – شامل بهینهسازی سیاست، برآورد ارزش و تنظیمات متغیرهای هِپر – روی ایستگاه docking محاسبه میشود. پس از بهینهسازی، سیاست به یک عامل پفکی تبدیل میشود که بر روی اسلات رُدویی ایج اجرا میشود. کرِیتیک، بهعنوان یک ANN باقی میماند تا پیشبینیهای دقیق ارزش را حفظ کند؛ این طراحی به عنوان Hybrid‑SAC (HSAC) شناخته میشود. در حین استنتاج، سیستم از دو بهینهسازی سبک وزن استفاده میکند: Spiking Post‑Training Temporal Quantisation (SPTTQ) و Sequent Leaky (SLeaky) neurons، که هر دو تعداد پفکهای مورد نیاز و مقدار ریست حافظه را کاهش میدهند و مستقیماً به کاهش مصرف انرژی و سرعت پاسخگویی منجر میشوند.
برای اعتبارسنجی چارچوب، تیم دو محیط شبیهسازی سفارشی، Kinematic Environment (KENV) و Dynamic Environment (DENV)، هر دو بر اساس API Gymnasium طراحی کردهاند. KENV حرکات گامدار موتورهای استپر را مدلسازی میکند، در حالی که DENV فیزیک قفلی گشتاور را شبیهسازی میکند و بازخوردهای بالینی مانند زوایای مفصل، گشتاور بیمار و تنش را ارائه میدهد. سیگنالهای پاداش، نیروهای بیشازحد، تکانهای ناگهانی و عدم همراستاگی را مجازات میکنند تا کمک نرم و متمرکز بر بیمار را تشویق کنند.
نیورهاب بر روی یک نمونه آزمایشی حرکت شانه در پلتفرم XoRehab آزمایش شد. سیستم از یک موتور استپر با کاهنده 1:15 استفاده میکند که میتواند موقعیت را بدون مصرف انرژی نگه دارد، این موضوع باعث کاهش مصرف باتری میشود. حسگرهای نیرو جایگزین سیگنالهای EMG نامطمئن شده و بازخورد قابل اعتماد در مورد تلاش بیمار ارائه میدهند؛ این اجازه را میدهد تا کنترلکننده بهصورت زمان‑واقعی میزان کمک را تنظیم کند. آزمایشهای اولیه نشان میدهد ربات بهطور خودکار با پیشرفت هر بیمار تنظیم میشود، سرعت را تنظیم میکند و از تمرین بیشازحد جلوگیری میکند، که ایمنی و کارایی بازتوانی سکته را افزایش میدهد.
این پژوهش نشان میدهد شبکههای عصبی پفکی میتوانند نیازهای زمان‑واقعی و کممصرفی بازتوانی رباتیک را برآورده کنند. با تبدیل سیاستهای یادگیری تقویتی عمیق به SNN و اعمال بهینهسازیهای معماری، نیورهاب یک معامله انرژی‑عملکرد ارائه میدهد که هم به صورت بالینی ارزشمند و هم به صورت فنی پایدار است. کارهای آتی گسترش چارچوب به مفاصل و پروفایلهای بیمار بیشتری را هدف قرار میدهد، راهی برای راهحلهای بازتوانی خودکار، مقرونبهصرفه و گسترده فراهم میکند.
منبع: https://quantumzeitgeist.com/60-percent-improvement-reinforcement-learning-neurehab-achieves-robotic-rehabilitation/