ابزار جدید AI2 به دانشمندان امکان مکالمه با دادههایشان را میدهد
در سراسر آزمایشگاههای تحقیقاتی، انفجار خاموش دادهها در حال وقوع است. صفحات گسترده، لاگهای دستگاهها و جداول پروژهها روزبهروز گسترش مییابند و مخازن عظیمی از دادههای ساختاریافته را ایجاد میکنند. با این حال، بخش بزرگی از این اطلاعات ارزشمند دستنخورده باقی میماند، زیرا تحلیل آنها نیازمند مهارتهای تخصصی و زمان قابل توجهی است. در واقع، علم حرفهای زیادی برای گفتن دارد، اما ما اغلب راه آسانی برای شنیدن آن نداریم.

موسسه هوش مصنوعی آلن (Ai2) با یک ابزار پیشگامانه به نام Asta DataVoyager به این شکاف ارتباطی رسیدگی میکند. این پلتفرم با فراهم کردن امکان پرسش از مجموعه دادهها با استفاده از زبان ساده و روزمره، تعامل با دادهها را متحول میکند. به جای نوشتن کدهای پیچیده، یک محقق میتواند به سادگی سوالی بپرسد و پاسخهایی کامل همراه با تجسمهای گرافیکی، کدهای قابل اجرا و یک مسیر تحلیل کاملاً مستند دریافت کند. تمرکز این ابزار نه بر ویژگیهای پر زرق و برق، بلکه بر شفافسازی و تکرارپذیری تحلیل دادهها است—دو سنگ بنای علم معتبر.
DataVoyager هر مرحله از تحلیل را به دقت ثبت میکند. هنگامی که سوالی پرسیده میشود، نتیجه به یک گزارش در حال اجرا اضافه میشود. هرگونه تنظیمات بعدی، مانند آزمودن مجدد یک فرضیه یا مدیریت دادههای پرت، به صورت متوالی ضمیمه میشود. این روش تضمین میکند که تحلیل اصلی هرگز از بین نمیرود و یک تاریخچه واضح از آنچه پرسیده شده، چگونه اصلاح شده و کدام یافتهها پایدار بودهاند، ایجاد میکند. این ردپای دقیق، درک استدلال محقق و اعتبارسنجی کار را برای همکاران و داوران بسیار آسانتر میکند.

علی فرهادی، مدیرعامل Ai2، با تأکید بر تعهد این موسسه به ساخت سیستمهای هوش مصنوعی قابل اعتماد، توضیح میدهد: «هوش مصنوعی تنها زمانی میتواند به علم شتاب دهد که به اندازه خود علم، دقیق و شفاف باشد.»
موسسه Ai2 که در سال ۲۰۱۴ توسط پل آلن، یکی از بنیانگذاران مایکروسافت، تأسیس شد، یک سازمان غیرانتفاعی است که به پیشبرد هوش مصنوعی به نفع علم و بشریت اختصاص دارد. Asta DataVoyager اکنون اولین آزمایش بزرگ خود را در یک زمینه حیاتی پشت سر میگذارد: تحقیقات سرطان. اتحاد هوش مصنوعی سرطان (CAIA)، با همکاری چهار مرکز تحقیقاتی برجسته، از این سیستم برای تجزیه و تحلیل دادههای بیماران ناشناس برای کشف بینشهای جدید در مورد نتایج درمانی استفاده میکند.
یک نوآوری کلیدی در پروژه CAIA، رویکرد فدرال و حافظ حریم خصوصی آن است. به جای جمعآوری سوابق حساس بیماران در یک پایگاه داده مرکزی، مدلهای هوش مصنوعی به سمت دادههای محلی هر موسسه حرکت میکنند. این مدلها از اطلاعات موجود در محل یاد میگیرند و تنها نتایج تجمیعی و ناشناس را بازمیگردانند. این امر امکان مطالعات چندموسسهای در مقیاس بزرگ را بدون به خطر انداختن حریم خصوصی بیماران فراهم میکند.
جف لیک، مدیر ارشد داده در مرکز فرد هاچ، پتانسیل عظیمی در قرار دادن این ابزار به طور مستقیم در دستان متخصصان پزشکی میبیند. او میگوید: «من به این ابزار در دستان پزشکان فکر میکنم که به پاسخ دادن به سوالات مهمی کمک میکند که بهترین مراقبت ممکن را برای بیماران سرطانی تضمین خواهد کرد.»

یکی از مطالعات اولیه به بررسی درمانهای سرطان ریه و مقایسه پاسخ بیماران به برنامههای درمانی مختلف میپردازد. چنین مطالعات مقایسهای نیازمند دادههایی از بیمارستانهای متعدد است که انجام آنها با روشهای سنتی دشوار است. DataVoyager با توانمندسازی پزشکانی که ممکن است آموزش گستردهای در زمینه علم داده نداشته باشند، میتواند تحلیل دادههای پیچیده را به بخشی روتین از فعالیتهای علمی و بالینی تبدیل کند.
این ابتکار بخشی از مأموریت گستردهتر Ai2 برای ترویج علم باز است. در اوایل سال جاری، پروژهای به ارزش ۱۵۲ میلیون دلار به نام زیرساخت هوش مصنوعی چندوجهی باز با مشارکت NSF و NVIDIA برای ایجاد مدلهای باز برای استفاده علمی راهاندازی شد. درست مانند آن پروژه، DataVoyager برای ارائه ابزارهایی به محققان طراحی شده است که استفاده از آنها ساده، اشتراکگذاری آنها آسان و به اندازه کافی برای اکتشافات علمی جدی قابل اعتماد باشد.
اطلاعات بیشتر در: https://www.bigdatawire.com/2025/10/02/ai2s-datavoyager-lets-scientists-talk-to-their-data/