سوئیس با Apertus پیشگام عصر جدیدی از هوش مصنوعی باز میشود
در اقدامی مهم برای جامعه جهانی هوش مصنوعی، کنسرسیومی از مؤسسات پیشرو سوئیس از یک مدل هوش مصنوعی باز و نوآورانه به نام Apertus رونمایی کردهاند. این مدل که با همکاری بین EPFL، ETH زوریخ و مرکز ملی ابررایانه سوئیس (CSCS) توسعه یافته است، آماده است تا به یک منبع حیاتی برای نوآوری، تحقیق و توسعه برنامههای کاربردی در سراسر جهان تبدیل شود.

نام Apertus که در لاتین به معنای «باز» است، مأموریت اصلی این پروژه را به خوبی بیان میکند. برخلاف بسیاری از سیستمهای هوش مصنوعی معاصر که به صورت «جعبه سیاه» با شفافیت محدود عمل میکنند، Apertus با رویکرد ۱۰۰٪ باز طراحی شده است. تمام جنبههای آن—از معماری زیربنایی و دادههای آموزشی گرفته تا فرآیند کامل توسعه—به صورت عمومی در دسترس قرار گرفته و استاندارد جدیدی برای اعتماد و مسئولیتپذیری در هوش مصنوعی تعیین میکند.
این ابتکار به توسعهدهندگان، محققان و سازمانها قدرت میدهد تا طیف متنوعی از ابزارها، از جمله چتباتهای پیشرفته، خدمات ترجمه همزمان و پلتفرمهای آموزشی نوآورانه را بسازند. Apertus در دو اندازه به راحتی در دسترس است: یک مدل چابک ۸ میلیارد پارامتری و یک نسخه قدرتمندتر ۷۰ میلیارد پارامتری. هر دو تحت یک مجوز منبعباز آسانگیر توزیع شدهاند که استفاده گسترده برای پروژههای آکادمیک، تجاری و شخصی را بدون هزینههای محدودکننده مجوز تشویق میکند.
طرحی برای هوش مصنوعی قابل اعتماد
ابتکار هوش مصنوعی سوئیس قصد دارد Apertus چیزی فراتر از یک مدل دیگر باشد؛ این مدل به عنوان یک طرح اولیه برای ایجاد هوش مصنوعی قابل اعتماد، مستقل و فراگیر در نظر گرفته شده است. مارتین یاگی، استاد EPFL، بر این دیدگاه تأکید کرد و گفت: «با این عرضه، ما قصد داریم طرحی برای چگونگی توسعه یک مدل هوش مصنوعی قابل اعتماد، مستقل و فراگیر ارائه دهیم.» این تعهد توسط تیمی متعهد پشتیبانی میشود که تضمین میکند Apertus بهروزرسانیها و بهبودهای منظمی دریافت کند.
توماس شولتس، مدیر CSCS، نقش این مدل را به عنوان یک موتور نوآوری برجسته کرد. او Apertus را نه یک انتقال فناوری یکباره، بلکه یک قطعه زیرساختی بنیادی توصیف کرد که برای منافع بلندمدت اجتماعی و صنعتی طراحی شده و تخصص هوش مصنوعی را در سراسر سوئیس و فراتر از آن تقویت میکند.
گرامیداشت تنوع چندزبانه
Apertus خود را با تعهد عمیق به چندزبانگی متمایز میکند. این مدل بر روی مجموعه دادهای عظیم با ۱۵ تریلیون توکن آموزش دیده و بیش از ۱۰۰۰ زبان را در بر میگیرد. نکته مهم این است که تقریباً ۴۰٪ از دادههای آموزشی آن غیرانگلیسی است، که تضاد آشکاری با بسیاری از مدلهای پیشرو دارد. این شامل زبانهایی است که اغلب توسط هوش مصنوعی جریان اصلی نادیده گرفته میشوند، مانند آلمانی سوئیسی و رومانش، که تضمین میکند تنوع زبانی در دنیای دیجیتال حفظ و نمایندگی شود.
ایمانول اشلاگ، سرپرست فنی پروژه، اظهار داشت: «Apertus برای منافع عمومی ساخته شده است. این مدل در میان معدود LLMهای کاملاً باز در این مقیاس قرار دارد و اولین در نوع خود است که چندزبانگی، شفافیت و انطباق را به عنوان اصول طراحی بنیادی خود گنجانده است.»
دسترسی و کاربرد در دنیای واقعی
شروع کار با Apertus برای کسانی که تخصص فنی دارند، ساده است. این مدل را میتوان مستقیماً از Hugging Face دانلود کرد یا از طریق پلتفرم هوش مصنوعی مستقل Swisscom به آن دسترسی داشت. برای آزمایش و توسعه گستردهتر، Apertus محور اصلی هفتههای هوش مصنوعی سوئیس خواهد بود، جایی که شرکتکنندگان هکاتون میتوانند آن را از طریق یک رابط کاربری اختصاصی آزمایش کنند. جاشوا تان از Public AI Inference Utility این ابتکار را ستود و Apertus را «مدل پیشرو هوش مصنوعی عمومی» و اثباتی برای هوش مصنوعی به عنوان یک زیرساخت عمومی ضروری، مشابه بزرگراهها یا برق، خواند.
تعهد به شفافیت و اخلاق
توسعه Apertus با رعایت استانداردهای سختگیرانه اخلاقی و قانونی انجام شد. کل فرآیند آموزش با قوانین حفاظت از دادههای سوئیس، مقررات حق چاپ و الزامات شفافیت دقیق قانون هوش مصنوعی اتحادیه اروپا مطابقت داشت. مجموعه دادههای آموزشی با دقت از اطلاعات عمومی در دسترس انتخاب شد و فیلترهایی برای حذف دادههای شخصی و احترام به درخواستهای عدم مشارکت وبسایتها اعمال گردید. این رویکرد شفاف تضمین میکند که کاربران میتوانند پایههای مدل را بررسی کرده و به خروجیهای آن اعتماد کنند.
همانطور که پروفسور آنتوان بوسلوت از EPFL نتیجهگیری کرد: «انتشار Apertus یک گام نهایی نیست، بلکه آغاز یک سفر است.» برنامههای آینده شامل گسترش خانواده مدلها، افزایش کارایی آنها و ساخت نسخههای تخصصی برای بخشهای حیاتی مانند حقوق، مراقبتهای بهداشتی و علوم اقلیمی است، در حالی که تعهد تزلزلناپذیر به هوش مصنوعی باز و قابل اعتماد حفظ میشود.
منبع: AI News