ما همیشه پیشرفت هوش مصنوعی را یک معادله ساده میدانستیم: داده بیشتر + قدرت پردازش بیشتر = هوش مصنوعی هوشمندتر. 🧠 این فرمول سالها کارساز بود و هر مجموعه داده عظیم، قابلیتهای جدیدی را باز میکرد. اما چه اتفاقی میافتد وقتی یکی از مواد اصلی تمام شود؟
به گفته نیما رافائل، مدیر ارشد داده در گلدمن ساکس، ما همین حالا به آن نقطه رسیدهایم. او در یک پادکست اخیر، ادعای شگفتانگیزی را مطرح کرد: «ما دیگر دادهای نداریم.»

این حرف واقعاً به چه معناست؟
اینطور نیست که اطلاعات ناپدید شده باشد. معنای آن این است که دادههای عمومی، وسیع و باکیفیت اینترنت – از منابعی مانند ویکیپدیا، ردیت و گیتهاب – به طور کامل استخراج شده و به مدلهای فعلی ما خورانده شده است. این لحظه «اوج داده»، اصطلاحی که توسط ایلیا سوتسکور از OpenAI نیز تکرار شده، نشاندهنده یک تغییر بزرگ است. سوخت آسان برای انقلاب هوش مصنوعی مولد رو به کاهش است.
ظهور دادههای مصنوعی 🤖
خب، از اینجا به کجا میرویم؟ بسیاری از توسعهدهندگان به دادههای مصنوعی روی آوردهاند – اطلاعاتی که توسط مدلهای دیگر هوش مصنوعی تولید میشود. رافائل اشاره میکند که رشد آن «انفجاری» است زیرا کامپیوترها میتوانند مواد تقریباً بیپایانی تولید کنند. با این حال، او یک سوال اساسی را مطرح میکند: چه مقدار از آن واقعاً ارزشمند است؟ تغذیه مدلهای هوش مصنوعی با رژیمی از خروجیهای خودشان میتواند به یک «فلات خلاقیت» منجر شود، جایی که ایدههای نو و اصالت در یک اتاق پژواک از اطلاعات بازیافتی گم میشوند.

تب طلای بعدی: دادههای اختصاصی 💎
رافائل معتقد است که آینده تنها به محتوای مصنوعی محدود نمیشود. گنج واقعی در ذخایر عظیم و دستنخورده دادههای اختصاصی نهفته در شرکتها و مؤسسات قرار دارد. به آن فکر کنید: دهها سال سوابق مالی، تعاملات مشتریان، تحقیقات علمی و پروندههای بهداشتی هنوز منتظرند تا به درستی سازماندهی شده و به کار گرفته شوند.
چالش چیست؟ این دادهها اغلب درهم، ناسازگار و پراکنده هستند. قبل از اینکه بتوانند یک مدل قابل اعتماد را آموزش دهند، باید با دقت پاکسازی، ساختاریافته و مرتبط شوند. اما اگر این کار انجام شود، این مجموعههای داده منحصربهفرد میتوانند هوش مصنوعی را در حوزههای تخصصی به جلو برانند و برای کسانی که آنها را کنترل میکنند، یک مزیت رقابتی جدید ایجاد کنند.

این تغییر از وب باز به مجموعههای داده خصوصی پیامدهای اقتصادی عظیمی دارد. این امر میتواند تسلط آزمایشگاههایی با بودجههای کلان را به چالش بکشد و موج جدیدی از معاملات را به راه بیندازد، زیرا شرکتها برای تضمین داراییهای دادهای ارزشمند رقابت میکنند.
دوران برداشت آسان دادهها ممکن است به پایان رسیده باشد، اما انقلاب هوش مصنوعی احتمالاً فقط در حال حرکت به یک مرز جدید و پیچیدهتر است. سوال دیگر فقط مقیاس نیست، بلکه کیفیت و منحصربهفرد بودن دادههایی است که برای آموزش ماشینهایمان استفاده میکنیم.
شما درباره آینده آموزش هوش مصنوعی چه فکر میکنید؟ نظرات خود را با ما در میان بگذارید! 👇
از مقاله اصلی بیشتر بیاموزید:
https://www.bigdatawire.com/2025/10/03/goldman-sachs-chief-data-officer-warns-ai-has-already-run-out-of-data/