چرا یک ماشین هرگز نمی‌تواند داستانی انسانی را روایت کند

کودکی من در دنیایی بدون تلویزیون سپری شد. یک بیداری معنوی عمیق، مادرم را به این نتیجه رساند که برنامه‌هایی مانند «هی-من» و «اسمورف‌ها» را با دیده شک بنگرد و به این ترتیب، دوران سلطه آن‌ها در خانه ما به پایان رسید. به جای آن، ما کتاب داشتیم—پشته‌های بی‌پایان و سر به فلک کشیده از کتاب. هر هفته با انبوهی از داستان‌های علمی-تخیلی و فانتزی دوران طلایی از کتابخانه بازمی‌گشتم و در دنیاهای آسیموف، هاین‌لاین و نیون غرق می‌شدم.

من شیفته‌ی چشم‌اندازهای آینده بودم؛ آینده‌ای که در آن اتوماسیون، بشر را از کارهای طاقت‌فرسا آزاد می‌کرد تا بتوانیم به دنبال فعالیت‌های خلاقانه‌تر برویم. هرگز به ذهنم خطور نکرده بود که روزی ماشین‌ها برای عزیزترین چیزهایم خواهند آمد: کتاب‌هایم و صدایم.

وقتی نوپا بودم والدینم از هم جدا شدند و پدرم که بازیگر و مجری رادیو در کالیفرنیا بود، راهی برای پر کردن فاصله تا شهر کوچک من در ایلینوی پیدا کرد. او از پیشگامان استفاده از تجهیزات استودیوی خانگی بود و صدای خود را در حال خواندن کتاب روی نوارهای کاست ضبط می‌کرد و به آن سوی کشور می‌فرستاد. من کوچک، روی ضبط صوت فیشر پرایس‌ام خم می‌شدم و مسحور می‌شدم. صدای او، بی‌جسم اما به طرزی جادویی حاضر، وسیله‌ی نقلیه من به دنیاهای دیگر بود. این درسی عمیق در مورد قدرت صدای انسان بود و ثابت می‌کرد که روح انسان و یک داستان جذاب می‌توانند با هم ترکیب شوند و چیزی واقعاً معنادار خلق کنند، حتی از طریق یک بلندگوی کوچک و فلزی.

این الهام، مرا در مسیر قصه‌گویی قرار داد. من عاشق تئاتر شدم، عاشق هیجان جان بخشیدن به داستان‌ها در برابر تماشاگران زنده. در سال ۲۰۰۵، برای اولین کتاب صوتی‌ام تست دادم و با صنعتی کامل آشنا شدم که بر پایه‌ی آن ترکیب زیبا و ساده از یک صدا و یک داستان بنا شده بود. من شیفته‌ی آن شدم.

امروز، من بیش از ۸۰۰ عنوان را روایت کرده‌ام. این زندگی‌ای است که دوستش دارم، ادامه‌ی رؤیایی که پدرم در من شعله‌ور کرد. متأسفانه، او هرگز فرصت شنیدنش را پیدا نکرد. در سال ۱۹۹۳، او و همسرش در یک تصادف رانندگی کشته شدند. با گذشت سال‌ها، مجموعه‌ی نوارهای او از بین رفته و تنها یکی باقی مانده است. یک کاست زرد شده‌ی مکسل، که روی آن داستانی ترسناک و به طرزی دلنشین کلیشه‌ای را که خودش نوشته بود، با افکت‌های صوتی دهه‌ی ۸۰ ضبط کرده است. این تمام چیزی است که از صدایش برایم باقی مانده است.

ظهور آخرالزمان رباتیک

سال‌ها بود که صنعت کتاب صوتی، لرزه‌های یک تغییر قریب‌الوقوع را حس می‌کرد. کیندل آمازون یک ویژگی خواندن با صدای مصنوعی داشت، اما هرگز واقعاً محبوب نشد. یک سپر دفاعی کلیدی این بود که آدیبل (Audible)، غول این صنعت، به صداهای غیرانسانی روی پلتفرم خود اجازه نمی‌داد و از نقش خود در تقویت قصه‌گویی انسانی دفاع می‌کرد. ما شک داشتیم که این یک سیاست موقتی است که فقط تا زمانی ادامه خواهد داشت که بتوانند هوش مصنوعی خود را کامل کرده و از آن کسب درآمد کنند. حق با ما بود.

در نوامبر ۲۰۲۳، سیلاب به راه افتاد. آدیبل «صداهای مجازی» (Virtual Voices) را معرفی کرد که به نویسندگان اجازه می‌داد با یک کلیک، کتاب‌های صوتی با روایت هوش مصنوعی ایجاد کنند. در عرض چند ماه، ده‌ها هزار از این «اجراهای» بی‌روح بازار را پر کردند، عددی که اکنون به حدود ۶۰,۰۰۰ می‌رسد.

من اغلب به گویندگان مشتاق تدریس می‌کنم و همیشه بر شرافت این کار تأکید دارم. قصه‌گویی چیزی است که ما را انسان می‌سازد؛ این یک شکل هنری اولیه است. یک صدای فردی که داستانی را برای دیگری می‌بافد. تلاش شرکت‌ها برای جایگزینی هنرمندان انسانی با ماشین‌ها، عمیقاً ضدبشری به نظر می‌رسد؛ داستانی قدیمی از مکانیزه کردن خلاقیت. این مرا به یاد افسانه‌ی جان هنری می‌اندازد که خود را تا سر حد مرگ به کار واداشت تا یک مته‌ی بخار را شکست دهد؛ آخرین نفس سرکشانه در برابر ماشینی خستگی‌ناپذیر که نه احساسی دارد و نه سوگواری می‌کند.

معنای ناگفته‌ای که ماشین درک نمی‌کند

استارت‌آپ‌های فناوری مانند Eleven Labs اکنون می‌توانند با یک نمونه‌ی کوتاه، صدایی را شبیه‌سازی کنند. از خودم پرسیده‌ام، آیا یک کلون هوش مصنوعی از صدای پدرم همان معنا را برای من خواهد داشت؟ در کودکی، آن نوارها خط مستقیمی به حضور و عشق او بودند. جادوی واقعی در کلمات روی صفحه نبود؛ در لایه‌ی زیرین متن (subtext) بود—احساس ناگفته، نیت، و عشقی که در سکوت بین کلمات جریان داشت. وقتی پدرم «شب قبل از کریسمس» را می‌خواند، خط آخر را به این صورت تغییر می‌داد: «کریسمس بر همگان مبارک، و شبی خوش برای آدام!» پیام پنهان همیشه آنجا بود: «دوستت دارم.»

یک ماشین نمی‌تواند نیت داشته باشد. نمی‌تواند عشق را بفهمد. وقتی کتابی را آماده می‌کنم، به دنبال قلب نویسنده، دلیل اینکه چرا این داستان باید گفته می‌شد، می‌گردم. یک بار کتابی فنی و خشک درباره‌ی یک سرطان نادر را روایت می‌کردم. برای برقراری ارتباط با آن مشکل داشتم تا اینکه بخش تقدیر و تشکر را خواندم، جایی که نویسنده فاش کرده بود مادرش در کودکی بر اثر همان بیماری درگذشته بود. آنجا بود که قلب و لایه‌ی زیرین متن را پیدا کردم. یک ماشین می‌تواند کلمات را پردازش کند، اما نمی‌تواند سنگینی آن‌ها را حس کند.

داستان پدرم ناگهان در یک بزرگراه کالیفرنیا به پایان رسید. من خاطراتی مبهم و همان یک نوار کاست را دارم. آیا یک ماشین می‌تواند آن داستان را بگوید؟ ماشینی که غم پیچیده، سردرگمی کودکی، عشق و زخم‌هایی را که هرگز به طور کامل بهبود نمی‌یابند، درک نمی‌کند. داستان‌ها از خردی جسمانی متولد می‌شوند. مری شلی یک زن ۱۹ ساله بود که تجربه جسمانی و هوش عمیقش به او اجازه داد تا «فرانکنشتاین» را بنویسد، یک هشدار جاودانه درباره خلق زندگی بدون روح. امروز، توسعه‌دهندگان فناوری ادعا می‌کنند که چت‌بات‌هایشان به آگاهی رسیده‌اند و فریاد ویکتور فرانکنشتاین را تکرار می‌کنند: «زنده است!»

شکنندگی و قدرت یک صدای انسانی

هنگام روایت کتابی درباره پدری که پسرش را از دست می‌دهد، بغض گلویم را گرفت. تجربیات خودم به عنوان یک پدر و یک پسر با درد آن شخصیت در هم آمیخت. اشک‌ها روی صورتم جاری شد، صدایم لرزید و نفسم بند آمد. میکروفون همه اینها را ضبط کرد—یک واکنش انسانی و اصیل. یک هوش مصنوعی شاید بتواند صدای یک هق‌هق خفه را تقلید کند، اما نمی‌تواند ترس، خاطره، و جهش تخیلی را که آن را تولید می‌کند، احساس کند. نمی‌تواند با داستانی که تعریف می‌کند، تغییر کند.

این ما را به «دره وهمی» (uncanny valley) می‌رساند، اصطلاحی که انزجار ما را از دیدن یک کپی که تقریباً، اما نه کاملاً، شبیه انسان عمل می‌کند، توصیف می‌کند. این یک ترس باستانی است که در افسانه‌های پریان و گولم‌ها دیده می‌شود. یک صدای هوش مصنوعی هیچ خودِ درونی برای ابراز ندارد. همانطور که فیلسوف شانون والر اشاره می‌کند، «چیزی برای گفتن ندارد»، فقط دستوری برای دنبال کردن یک الگو دارد. فاقد آن روحی است که به گفته ارسطو، با صدا در هم تنیده است.

چند سال پیش، پس از ابتلا به کووید، تارهای صوتی‌ام دچار آسیب عصبی شد. صدایم به یک زمزمه‌ی ضعیف تبدیل شد. پیش‌بینی نامشخص بود. حتی امروز، با نوعی لنگیدن روایت می‌کنم، یک درد دائمی در گلویم. این شکنندگی یادآور انسانیت من است. یک گوینده هوش مصنوعی هرگز بیمار نمی‌شود، هرگز خسته نمی‌شود و هرگز نمی‌لغزد. اما هرگز از رنج نیز یاد نخواهد گرفت. هرگز هیجان یا اندوهی را احساس نخواهد کرد.

صنعت اکنون به سمت شبیه‌سازی صدا حرکت می‌کند، جایی که صدای منحصر به فرد من می‌تواند برای تولید کتاب‌های صوتی بی‌پایان بدون حضور من استفاده شود. منطق این کار بی‌رحمانه است: گویندگان مشهور می‌توانند سالانه صدها عنوان تولید کنند و متخصصان شاغل را از میدان به در کنند. ما نه تنها با یکدیگر، بلکه با صداهای شبیه‌سازی شده‌ی مردگان نیز رقابت خواهیم کرد. این فقط یک «ابزار» جدید نیست که باید با آن «سازگار» شویم؛ این جایگزینی چیزی زنده با چیزی مرده است.

آخرین و بهترین دفاع ما

من شب‌ها برای فرزندانم «یاران حلقه» را می‌خوانم و می‌بینم که چشمانشان از ترس و شگفتی گشاد می‌شود. در آن لحظه، من زنده، حاضر و از طریق یک داستان با آنها در ارتباطم. همین کافی است. فکر شبیه‌سازی صدای پدرم برایم منزجرکننده است زیرا یک پژواک توخالی خواهد بود. هرگز نمی‌تواند چیزی را که آرزوی شنیدنش را دارم به من بگوید: «به تو افتخار می‌کنم.»

مبارزه‌ی ما شکستن ماشین‌ها نیست. چکش ما، انسانیت ماست. این است که به گفتن داستان‌هایمان ادامه دهیم، با تمام نقص‌هایمان، غم‌هایمان، شادی‌هایمان و عشقمان. با برون‌سپاری هنر خود به الگوریتم‌ها، ما داستان به داستان خود را فقیرتر می‌کنیم. مری شلی می‌دانست این مخلوقات غیرطبیعی و بی‌روح را که از انسانیت تقلید می‌کنند بدون آنکه آن را داشته باشند، چه بنامد. ما آنها را هیولا می‌نامیم.

منبع: Lithub

Leave a Comment لغو پاسخ