کودکی من در دنیایی بدون تلویزیون سپری شد. یک بیداری معنوی عمیق، مادرم را به این نتیجه رساند که برنامههایی مانند «هی-من» و «اسمورفها» را با دیده شک بنگرد و به این ترتیب، دوران سلطه آنها در خانه ما به پایان رسید. به جای آن، ما کتاب داشتیم—پشتههای بیپایان و سر به فلک کشیده از کتاب. هر هفته با انبوهی از داستانهای علمی-تخیلی و فانتزی دوران طلایی از کتابخانه بازمیگشتم و در دنیاهای آسیموف، هاینلاین و نیون غرق میشدم.
من شیفتهی چشماندازهای آینده بودم؛ آیندهای که در آن اتوماسیون، بشر را از کارهای طاقتفرسا آزاد میکرد تا بتوانیم به دنبال فعالیتهای خلاقانهتر برویم. هرگز به ذهنم خطور نکرده بود که روزی ماشینها برای عزیزترین چیزهایم خواهند آمد: کتابهایم و صدایم.
وقتی نوپا بودم والدینم از هم جدا شدند و پدرم که بازیگر و مجری رادیو در کالیفرنیا بود، راهی برای پر کردن فاصله تا شهر کوچک من در ایلینوی پیدا کرد. او از پیشگامان استفاده از تجهیزات استودیوی خانگی بود و صدای خود را در حال خواندن کتاب روی نوارهای کاست ضبط میکرد و به آن سوی کشور میفرستاد. من کوچک، روی ضبط صوت فیشر پرایسام خم میشدم و مسحور میشدم. صدای او، بیجسم اما به طرزی جادویی حاضر، وسیلهی نقلیه من به دنیاهای دیگر بود. این درسی عمیق در مورد قدرت صدای انسان بود و ثابت میکرد که روح انسان و یک داستان جذاب میتوانند با هم ترکیب شوند و چیزی واقعاً معنادار خلق کنند، حتی از طریق یک بلندگوی کوچک و فلزی.
این الهام، مرا در مسیر قصهگویی قرار داد. من عاشق تئاتر شدم، عاشق هیجان جان بخشیدن به داستانها در برابر تماشاگران زنده. در سال ۲۰۰۵، برای اولین کتاب صوتیام تست دادم و با صنعتی کامل آشنا شدم که بر پایهی آن ترکیب زیبا و ساده از یک صدا و یک داستان بنا شده بود. من شیفتهی آن شدم.
امروز، من بیش از ۸۰۰ عنوان را روایت کردهام. این زندگیای است که دوستش دارم، ادامهی رؤیایی که پدرم در من شعلهور کرد. متأسفانه، او هرگز فرصت شنیدنش را پیدا نکرد. در سال ۱۹۹۳، او و همسرش در یک تصادف رانندگی کشته شدند. با گذشت سالها، مجموعهی نوارهای او از بین رفته و تنها یکی باقی مانده است. یک کاست زرد شدهی مکسل، که روی آن داستانی ترسناک و به طرزی دلنشین کلیشهای را که خودش نوشته بود، با افکتهای صوتی دههی ۸۰ ضبط کرده است. این تمام چیزی است که از صدایش برایم باقی مانده است.
ظهور آخرالزمان رباتیک
سالها بود که صنعت کتاب صوتی، لرزههای یک تغییر قریبالوقوع را حس میکرد. کیندل آمازون یک ویژگی خواندن با صدای مصنوعی داشت، اما هرگز واقعاً محبوب نشد. یک سپر دفاعی کلیدی این بود که آدیبل (Audible)، غول این صنعت، به صداهای غیرانسانی روی پلتفرم خود اجازه نمیداد و از نقش خود در تقویت قصهگویی انسانی دفاع میکرد. ما شک داشتیم که این یک سیاست موقتی است که فقط تا زمانی ادامه خواهد داشت که بتوانند هوش مصنوعی خود را کامل کرده و از آن کسب درآمد کنند. حق با ما بود.
در نوامبر ۲۰۲۳، سیلاب به راه افتاد. آدیبل «صداهای مجازی» (Virtual Voices) را معرفی کرد که به نویسندگان اجازه میداد با یک کلیک، کتابهای صوتی با روایت هوش مصنوعی ایجاد کنند. در عرض چند ماه، دهها هزار از این «اجراهای» بیروح بازار را پر کردند، عددی که اکنون به حدود ۶۰,۰۰۰ میرسد.
من اغلب به گویندگان مشتاق تدریس میکنم و همیشه بر شرافت این کار تأکید دارم. قصهگویی چیزی است که ما را انسان میسازد؛ این یک شکل هنری اولیه است. یک صدای فردی که داستانی را برای دیگری میبافد. تلاش شرکتها برای جایگزینی هنرمندان انسانی با ماشینها، عمیقاً ضدبشری به نظر میرسد؛ داستانی قدیمی از مکانیزه کردن خلاقیت. این مرا به یاد افسانهی جان هنری میاندازد که خود را تا سر حد مرگ به کار واداشت تا یک متهی بخار را شکست دهد؛ آخرین نفس سرکشانه در برابر ماشینی خستگیناپذیر که نه احساسی دارد و نه سوگواری میکند.
معنای ناگفتهای که ماشین درک نمیکند
استارتآپهای فناوری مانند Eleven Labs اکنون میتوانند با یک نمونهی کوتاه، صدایی را شبیهسازی کنند. از خودم پرسیدهام، آیا یک کلون هوش مصنوعی از صدای پدرم همان معنا را برای من خواهد داشت؟ در کودکی، آن نوارها خط مستقیمی به حضور و عشق او بودند. جادوی واقعی در کلمات روی صفحه نبود؛ در لایهی زیرین متن (subtext) بود—احساس ناگفته، نیت، و عشقی که در سکوت بین کلمات جریان داشت. وقتی پدرم «شب قبل از کریسمس» را میخواند، خط آخر را به این صورت تغییر میداد: «کریسمس بر همگان مبارک، و شبی خوش برای آدام!» پیام پنهان همیشه آنجا بود: «دوستت دارم.»
یک ماشین نمیتواند نیت داشته باشد. نمیتواند عشق را بفهمد. وقتی کتابی را آماده میکنم، به دنبال قلب نویسنده، دلیل اینکه چرا این داستان باید گفته میشد، میگردم. یک بار کتابی فنی و خشک دربارهی یک سرطان نادر را روایت میکردم. برای برقراری ارتباط با آن مشکل داشتم تا اینکه بخش تقدیر و تشکر را خواندم، جایی که نویسنده فاش کرده بود مادرش در کودکی بر اثر همان بیماری درگذشته بود. آنجا بود که قلب و لایهی زیرین متن را پیدا کردم. یک ماشین میتواند کلمات را پردازش کند، اما نمیتواند سنگینی آنها را حس کند.
داستان پدرم ناگهان در یک بزرگراه کالیفرنیا به پایان رسید. من خاطراتی مبهم و همان یک نوار کاست را دارم. آیا یک ماشین میتواند آن داستان را بگوید؟ ماشینی که غم پیچیده، سردرگمی کودکی، عشق و زخمهایی را که هرگز به طور کامل بهبود نمییابند، درک نمیکند. داستانها از خردی جسمانی متولد میشوند. مری شلی یک زن ۱۹ ساله بود که تجربه جسمانی و هوش عمیقش به او اجازه داد تا «فرانکنشتاین» را بنویسد، یک هشدار جاودانه درباره خلق زندگی بدون روح. امروز، توسعهدهندگان فناوری ادعا میکنند که چتباتهایشان به آگاهی رسیدهاند و فریاد ویکتور فرانکنشتاین را تکرار میکنند: «زنده است!»
شکنندگی و قدرت یک صدای انسانی
هنگام روایت کتابی درباره پدری که پسرش را از دست میدهد، بغض گلویم را گرفت. تجربیات خودم به عنوان یک پدر و یک پسر با درد آن شخصیت در هم آمیخت. اشکها روی صورتم جاری شد، صدایم لرزید و نفسم بند آمد. میکروفون همه اینها را ضبط کرد—یک واکنش انسانی و اصیل. یک هوش مصنوعی شاید بتواند صدای یک هقهق خفه را تقلید کند، اما نمیتواند ترس، خاطره، و جهش تخیلی را که آن را تولید میکند، احساس کند. نمیتواند با داستانی که تعریف میکند، تغییر کند.
این ما را به «دره وهمی» (uncanny valley) میرساند، اصطلاحی که انزجار ما را از دیدن یک کپی که تقریباً، اما نه کاملاً، شبیه انسان عمل میکند، توصیف میکند. این یک ترس باستانی است که در افسانههای پریان و گولمها دیده میشود. یک صدای هوش مصنوعی هیچ خودِ درونی برای ابراز ندارد. همانطور که فیلسوف شانون والر اشاره میکند، «چیزی برای گفتن ندارد»، فقط دستوری برای دنبال کردن یک الگو دارد. فاقد آن روحی است که به گفته ارسطو، با صدا در هم تنیده است.
چند سال پیش، پس از ابتلا به کووید، تارهای صوتیام دچار آسیب عصبی شد. صدایم به یک زمزمهی ضعیف تبدیل شد. پیشبینی نامشخص بود. حتی امروز، با نوعی لنگیدن روایت میکنم، یک درد دائمی در گلویم. این شکنندگی یادآور انسانیت من است. یک گوینده هوش مصنوعی هرگز بیمار نمیشود، هرگز خسته نمیشود و هرگز نمیلغزد. اما هرگز از رنج نیز یاد نخواهد گرفت. هرگز هیجان یا اندوهی را احساس نخواهد کرد.
صنعت اکنون به سمت شبیهسازی صدا حرکت میکند، جایی که صدای منحصر به فرد من میتواند برای تولید کتابهای صوتی بیپایان بدون حضور من استفاده شود. منطق این کار بیرحمانه است: گویندگان مشهور میتوانند سالانه صدها عنوان تولید کنند و متخصصان شاغل را از میدان به در کنند. ما نه تنها با یکدیگر، بلکه با صداهای شبیهسازی شدهی مردگان نیز رقابت خواهیم کرد. این فقط یک «ابزار» جدید نیست که باید با آن «سازگار» شویم؛ این جایگزینی چیزی زنده با چیزی مرده است.
آخرین و بهترین دفاع ما
من شبها برای فرزندانم «یاران حلقه» را میخوانم و میبینم که چشمانشان از ترس و شگفتی گشاد میشود. در آن لحظه، من زنده، حاضر و از طریق یک داستان با آنها در ارتباطم. همین کافی است. فکر شبیهسازی صدای پدرم برایم منزجرکننده است زیرا یک پژواک توخالی خواهد بود. هرگز نمیتواند چیزی را که آرزوی شنیدنش را دارم به من بگوید: «به تو افتخار میکنم.»
مبارزهی ما شکستن ماشینها نیست. چکش ما، انسانیت ماست. این است که به گفتن داستانهایمان ادامه دهیم، با تمام نقصهایمان، غمهایمان، شادیهایمان و عشقمان. با برونسپاری هنر خود به الگوریتمها، ما داستان به داستان خود را فقیرتر میکنیم. مری شلی میدانست این مخلوقات غیرطبیعی و بیروح را که از انسانیت تقلید میکنند بدون آنکه آن را داشته باشند، چه بنامد. ما آنها را هیولا مینامیم.