گوگل پیکسل ۱۰: نگاهی عمیق به انقلاب هوش مصنوعی آن

رویداد اخیر Made By Google چیزی فراتر از رونمایی سخت‌افزاری بود؛ این رویداد سکوی پرتابی بزرگ برای مجموعه‌ای از ویژگی‌های جدید هوش مصنوعی بود که قرار است تجربه کار با گوشی‌های هوشمند را بازتعریف کنند. در حالی که دنیای فناوری سرشار از هیاهوی هوش مصنوعی است، به نظر می‌رسد گوگل بر روی ادغام این پیشرفت‌ها به روش‌هایی تمرکز کرده که واقعاً مفید و حتی سرگرم‌کننده باشند. بیایید برجسته‌ترین به‌روزرسانی‌های مبتنی بر هوش مصنوعی را که با سری پیکسل ۱۰ عرضه می‌شوند، بررسی کنیم؛ بسیاری از این ویژگی‌ها از توانایی تاریخی گوگل در زمینه فناوری‌های صوتی و تماس بهره می‌برند.

یادداشت‌های صوتی خود را با اپلیکیشن Recorder به آهنگ تبدیل کنید 🎶

اپلیکیشن Recorder گوگل مدت‌هاست که به خاطر قابلیت رونویسی دقیق و روی دستگاه خود مورد تحسین قرار گرفته است. اکنون، این برنامه در حال برداشتن یک گام خلاقانه بزرگ است. پیکسل ۱۰ یک ویژگی هوش مصنوعی را معرفی می‌کند که می‌تواند برای ضبط‌های صوتی شما موسیقی پس‌زمینه تولید کند. تصور کنید ملودی‌ای را می‌خوانید و برنامه فوراً یک همراهی موسیقی برای آن ایجاد می‌کند. در یک نمایش عملی، فرآیند بسیار ساده بود: پس از ضبط یک قطعه صوتی، گزینه‌ای با عنوان «ایجاد و افزودن موسیقی» ظاهر می‌شود. سپس کاربران می‌توانند یک «حال و هوا» مانند «ریتم‌های آرام»، «مهمانی رقص» یا «رمانتیک» را انتخاب کنند. هوش مصنوعی صدا را تحلیل کرده، ریتم را شناسایی می‌کند، با ضرباهنگ هماهنگ می‌شود و یک قطعه جدید را هارمونیزه می‌کند. اگرچه موسیقی تولید شده اصیل است و آهنگ‌های موجود را کپی نمی‌کند (که نگرانی‌های مربوط به حق کپی‌رایت را برطرف می‌کند)، اما با موفقیت با گام و ریتم صدای خواننده مطابقت دارد. این ویژگی یک ضبط‌کننده ساده را به ابزاری سرگرم‌کننده برای خلاقیت موسیقی تبدیل می‌کند، که برای هنرمندان نوظهور یا هر کسی که می‌خواهد کمی چاشنی خلاقیت به یادداشت‌های صوتی خود اضافه کند، عالی است.

نمایش قابلیت Magic Cue بر روی گوشی گوگل پیکسل.

با Voice Translate موانع زبانی را از بین ببرید 🗣️

شاید یکی از آینده‌نگرانه‌ترین ویژگی‌ها، Voice Translate باشد که برای از بین بردن موانع زبانی در حین تماس‌های تلفنی زنده طراحی شده است. هدف از این کار ایجاد ارتباطی شخصی‌تر از آن چیزی است که یک مترجم رباتیک می‌تواند ارائه دهد. هنگامی که تماسی از یک پیکسل ۱۰ برقرار می‌شود، کاربر می‌تواند Voice Translate را فعال کند. سپس سیستم به هر دو طرف اطلاع می‌دهد که تماس توسط هوش مصنوعی گوگل در حال ترجمه است. وقتی یک شخص صحبت می‌کند، صدای او برای لحظه‌ای به زبان اصلی شنیده می‌شود و سپس یک صدای تولید شده توسط هوش مصنوعی جایگزین آن شده و کلمات ترجمه شده را با تقلید از گام، ریتم و لحن گوینده اصلی بیان می‌کند. برای اطمینان از شفافیت و جلوگیری از سوءاستفاده، صدای گوینده اصلی با ولوم پایین‌تر در پس‌زمینه قابل شنیدن باقی می‌ماند—تکنیکی که به آن «ducking» می‌گویند. اگرچه ترجمه‌ها و تقلید صدا هنوز بی‌نقص نیستند، اما این ویژگی گامی قابل توجه به سوی ارتباطات جهانی یکپارچه است. در زمان عرضه، این قابلیت از ترجمه بین انگلیسی و زبان‌های اسپانیایی، آلمانی، ژاپنی، فرانسوی، هندی و غیره پشتیبانی خواهد کرد.

Magic Cue: دستیار پیش‌فعال شما در تماس‌ها ✈️

گوگل با تکیه بر تخصص خود در اطلاعات متنی، قابلیت Magic Cue را معرفی می‌کند. این ویژگی کمک‌های پیش‌فعال را مستقیماً به تماس‌ها و پیام‌های شما می‌آورد. قانع‌کننده‌ترین کاربرد نمایش داده شده مربوط به سفر است. تصور کنید برای صحبت در مورد یک رزرو با یک شرکت هواپیمایی تماس می‌گیرید؛ به جای جستجو در ایمیل‌ها برای یافتن شماره تأیید، Magic Cue به طور خودکار اطلاعات پرواز مربوطه را استخراج کرده و آن را در حین تماس روی صفحه نمایش شما نشان می‌دهد. این راحتی کوچک می‌تواند باعث صرفه‌جویی قابل توجهی در زمان و کاهش استرس شود. پتانسیل این ویژگی بسیار گسترده است و امید می‌رود که به جزئیات قرار ملاقات‌ها، شماره‌های سفارش و سایر اطلاعات حیاتی برای تماس با پزشکان، تعمیرکاران یا خدمات مشتریان نیز گسترش یابد.

عکاسی هوشمندتر با دوربین مجهز به هوش مصنوعی 📸

دوربین پیکسل همیشه یکی از نقاط قوت آن بوده و سری پیکسل ۱۰ این میراث را با بهبودهای قدرتمند هوش مصنوعی ادامه می‌دهد.

  • زوم Pro Res: این ویژگی از پردازش محاسباتی برای ارائه عکس‌های فوق‌العاده واضح و با جزئیات در سطوح زوم بالا، مانند ۱۰۰ برابر، استفاده می‌کند. برای جلوگیری از تولید جزئیات نادرست یا «توهم‌زا» توسط هوش مصنوعی، گوگل آن را طوری تنظیم کرده است که هنگام تشخیص افراد از الگوریتم متفاوتی استفاده کند و نمایش دقیق را بر شارپ‌سازی مصنوعی اولویت دهد.
  • ویرایش مکالمه‌ای عکس: ویرایش عکس‌ها به سادگی صحبت کردن با تلفن شما می‌شود. در اپلیکیشن Google Photos، کاربران اکنون می‌توانند دستورات زبان طبیعی مانند «آن لباس قرمز را آبی کن» یا «افراد حاضر در پس‌زمینه را حذف کن» را بدهند و هوش مصنوعی Gemini تغییرات را به طور مؤثر اجرا خواهد کرد.
  • اعتبارنامه محتوا: در یک حرکت حیاتی برای شفافیت دیجیتال، پیکسل ۱۰ اولین گوشی خواهد بود که ابتکار استاندارد صنعتی C2PA را در برنامه دوربین بومی خود پیاده‌سازی می‌کند. این بدان معناست که عکس‌ها حاوی فراداده‌ای خواهند بود که نشان می‌دهد آیا از هوش مصنوعی برای ویرایش استفاده شده است یا خیر، که به مبارزه با اطلاعات نادرست کمک می‌کند.

سایر ادغام‌های قابل توجه هوش مصنوعی

علاوه بر این موارد برجسته، پیکسل ۱۰ مملو از دیگر ویژگی‌های امیدوارکننده هوش مصنوعی است. عملکرد «پیام بگیر» پیام‌های صوتی را رونویسی کرده و برای شما ارسال می‌کند، که روشی راحت‌تر برای مدیریت تماس‌های از دست رفته است. در حالی که برخی از ویژگی‌ها مانند Daily Hub جدید هنوز در حال تکامل هستند، مسیر کلی روشن است. گوگل با تفکر، هوش مصنوعی را در سخت‌افزار خود تعبیه می‌کند تا تجربه‌ای هوشمندتر، شهودی‌تر و در نهایت مفیدتر برای کاربر ایجاد کند.

منبع: Engadget

Leave a Comment