فناوری

قابلیت ChatGPT Images با مدل GPT‑Image‑1.5، پاسخ‌های سریع ارائه می‌دهد

قابلیت ChatGPT Images با قدرت‌گرفتن از مدل GPT‑Image‑1.5 امکان تعامل سریع و دریافت اطلاعات عمیق‌تر را ازطریق لمس عناصر بصری فراهم می‌کند.

به گزارش سرویس هوش مصنوعی مگ دید، OpenAI روز گذشته قابلیت جدید ChatGPT Images را معرفی کرد که از جدیدترین مدل تولید تصویر این شرکت، GPT‑Image‑1.5، بهره می‌برد. این مدل جدید در حفظ عناصر مهم میان تصویر ورودی‌و‌خروجی مانند نورپردازی، ترکیب‌بندی و شباهت سوژه، عملکرد به‌مراتب بهتری از خود نشان می‌دهد. در کنار ارتقای مدل، تجربه Images نیز با صفحه اصلی بازطراحی‌شده عرضه می‌شود که شامل دستورهای ترندشده و فیلترهای ازپیش‌تنظیم‌شده است.

در ادامه، فیجی سیمو، مدیرعامل بخش اپلیکیشن‌های OpenAI، از مجموعه‌ای از قابلیت‌های تازه پرده‌برداری کرد که به‌زودی به ChatGPT اضافه خواهند شد. با اینکه ChatGPT به‌طور گسترده برای مکالمات طولانی و عمیق استفاده می‌شود، کاربران همچنان برای بسیاری از جست‌وجوهای ساده و روزمره به گوگل سرچ مراجعه می‌کنند. قابلیت‌های جدید با هدف پوشش همین سناریوها طراحی شده‌اند و کاربرانی را هدف می‌گیرند که برای دریافت اطلاعات سریع مانند کسب‌وکارهای محلی و نتایج ورزشی به گوگل متکی هستند.

در‌حال‌حاضر، زمانی که کاربران در ChatGPT درباره محصولات یا رستوران‌ها جست‌وجو می‌کنند، معمولاً پاسخی متنی و نسبتاً طولانی دریافت می‌کنند. هرچند این پاسخ‌ها اغلب از نتایج معمول گوگل اطلاعات کامل‌تری ارائه می‌دهند، وجود زمینه بصری می‌تواند کارایی آن‌ها را بیشتر کند. به همین دلیل، ChatGPT ازاین‌پس تصاویر مرتبط را در کنار پاسخ‌ها نمایش می‌دهد و منبع هر تصویر نیز به‌صورت شفاف مشخص خواهد بود.

در گام بعدی، ChatGPT عناصر مهمی مانند افراد و مکان‌ها و محصولات را درون پاسخ‌ها به‌صورت بصری برجسته می‌کند. کاربران می‌توانند با لمس این عناصر، بدون نیاز به مطرح‌کردن سؤال جدید، اطلاعات بیشتری درباره آن‌ها دریافت کنند. همچنین، این امکان فراهم شده است که کاربر هر واژه یا عبارت موجود در پاسخ را انتخاب و بلافاصله آن را عمیق‌تر بررسی کند، بدون آنکه جریان و زمینه گفت‌وگو از بین برود.

بسیاری از کاربران برای کارهای سریع مانند تبدیل واحدها و نرخ تبدیل ارز و محاسبات منطقه زمانی به گوگل سرچ متکی هستند. ChatGPT اکنون ابزارهای بصری مشابهی برای این کاربردها ارائه می‌دهد تا کاربران بتوانند مقادیر مدنظر خود را به‌سادگی تغییر دهند. یکی دیگر از کاربردهای رایج بررسی نتایج زنده مسابقات ورزشی است که از‌این‌پس به‌جای متن ساده، در قالب تجربه بصری جدید نمایش داده خواهد شد.

به نوشته نئووین، OpenAI در‌حال انتشار تدریجی مجموعه‌ای رو‌به‌گسترش از این ابزارهای کاربردی در ChatGPT است و قصد دارد در ماه‌های آینده دامنه آن‌ها را بیش از پیش توسعه دهد. این شرکت روی بهبود تجربه نوشتن در ChatGPT نیز کار می‌کند. با این بهبودها کاربران می‌توانند متن را به‌صورت درون‌خطی ویرایش کنند یا درصورت نیاز به ویرایشگر تمام‌صفحه هدایت شوند. هنگام نگارش محتوای بلندتر مانند گزارش‌ها، ChatGPT امکان دانلود خروجی به‌صورت فایل PDF یا Word را فراهم می‌کند.

برای ایمیل‌ها و پیام‌ها نیز کاربران می‌توانند پیش‌نویس‌ها را مستقیماً از داخل ChatGPT در اپلیکیشن ایمیل یا پیام‌رسان خود باز کنند. OpenAI در ماه اکتبر از نسل جدیدی از اپلیکیشن‌ها پرده‌برداری کرد که کاربران می‌توانند مستقیماً در محیط ChatGPT با آن‌ها تعامل برقرار کنند. بوکینگ، کانوا، کورسرا، فیگما، اکسپدیا، اسپاتیفای و Zillow از نخستین شرکای این طرح بودند. اکنون OpenAI اعلام کرده است که چندین اپلیکیشن دیگر ازجمله Adobe ،Airtable ،Clay ،Lovable ،OpenTable ،Replit و Salesforce نیز به‌زودی به ChatGPT اضافه خواهند شد.

Source link

تیم تحریریه مگ دید

تیم تحریریه magdid.ir با هدف ارائه محتوای دقیق، به‌روز و جذاب در حوزه‌های مختلف، تلاش می‌کند تجربه‌ای مفید و الهام‌بخش برای خوانندگان فراهم کند. این تیم متشکل از نویسندگان و متخصصانی است که با تحقیق و بررسی دقیق، مطالب آموزشی، خبری و تحلیلی را با زبان ساده و قابل فهم به مخاطب ارائه می‌دهند. تعهد ما، اطلاع‌رسانی صادقانه و ارتقای دانش و آگاهی جامعه است.

نوشته های مشابه

دکمه بازگشت به بالا