فناوری

نسخه جدید ابزار تولید تصویر ChatGPT Images منتشر شد

شرکت OpenAI نسخه جدید ابزار  «ChatGPT Images» را با تمرکز بر دقت بالاتر، سرعت بیشتر و حفظ جزئیات بصری، به‌صورت رسمی معرفی کرد.

به گزارش سرویس اخبار هوش مصنوعی این به‌روزرسانی که بر پایه مدل جدید تولید تصویر OpenAI توسعه یافته است، امکان ویرایش و تولید تصاویر را با کیفیت بالاتر و تطابق دقیق‌تر با خواست کاربر فراهم می‌کند و از امروز در اختیار همه کاربران ChatGPT و همچنین توسعه‌دهندگان API قرار گرفته است.

OpenAI اعلام کرده است که در این نسخه، مدل تولید تصویر توانایی انجام ویرایش‌های بسیار دقیق‌تری را دارد و می‌تواند تنها بخش‌هایی از تصویر را که کاربر مشخص کرده تغییر دهد، بدون آنکه عناصر مهمی مانند نورپردازی، ترکیب‌بندی یا ظاهر افراد دچار تغییر ناخواسته شود. این موضوع به‌ویژه در ویرایش عکس، امتحان‌کردن لباس و مدل مو، و اعمال فیلترهای سبکی اهمیت زیادی دارد و باعث می‌شود نتیجه نهایی به تصویر ذهنی کاربر نزدیک‌تر باشد.

بر اساس توضیحات ارائه‌شده شرکت OepnAI، سرعت تولید تصویر در نسخه جدید تا چهار برابر افزایش یافته است. این افزایش سرعت به کاربران اجازه می‌دهد ایده‌های بیشتری را در زمان کوتاه‌تری آزمایش کنند و هم‌زمان چند فرایند تولید تصویر را پیش ببرند، بدون آنکه منتظر تکمیل هر مرحله بمانند. OpenAI این ویژگی را گامی مهم برای تبدیل ChatGPT Images به یک ابزار خلاقانه روزمره توصیف کرده است.

یکی از مهم‌ترین پیشرفت‌ها، بهبود چشمگیر در ویرایش تصاویر بارگذاری‌شده است. مدل جدید می‌تواند تغییراتی مانند افزودن، حذف، ترکیب یا جابه‌جایی عناصر را با دقت بالا انجام دهد، در حالی که ویژگی‌های اصلی تصویر حفظ می‌شود. این قابلیت به کاربران حرفه‌ای و تولیدکنندگان محتوا اجازه می‌دهد اصلاح‌های پیچیده‌تری را انجام دهند، بدون آنکه کیفیت یا هویت تصویر از بین برود.

در کنار ویرایش، دگرگونی‌های خلاقانه نیز نقش پررنگ‌تری در این نسخه دارند. مدل جدید قادر است عناصر مفهومی مانند متن، چیدمان و سبک هنری را به تصویر اضافه کند و در عین حال ماهیت تصویر اصلی را نگه دارد. این قابلیت هم برای پروژه‌های ساده و هم برای مفاهیم پیچیده کاربرد دارد و از طریق مجموعه‌ای از سبک‌ها و ایده‌های آماده در دسترس کاربران ChatGPT Images قرار گرفته است.

OpenAI همچنین از بهبود قابل توجه در پیروی از دستورها خبر داده است. در نسخه جدید، مدل روابط میان عناصر تصویر را دقیق‌تر درک می‌کند و در ترکیب‌های پیچیده نیز مطابق خواست کاربر عمل می‌کند. این موضوع به‌ویژه در تولید تصاویر چندبخشی یا دارای ساختار مشخص اهمیت دارد و خطاهای رایج نسخه‌های پیشین را کاهش می‌دهد.

نمایش متن در تصاویر نیز یکی دیگر از حوزه‌هایی است که ارتقا یافته است. مدل جدید می‌تواند متن‌های متراکم و کوچک را با وضوح بالاتر رندر کند، قابلیتی که برای طراحی پوستر، اینفوگرافیک، ماکاپ‌های خبری و محتوای آموزشی اهمیت زیادی دارد.

دو اسکرین‌شات از محیط موبایل ChatGPT؛ نوشتن دستور متنی (چپ) و تصویر تولید شده از گربه (راست).

هم‌زمان با معرفی مدل جدید، یک فضای اختصاصی برای تولید و آزمایش تصاویر در رابط کاربری ChatGPT اضافه شده است. این بخش که در نوار کناری ChatGPT در دسترس قرار دارد، شامل فیلترهای آماده، دستورهای ترندشده و ابزارهایی برای شروع سریع فرایند خلاقانه است. همچنین امکان بارگذاری یک‌باره چهره فراهم شده تا کاربران بتوانند از ظاهر خود در تولیدهای بعدی بدون نیاز به بارگذاری مجدد استفاده کنند.

OpenAI تأکید کرده است که با وجود این پیشرفت‌ها، مدل جدید همچنان بی‌نقص نیست. ارزیابی مجدد نمونه‌های اولیه نشان می‌دهد که دقت و کیفیت خروجی‌ها به‌طور محسوسی افزایش یافته، اما در برخی موارد مانند سبک‌های خاص، چهره‌های متعدد یا دقت علمی، محدودیت‌هایی باقی مانده است. با این حال، این شرکت این نسخه را یک گام مهم رو به جلو در مسیر توسعه ChatGPT Images می‌داند.

بیشتر بخوانید: چگونه از ChatGPT پاسخ های دقیق بگیریم؟

به نقل از انگجت، نسخه API این مدل با نام GPT Image 1.5 نیز در دسترس توسعه‌دهندگان قرار گرفته است. این نسخه، علاوه بر بهبود کیفیت و ثبات بصری، حدود ۲۰ درصد هزینه کمتری نسبت به نسل قبلی دارد و برای کاربردهایی مانند طراحی گرافیک، بازاریابی، تولید محتوای تجاری و کاتالوگ‌های فروش آنلاین مناسب‌تر شده است.

OpenAI در پایان اعلام کرده است که نسخه جدید ChatGPT Images از امروز به‌صورت جهانی برای همه کاربران فعال شده و نسخه قبلی همچنان به‌عنوان یک GPT سفارشی قابل استفاده خواهد بود. این شرکت تأکید می‌کند که تولید تصویر هنوز در ابتدای مسیر توسعه قرار دارد و به‌روزرسانی‌های آینده با تمرکز بر دقت بیشتر، ویرایش‌های ظریف‌تر و پشتیبانی گسترده‌تر از زبان‌ها ارائه خواهد شد.

Source link

تیم تحریریه مگ دید

تیم تحریریه magdid.ir با هدف ارائه محتوای دقیق، به‌روز و جذاب در حوزه‌های مختلف، تلاش می‌کند تجربه‌ای مفید و الهام‌بخش برای خوانندگان فراهم کند. این تیم متشکل از نویسندگان و متخصصانی است که با تحقیق و بررسی دقیق، مطالب آموزشی، خبری و تحلیلی را با زبان ساده و قابل فهم به مخاطب ارائه می‌دهند. تعهد ما، اطلاع‌رسانی صادقانه و ارتقای دانش و آگاهی جامعه است.

نوشته های مشابه

دکمه بازگشت به بالا