اوپنایآی GPT-5 را برای تمامی کاربران ChatGPT به صورت رایگان عرضه کرد
روز پنجشنبه، شرکت اوپنایآی مدل زبانی بزرگ GPT-5 و سه نسخه دیگر آن—GPT-5 Pro، GPT-5 mini و GPT-5 nano—را معرفی کرد. این شرکت این مدل جدید را «بهترین سیستم هوش مصنوعی خود» نامید و اعلام کرد که برای تمامی کاربران ChatGPT، از جمله کاربران رایگان، قابل دسترس خواهد بود. این گام بزرگی برای اوپنایآی محسوب میشود، چرا که برای اولین بار کاربران رایگان به یک مدل هوش مصنوعی شبیهسازیشده برای استدلال دسترسی پیدا میکنند. این مدل میتواند مشکلات را با استفاده از تکنیکی که دقت پاسخدهی به سوالات منطقی یا تحلیلی را بهبود میبخشد، به چندین مرحله تقسیم کند.
GPT-5 جدیدترین تلاش اوپنایآی برای یکپارچهسازی قابلیتهای مختلف هوش مصنوعی خود در یک سیستم واحد است. این شرکت اظهار داشته که خانواده GPT-5 به عنوان یک «سیستم یکپارچه» عمل میکند و شامل یک مدل هوشمند و کارآمد برای پاسخدهی به بیشتر سوالات، یک مدل استدلالی عمیقتر به نام «تفکر GPT-5» (GPT-5 thinking) برای مسائل دشوارتر، و یک مسیریاب بیدرنگ است که بر اساس نوع مکالمه، پیچیدگی، نیاز به ابزارها و قصد کاربر، تصمیم میگیرد از کدام رویکرد استفاده کند. این رویکرد یکپارچه به منظور ارائه تجربهای روانتر و کارآمدتر برای کاربران طراحی شدهاند. همانند GPT-4o، مدل GPT-5 نیز یک سیستم چندوجهی (multimodal) است که میتواند از طریق تصاویر، صدا و متن تعامل داشته باشد.
عرضه GPT-5 از امروز آغاز شده و دسترسی به آن برای 700 میلیون کاربر فعال هفتگی ChatGPT فراهم میشود، با این حال محدودیتهای استفاده بر اساس سطح اشتراک متفاوت خواهد بود. مشترکین نسخه Pro دسترسی نامحدودی به GPT-5 و نسخه GPT-5 Pro خواهند داشت، در حالی که کاربران Plus «محدودیتهای استفاده بسیار بالاتری» نسبت به کاربران رایگان دریافت میکنند. GPT-5 Pro جایگزین o3-pro در ChatGPT برای سطوح اشتراکی که به آن دسترسی دارند، میشود. این استراتژی به اوپنایآی اجازه میدهد تا کاربران بیشتری را جذب کرده و در عین حال ارزش اشتراکهای پولی خود را حفظ کند.
پیشرفتهای فنی و ویژگیهای جدید
از زمان عرضه GPT-4 در سال 2023، شاهد روند بازده نزولی نسبی در جهشهای قابلیتی بین نسخههای اصلی مدلهای هوش مصنوعی بودهایم. در این معنا، جهش در قابلیت پردازش محتوای متنی بین GPT-3 و GPT-4 به طور «تکاندهندهای بزرگ» احساس میشد. جهش بین GPT-4 (اگر نسخه اصلی 2023 را در نظر بگیریم) و GPT-5 همچنان قابل توجه است، اما با در نظر گرفتن نسخههای میانی مانند GPT-4o، GPT-4.5، GPT-4.1 و o3-pro، GPT-5 بیشتر شبیه به یک ارتقای افزایشی است که بعید است کسی را شوکه کند. با این حال، حتی پیشرفتهای کوچک در این مقیاس نیز میتوانند تأثیرات قابل توجهی بر کاربردها و عملکرد کلی داشته باشند.
ما پیش از این درباره اینکه چگونه اوپنایآی تقریباً از نام “GPT-5” برای مدلهایی مانند o1 در سال گذشته استفاده کرد، اما تصمیم گرفت آن را برای عرضه در آینده ذخیره کند، نوشتهایم. دلیل اینکه این مدلهای جدید به این آستانه نامگذاری رسیدهاند، نامشخص است، اما شناسایی برند «GPT-5» احتمالاً به اوپنایآی در میان یک صنعت بسیار رقابتی، رونقی در افکار عمومی خواهد داد. این نامگذاری میتواند به جذب توجه و اعتبار بیشتر برای مدلهای جدید کمک کند، حتی اگر پیشرفتها به اندازه گذشته چشمگیر نباشند. رقابت فزاینده در بازار هوش مصنوعی به شرکتها فشار میآورد تا نوآوریهای خود را به بهترین نحو ممکن به نمایش بگذارند.
از جمله بهبودهای ادعا شده، اوپنایآی میگوید GPT-5 «قویترین مدل کدنویسی خود تا به امروز» را ارائه میدهد که در بنچمارک SWE-bench Verified به 74.9 درصد و در Aider Polyglot به 88 درصد دست یافته است. (برای مقایسه، اوایل این هفته، شرکت Anthropic مدل Claude Opus 4.1 را عرضه کرد که طبق گزارشها در SWE-bench امتیاز 74.5 درصد را کسب کرده است.) GPT-5 میتواند «وظایف پیچیده کدنویسی را از ابتدا تا انتها با حداقل پرامپتنویسی» تکمیل کند و طراحیهای رابط کاربری نرمافزار را برای کاربران بدون تجربه کدنویسی ایجاد کند. این قابلیتها میتوانند توسعه نرمافزار را برای طیف وسیعتری از کاربران در دسترس قرار دهند و سرعت توسعه را افزایش دهند.
برای پرسشهای مرتبط با سلامت، اوپنایآی بار دیگر GPT-5 را به عنوان «بهترین مدل خود تا به امروز» معرفی میکند که در بنچمارک HealthBench Hard (یک بنچمارک ابداعی توسط اوپنایآی) امتیاز 46.2 درصد را کسب کرده است، هرچند این شرکت هشدار میدهد که «ChatGPT جایگزین یک متخصص پزشکی نیست.» این مدل میتواند به کاربران در درک نتایج پزشکی و آمادهسازی سوالات برای ارائهدهندگان خدمات بهداشتی کمک کند، اگرچه بهتر است به طور کامل به خروجیهای یک مدل هوش مصنوعی اعتماد نکنید، زیرا تمام مدلهای زبان هوش مصنوعی، به عنوان مدلهای پیشبینیکننده تنظیم شده برای جلب مشارکت کاربر، تمایل دارند آنچه را که مردم میخواهند بشنوند، بگویند. بنابراین، همیشه تأیید اطلاعات از منابع معتبر ضروری است.
در سایر معیارهای عملکرد، GPT-5 گزارشاً در AIME 2025 برای ریاضیات بدون ابزار به 94.6 درصد و در MMMU برای درک چندوجهی به 84.2 درصد دست یافته است. و با قابلیت استدلال گسترده GPT-5 Pro، یک رکورد جدید در GPQA با 88.4 درصد بدون ابزار ثبت کرده است. اوپنایآی ادعا میکند که GPT-5 با «تفکر» بهتر از OpenAI o3 عمل میکند و 50 تا 80 درصد توکنهای خروجی کمتری در قابلیتهای مختلف دارد. این بهینهسازی در مصرف توکنها میتواند به کاهش هزینهها و افزایش کارایی برای توسعهدهندگان منجر شود، که یک مزیت رقابتی مهم محسوب میشود.
اعتبار تصویر: OpenAI
بهبودهای رابط کاربری و «تکمیلهای ایمن»
ChatGPT همچنین بهروزرسانیهایی در رابط کاربری خود دریافت کرده است، از جمله قابلیت شخصیسازی رنگهای چت، شخصیتهای گفتگوی از پیش تعیین شده (با گزینههایی مانند «بدبین»، «ربات»، «شنونده» و «علاقهمند به تکنولوژی»)، و ادغام با جیمیل، تقویم گوگل و مخاطبین گوگل برای کاربران Pro. حالت صوتی نیز در یک سیستم واحد به نام «صدای پیشرفته» (Advanced Voice) یکپارچه شده است که به گفته اوپنایآی، دستورالعملهای کاربر را بهتر درک میکند و سبک گفتاری خود را با آن تطبیق میدهد. این تغییرات به منظور بهبود تجربه کاربری و افزایش انعطافپذیری در تعامل با مدل طراحی شدهاند، که میتواند به بهرهوری بیشتر منجر شود.
رویکرد این شرکت به سانسور پاسخها با آنچه که آن را «تکمیلهای ایمن» مینامد، تغییر کرده است. به جای رد کامل درخواستها، GPT-5 تلاش میکند تا «مفیدترین پاسخ ممکن را در چارچوب مرزهای ایمنی» ارائه دهد. هنگامی که مدل نمیتواند به درخواستی کمک کند، توضیحات کاملی درباره محدودیتهای خود ارائه میدهد. این رویکرد شفافتر به کاربران کمک میکند تا محدودیتهای مدل را درک کنند و از سوءتفاهم جلوگیری شود. هدف نهایی اوپنایآی ایجاد یک سیستم هوش مصنوعی مسئولیتپذیر است که هم مفید باشد و هم ایمنی کاربران را تضمین کند.
اوپنایآی همچنین به مسائل قبلی مربوط به چاپلوسی پاسخ داده است. اوایل سال جاری، بهروزرسانی GPT-4o به طور «ناخواسته» مدل را بیش از حد چاپلوس یا موافق کرده بود. از طریق ارزیابیهای جدید و آموزش بهبود یافته، GPT-5 گزارشاً پاسخهای چاپلوسانه را از 14.5 درصد به کمتر از 6 درصد در ارزیابیهای هدفمند کاهش داده است. زمان نشان خواهد داد که آیا این موضوع به کاهش روند اخیر «تحریک» رفتارهای توهمی و مانیک در برخی افراد کمک خواهد کرد. این تلاشها نشاندهنده تعهد اوپنایآی به پالایش و بهبود تعاملات هوش مصنوعی با کاربران است.
ما هنوز آزمایش عملی زیادی با GPT-5 انجام ندادهایم، اما احتمالاً عملکرد آن را در آینده در مقالهای مفصلتر ارزیابی خواهیم کرد. این ارزیابیها به ما کمک میکنند تا ادعاهای اوپنایآی را تأیید کرده و درک عمیقتری از قابلیتهای واقعی مدل به دست آوریم.
دسترسی و قیمتگذاری برای توسعهدهندگان
برای توسعهدهندگان، GPT-5 در سه نسخه API عرضه میشود: gpt-5، gpt-5-mini، و gpt-5-nano، که هر کدام مصالحهای بین تاخیر (latency) و هزینه ارائه میدهند. پنجره متنی (context window) به 256,000 توکن افزایش یافته است، در حالی که در مدل قبلی OpenAI o3، این مقدار 200,000 توکن بود. توسعهدهندگانی که به پنجرههای متنی بزرگتر نیاز دارند، همچنان میتوانند از GPT-4.1 با ظرفیت 1 میلیون توکن استفاده کنند. این انعطافپذیری به توسعهدهندگان اجازه میدهد تا بر اساس نیازهای خاص پروژههای خود، مدل مناسب را انتخاب کنند.
قیمتگذاری API برای GPT-5 برابر با 1.25 دلار به ازای هر میلیون توکن ورودی با تخفیف 90 درصدی کش و 10 دلار به ازای هر میلیون توکن خروجی است. این قیمتگذاری «تا حدی قابل مقایسه» با GPT-4.1 (2 دلار ورودی/8 دلار خروجی به ازای هر میلیون توکن) و o3 (2 دلار ورودی/8 دلار خروجی به ازای هر میلیون توکن) است. GPT-5 Mini گزینهای مقرون به صرفهتر با قیمت 0.25 دلار به ازای هر میلیون توکن ورودی و 2 دلار به ازای هر میلیون توکن خروجی ارائه میدهد، در حالی که GPT-5 Nano اقتصادیترین اما کمتوانترین سطح را با تنها 0.05 دلار به ازای هر میلیون توکن ورودی و 0.40 دلار به ازای هر میلیون توکن خروجی فراهم میکند. قیمتگذاری GPT-5 Pro برای دسترسی API هنوز اعلام نشده است. این سطوح قیمتگذاری متنوع، دسترسی به فناوری اوپنایآی را برای طیف وسیعی از توسعهدهندگان با بودجههای مختلف ممکن میسازد.
جزئیات عرضه GPT-5
عرضه GPT-5 در زمانی صورت میگیرد که اوپنایآی با رقابت فزایندهای از سوی مدلهای Gemini گوگل، خانواده Claude Anthropic، و مدلهای منبع باز Llama متا روبرو است. اوپنایآی گزارش میدهد که 5 میلیون کاربر تجاری پرداختکننده و 4 میلیون توسعهدهنده در پلتفرم API خود دارد. این اعداد نشاندهنده نفوذ گسترده و محبوبیت محصولات اوپنایآی در بازار است، اما همچنین بر فشار رقابتی برای نوآوری مداوم تأکید دارد.
GPT-5 جایگزین مدلهای پیشفرض قبلی برای کاربران وارد شده به ChatGPT، یعنی GPT-4o، OpenAI o3، OpenAI o4-mini، GPT-4.1 و GPT-4.5 میشود. این سیستم به طور خودکار استدلال شبیهسازیشده را زمانی که پاسخها از آن بهرهمند میشوند، اعمال میکند، اگرچه کاربران پولی همچنان میتوانند «تفکر GPT-5» را از انتخابگر مدل انتخاب کنند یا عباراتی مانند «درباره این موضوع عمیقاً فکر کن» را اضافه کنند تا اطمینان حاصل شود که از قابلیت استدلال استفاده میشود. این قابلیت به کاربران حرفهایتر امکان کنترل بیشتری بر نحوه پردازش و تولید پاسخها توسط مدل میدهد و میتواند برای وظایف پیچیدهتر مفید باشد.
عرضه مدل از روز پنجشنبه برای تمامی سطوح کاربری آغاز میشود، و مشتریان سازمانی و آموزشی در هفته آینده به آن دسترسی خواهند یافت. اوپنایآی قصد دارد حالت صوتی استاندارد خود را ظرف 30 روز به عنوان بخشی از گذار به سیستم یکپارچه صدای پیشرفته، بازنشسته کند. هنگامی که کاربران رایگان به محدودیتهای استفاده خود از GPT-5 برسند، به GPT-5 mini، یک مدل کوچکتر و سریعتر، منتقل میشوند. این استراتژی به اوپنایآی کمک میکند تا تقاضای بالا را مدیریت کند و در عین حال تجربه کاربری را برای همه حفظ کند. این یک خبر در حال توسعه است و به مرور زمان بهروزرسانی خواهد شد.
منبع: Ars Technica