رونمایی بزرگ OpenAI: خانواده جدید مدلهای GPT-5
پس از سالها گمانهزنی و هایپ گسترده، شرکت OpenAI سرانجام به طور رسمی از مجموعهای جدید از مدلهای زبان بزرگ (LLMs) خود رونمایی کرد. این مدلها که همگی نسخههایی با اندازههای متفاوت از GPT-5 هستند، پیشرفت چشمگیری نسبت به مدل قبلی، GPT-4 که نزدیک به دو سال و نیم پیش در مارس 2023 معرفی شده بود، نشان میدهند. این رونمایی نقطه عطفی مهم در توسعه هوش مصنوعی محسوب میشود و انتظارات زیادی را در جامعه فناوری ایجاد کرده است.
OpenAI چهار نسخه متمایز از این مدل را با نامهای GPT-5، GPT-5 Mini، GPT-5 Nano و GPT-5 Pro برای پاسخگویی به نیازهای مختلف کاربران از نظر سرعت، هزینه و عمق محاسباتی معرفی کرده است. این رویکرد به کاربران امکان میدهد تا بر اساس نیازهای خاص خود، بهینهترین مدل را انتخاب کنند، خواه برای کارهای عمومی با کیفیت بالا باشد یا برای محیطهای سازمانی پیچیده که نیازمند استدلال عمیق هستند.
هر یک از این نسخهها برای سناریوهای کاربردی خاصی بهینه شدهاند. در حالی که GPT-5 مدل اصلی با قابلیتهای استدلالی کامل است، نسخههای Mini و Nano برای کارایی و سرعت در کاربردهای با حجم بالا یا محدودیتهای تاخیر طراحی شدهاند. از سوی دیگر، GPT-5 Pro با تمرکز بر استدلال گسترده و توان محاسباتی موازی، برای چالشبرانگیزترین وظایف در محیطهای تحقیقاتی و سازمانی توسعه یافته است.
نسخههای مختلف GPT-5 و کاربردهای آنها
- GPT-5: این مدل هسته اصلی استدلال و قابلیتهای کامل را داراست و هم در ChatGPT و هم از طریق رابط برنامهنویسی کاربردی (API) OpenAI برای انجام وظایف عمومی با کیفیت بالا مورد استفاده قرار میگیرد.
- GPT-5 Pro: یک نسخه تقویتشده با استدلال گسترده و قابلیت محاسبات موازی است که برای استفاده در محیطهای پیچیده سازمانی و تحقیقاتی طراحی شده است. این مدل پاسخهای دقیقتر و قابلاعتمادتری ارائه میدهد، به ویژه در پرسوجوهای مبهم یا چند مرحلهای.
- GPT-5 Mini: نسخهای کوچکتر و سریعتر از مدل اصلی است که برای تأخیر کمتر و مصرف منابع بهینه شده است. این مدل به عنوان یک جایگزین در مواقعی که محدودیتهای استفاده وجود دارد یا استدلال حداقلی کافی است، به کار میرود.
- GPT-5 Nano: سبکترین نسخه است که برای سرعت و کارایی در کاربردهای با حجم بالا یا حساس به هزینه ساخته شده است. این مدل قابلیت استدلال را حفظ میکند، اما در مقیاسی کوچکتر، که آن را برای دستگاههای موبایل، سیستمهای تعبیهشده یا کاربردهای با محدودیت تاخیر ایدهآل میسازد.
GPT-5: نه هوش عمومی مصنوعی (AGI)، اما بسیار توانمند
شاید مهمترین نکته در مورد GPT-5، نه آنچه که هست، بلکه آنچه که نیست: هوش عمومی مصنوعی (AGI). OpenAI هدف خود را دستیابی به AGI، سیستمی خودمختار از هوش مصنوعی که در اکثر کارهای دارای ارزش اقتصادی از انسان پیشی میگیرد، اعلام کرده است. اما به گفته این شرکت، GPT-5 هنوز به این مرحله نرسیده است.
همانطور که سم آلتمن، همبنیانگذار و مدیرعامل OpenAI، در تماس ویدیویی با خبرنگاران بیان کرد، “آنچه اکثر ما از AGI تعریف میکنیم، هنوز چیزی کاملاً مهم را کم دارد – در واقع بسیاری چیزهای کاملاً مهم – اما یکی از بزرگترین آنها مدلی است که به طور مداوم در حین استقرار یاد میگیرد و GPT-5 چنین قابلیتی ندارد.” این شفافسازی از سوی آلتمن، با توجه به بحثهای گسترده در مورد قابلیتهای AGI و تأثیرات آن بر کسبوکار، از اهمیت بالایی برخوردار است.
سخنگوی OpenAI نیز در ایمیلی این موضوع را تأیید کرد: “GPT-5 گامی مهم در جهت AGI است؛ زیرا بهبودهای قابل توجهی در استدلال و تعمیمپذیری نشان میدهد و ما را به سیستمهایی نزدیکتر میکند که میتوانند طیف وسیعی از وظایف را با قابلیت در سطح انسانی انجام دهند. با این حال، AGI هنوز یک اصطلاح ضعیف تعریف شده است و برای افراد مختلف معانی متفاوتی دارد. در حالی که GPT-5 برخی معیارهای اولیه برای AGI را برآورده میکند، هنوز به آستانه AGI در سطح کاملاً انسانی نرسیده است. هنوز محدودیتهای کلیدی در زمینههایی مانند حافظه پایدار، خودگردانی و سازگاری در بین وظایف وجود دارد. تمرکز ما همچنان بر پیشبرد ایمن این قابلیتها است، نه گمانهزنی در مورد زمانبندیهای خاص.”
نزدیک شدن به عملکرد در سطح انسان
با وجود اینکه GPT-5 هنوز AGI نیست، نتایج بنچمارکهای منتشر شده توسط OpenAI نشان میدهد که این مدل به آستانه عملکردی برابر یا حتی فراتر از عملکرد متوسط متخصصان انسانی در وظایف مختلف در حوزههای حقوق، لجستیک، فروش و مهندسی نزدیک شده است. این پیشرفتها، اهمیت و تأثیرگذاری GPT-5 را در کاربردهای عملی به وضوح نشان میدهد.
همانطور که OpenAI مینویسد: “هنگام استفاده از استدلال، GPT-5 تقریباً در نیمی از موارد با متخصصان برابر یا بهتر است، در حالی که از OpenAI o3 و ChatGPT Agent پیشی میگیرد.” این ارقام نشاندهنده جهش قابل توجه در دقت و توانایی استدلال مدل است، که آن را برای حل مسائل پیچیدهتر مناسب میسازد.
چرا از GPT-5 استفاده کنیم؟
با وجود مدلهای جایگزین بسیاری که اکنون از OpenAI و رقبای رو به رشد، به ویژه استارتاپهای چینی ارائهدهنده مدلهای منبع باز قدرتمند، در دسترس هستند، GPT-5 چه مزایای جدیدی را به ارمغان میآورد؟ آلتمن جهش در قابلیتها را بیش از یک پیشرفت تدریجی توصیف کرد. او تجربه استفاده از GPT-5 را به ارتقاء از یک نمایشگر پیکسلی به یک صفحه نمایش رتینا تشبیه کرد – چیزی که کاربران به سادگی نمیخواهند به آن بازگردند.
آلتمن گفت: “GPT-3 مانند صحبت کردن با یک دانشآموز دبیرستانی بود. GPT-4 شبیه یک دانشجوی دانشگاه بود. GPT-5 برای اولین بار احساس صحبت کردن با یک متخصص در سطح دکترا را در جیب شما میدهد.” این توصیف به وضوح نشان میدهد که OpenAI معتقد است GPT-5 تجربه کاربری را به سطحی کاملاً جدید ارتقا داده است، جایی که درک عمیقتر و پاسخهای تخصصیتر به کاربران ارائه میشود.
یکی از چشمگیرترین قابلیتهای نمایش داده شده برای خبرنگاران در طول تماس ویدیویی محرمانه، توانایی تولید کد برای یک برنامه وب کاملاً کارآمد تنها با یک دستور متنی بود. در این مورد، یک برنامه آموزش زبان فرانسه با یک بازی داخلی که در آن عبارات انگلیسی به فرانسوی هر بار که کاربر ماوس مجازی را برای جمعآوری تکههای پنیر هدایت میکرد، نمایش داده میشد، با شخصیتهای کاملاً کارآمد الهام گرفته از ایموجی، پسزمینه/تنظیمات و منوهای تعاملی قابل کلیک. دستور ورودی نیز تنها یک پاراگراف بود.
همانطور که آلتمن بیان کرد: “این ایده نرمافزار بر اساس تقاضا، بخش تعیینکنندهای از دوران جدید GPT-5 خواهد بود.” این قابلیت، پتانسیل عظیمی را برای توسعه سریع برنامهها و ابزارهای سفارشی باز میکند، که میتواند انقلابی در شیوه توسعه نرمافزار ایجاد کند و زمان و هزینه مورد نیاز برای توسعه را به شدت کاهش دهد.
دسترسی برای کاربران رایگان و تمام پلنهای ChatGPT
دسترسی به GPT-5 تنها به مشترکین پریمیوم محدود نمیشود. OpenAI این مدل را در تمام سطوح ChatGPT، از جمله کاربران رایگان، در دسترس قرار داده است – اقدامی عمدی که با مأموریت شرکت برای تضمین مزایای گسترده هوش مصنوعی همسو است. کاربران سطح رایگان میتوانند به GPT-5 و GPT-5 Mini دسترسی داشته باشند، البته با محدودیتهای استفاده – اگرچه این محدودیتها در حال حاضر تعریف نشدهاند و حدس زده میشود که بسته به تقاضا به طور نامنظم تغییر خواهند کرد.
مشترکین سطح ChatGPT Plus (20 دلار در ماه) سهمیه استفاده بالاتری دریافت میکنند، در حالی که مشترکین ChatGPT Pro (200 دلار در ماه)، Team (30 دلار در ماه یا 240 دلار سالانه) و Enterprise (قیمتگذاری متغیر بسته به اندازه شرکت و میزان استفاده) دسترسی نامحدود یا اولویتدار دارند. GPT-5 Pro نیز در روزهای آینده برای مشتریان Team، Enterprise و EDU در دسترس خواهد بود. این ساختار قیمتگذاری به شرکتها و افراد امکان میدهد تا بر اساس نیازهای خود از قابلیتهای پیشرفته GPT-5 بهرهمند شوند.
تجربه یکپارچه جدید ChatGPT نیاز به انتخاب دستی مدل را از بین میبرد. هنگامی که کاربران به محدودیتهای استفاده از GPT-5 میرسند، سیستم به طور خودکار به GPT-5 Mini تغییر میکند – یک جایگزین سبکتر اما همچنان بسیار توانمند. این ویژگی اطمینان میدهد که کاربران همیشه به یک مدل قدرتمند دسترسی دارند، حتی در صورت استفاده زیاد، و تجربه کاربری پیوسته و بدون وقفه را فراهم میکند.
بهبود معیارهای عملکرد در سراسر مدل، از جمله 100% در ریاضیات AIME 2025
به گفته OpenAI، GPT-5 دقیقترین، پاسخگوترین و آگاهترین سیستم هوش مصنوعی است که این شرکت تاکنون عرضه کرده است. این مدل خطاهای مربوط به “توهم” (hallucinations) را کاهش میدهد، استدلال چند مرحلهای را با قابلیت اطمینان بیشتری انجام میدهد و کد، محتوا و پاسخهای با کیفیت بهتری را در حوزههای مختلف تولید میکند. این بهبودها، GPT-5 را به ابزاری قدرتمند برای طیف وسیعی از کاربردها تبدیل میکند.
سیستم GPT-5 حدود 45 درصد خطاهای واقعی کمتری نسبت به GPT-4o در ترافیک دنیای واقعی ارائه میدهد و در صورت استفاده از حالت “تفکر” (thinking mode) تا 80 درصد این خطاها کمتر میشود. این حالت که کاربران میتوانند با صراحت از مدل بخواهند که زمان بیشتری را صرف کند، امکان پاسخهای پیچیدهتر و قویتر را فراهم میکند – که در برخی پیکربندیها توسط GPT-5 Pro پشتیبانی میشود.
در آزمایشها، GPT-5 Pro امتیازهای جدید و پیشرفتهای را در بنچمارکهایی مانند GPQA (88.4%)، ریاضیات AIME 2025 (100% با استفاده از پایتون برای پاسخ به سوالات) و HealthBench Hard (46.2%) به دست آورده است. این نتایج، قدرت بیسابقه GPT-5 در حل مسائل پیچیده و دقیق را نشان میدهد و آن را در صدر مدلهای زبان بزرگ قرار میدهد.
بهبود عملکرد در بنچمارکهای کلیدی آکادمیک و دنیای واقعی به چشم میخورد. در کدنویسی، GPT-5 نتایج جدیدی را در SWE-Bench Verified (74.9%) و Aider Polyglot (88%) ثبت کرده است. شاید باورنکردنیترین نکته این است که در آزمون نهایی بشریت (Humanity’s Last Exam) – یک بنچمارک جدید شامل 2,500 وظیفه فوقالعاده دشوار برای برنامهها – GPT-5 Pro به رکورد 42% دست یافته است، که رقبا و تمام مدلهای قبلی OpenAI را به جز ChatGPT Agent جدید که ماه گذشته رونمایی شد و کامپیوتر و مکاننما را مانند انسان کنترل میکند، پشت سر میگذارد.
در وظایف نوشتاری، GPT-5 به طور روانتری با لحن، زمینه و قصد کاربر سازگار میشود. این مدل در حفظ انسجام، ساختاردهی واضح اطلاعات و تکمیل وظایف نوشتاری پیچیده بهتر عمل میکند. این بهبودها فقط فنی نیستند – تیم OpenAI تأکید کرد که GPT-5 در مکالمه طبیعیتر و انسانمانندتر احساس میشود، که تجربه تعاملی را بسیار ارتقا میدهد.
موارد استفاده مرتبط با سلامت نیز بهبود یافتهاند. در حالی که OpenAI همچنان هشدار میدهد که ChatGPT جایگزینی برای متخصصان پزشکی نیست، GPT-5 در پرچمگذاری نگرانیها، کمک به کاربران در تفسیر نتایج پزشکی و راهنمایی آنها برای آماده شدن برای قرار ملاقاتها یا ارزیابی گزینهها فعالتر عمل میکند. این سیستم همچنین پاسخها را بر اساس مکان کاربر، دانش پیشزمینه و زمینه تنظیم میکند – که منجر به کمک ایمنتر و شخصیسازی شدهتر میشود.
یکی از مهمترین بهروزرسانیها در بخش “تکمیلهای ایمن” (safe completions) است، یک سیستم جدید که به GPT-5 کمک میکند تا از رد شدن ناگهانی یا خروجیهای ناامن اجتناب کند. به جای رد کردن کامل پرسوجوها، GPT-5 تلاش میکند تا مفیدترین پاسخ را در حدود ایمنی خود ارائه دهد و توضیح میدهد که چه زمانی نمیتواند کمک کند – تغییری که رد شدنهای غیرضروری را به شدت کاهش میدهد و در عین حال قابلیت اعتماد را حفظ میکند.
ابزارهای جدید توسعهدهنده برای استفاده از GPT-5 از طریق API
GPT-5 همچنین یک ارتقاء بزرگ برای توسعهدهندگانی است که روی سیستمهای عاملمحور و جریانهای کاری با کمک ابزار کار میکنند. OpenAI مجموعهای از کنترلهای توسعهدهنده پسند را در API GPT-5 معرفی کرده است، از جمله:
- فراخوانی تابع آزاد (Free-form function calling): ابزارها اکنون میتوانند رشتههای خام مانند پرسوجوهای SQL یا دستورات shell را بپذیرند، بدون نیاز به ساختار JSON.
- کنترل تلاش استدلالی (Reasoning effort control): توسعهدهندگان میتوانند بین پاسخهای سریع و پردازش تحلیلی عمیقتر بسته به وظیفه، جابهجا شوند.
- کنترل ورباسیته (Verbosity control): یک پارامتر جدید به کاربران امکان میدهد تا انتخاب کنند که پاسخها مختصر، استاندارد یا مفصل باشند.
- خروجیهای ساختاریافته با محدودیتهای گرامری (Structured outputs with grammar constraints): توسعهدهندگان اکنون میتوانند خروجیها را با استفاده از گرامرهای سفارشی یا عبارات منظم هدایت کنند.
- پیشگفتار فراخوانی ابزار (Tool call preambles): GPT-5 اکنون میتواند قبل از استفاده از ابزارها یا درخواستهای خارجی، استدلال خود را توضیح دهد.
توسعهدهندگان میتوانند از طریق پلتفرم OpenAI به GPT-5 با قیمتهای زیر دسترسی داشته باشند:
- gpt-5: 1.25 دلار / 10 دلار به ازای هر 1 میلیون توکن ورودی/خروجی (با حداکثر 90% تخفیف کش ورودی)
- gpt-5-mini: 0.50 دلار / 5 دلار به ازای هر 1 میلیون توکن ورودی/خروجی
- gpt-5-nano: 0.15 دلار / 1.50 دلار به ازای هر 1 میلیون توکن ورودی/خروجی
پنجره زمینه (context window) اکنون 256,000 توکن را پوشش میدهد (تقریباً به اندازه یک کتاب 600-800 صفحهای)، که به GPT-5 اجازه میدهد اسناد بسیار بزرگتر و مکالمات گستردهتری را نسبت به سلف خود، GPT-4 Turbo، مدیریت کند. برای کسانی که به موارد بیشتری نیاز دارند، GPT-4.1 (که از پنجرههای زمینه 1 میلیون توکنی پشتیبانی میکند) همچنان در دسترس است. این قابلیت، انقلابی در تحلیل دادههای حجیم و حفظ زمینه در مکالمات طولانی ایجاد خواهد کرد.
در مقایسه با رقبای اصلی – Anthropic و Google – مدلهای GPT-5 شرکت OpenAI از طریق API برابر یا ارزانتر هستند، که فشار نزولی بیشتری بر هزینه هوش مصنوعی وارد میکند و دسترسی به قابلیتهای پیشرفته را برای تعداد بیشتری از توسعهدهندگان و شرکتها فراهم میسازد.
مدل / سطح | هزینه ورودی (به ازای هر 1M توکن) | هزینه خروجی (به ازای هر 1M توکن) | یادداشتها |
---|---|---|---|
GPT‑5 | $1.25 (پیش از کش) | $10 | با حداکثر 90% کشینگ ورودی |
GPT‑5‑mini | $0.50 | $5 | — |
GPT‑5‑nano | $0.15 | $1.50 | — |
Claude Sonnet 4 | $3 | $15 | حداکثر 90% تخفیف کشینگ پرامپت |
Claude Opus 4 | $15 | $75 | مدل سطح بالا برای وظایف پیچیده |
Gemini 2.5 Pro (≤200K) | $1.25 | $10 | پرامپتهای تعاملی تا 200K توکن |
Gemini 2.5 Pro (Batch ≤200K) | $0.625 | $5 | پردازش دستهای هزینه را کاهش میدهد |
Gemini 2.5 Pro (>200K) | $2.50 | $15 | برای پرامپتهای طولانی بیش از 200K توکن |
Gemini 2.5 Flash‑Lite | $0.10 | $0.40 | بهینهترین LLM گوگل از نظر هزینه تا به امروز |
تقدیر بالا از سوی آزمایشکنندگان اولیه سازمانی
چندین شرکت برجسته قبلاً GPT-5 را در آزمایشهای اولیه خود به کار گرفتهاند. JetBrains از آن برای تقویت ابزارهای توسعهدهنده هوشمند خود استفاده میکند و Notion GPT-5 را برای بهبود تولید اسناد و جریانهای کاری بهرهوری یکپارچه کرده است. این استقبال گسترده نشاندهنده ارزش عملی و پتانسیل تحولآفرین GPT-5 در محیطهای سازمانی است.
در استارتاپ ابزار توسعهدهنده هوش مصنوعی Cursor، مایکل تروئل، همبنیانگذار و مدیرعامل، در اظهار نظری که توسط OpenAI در اختیار خبرنگاران قرار گرفت، گفت: “تیم ما GPT-5 را فوقالعاده هوشمند، آسان برای هدایت و حتی دارای شخصیتی یافته است که در هیچ مدل دیگری ندیدهایم. این مدل نه تنها باگهای پنهان و پیچیده را پیدا میکند، بلکه میتواند عوامل پسزمینه طولانی و چند مرحلهای را نیز اجرا کند تا وظایف پیچیده را به پایان برساند – انواع مشکلاتی که قبلاً مدلهای دیگر را با مشکل مواجه میکردند. این مدل به ابزار روزمره ما برای هر کاری از تعیین دامنه و برنامهریزی PRها تا تکمیل ساختهای end-to-end تبدیل شده است.”
مشتریان دیگر نیز به دستاوردهای بزرگی اشاره کردهاند: GitLab کاهش حجم فراخوانی ابزار را گزارش میدهد، GitHub بهبودهایی در استدلال در پایگاههای کد بزرگ را مشاهده کرده است و Uber در حال آزمایش GPT-5 برای کاربردهای خدماتی زمان واقعی و آگاه از دامنه است. در Amgen، این مدل قبلاً کیفیت خروجی را بهبود بخشیده و ابهام را در وظایف علمی کاهش داده است. این گزارشها تأییدی بر توانایی GPT-5 در ارائه ارزش واقعی و ملموس در صنایع مختلف است.
بهروزرسانیهای بیشتری در راه است
عرضه GPT-5 همزمان با چندین ویژگی جدید است که اکنون و به زودی به ChatGPT اضافه خواهند شد. کاربران اکنون میتوانند رابط کاربری را با رنگهای چت (با گزینههای اختصاصی برای کاربران پولی) شخصیسازی کنند و با شخصیتهای از پیش تعیین شده مانند Cynic، Robot، Listener و Nerd که برای تطبیق با سبکهای ارتباطی مختلف طراحی شدهاند، آزمایش کنند. این قابلیتهای شخصیسازی، تجربه کاربری را دلپذیرتر و انعطافپذیرتر میسازد.
ChatGPT همچنین به زودی از یکپارچهسازی بینقص با Gmail، Google Calendar و Google Contacts پشتیبانی خواهد کرد. پس از فعالسازی، این سرویسها به طور خودکار در طول چتها ارجاع داده میشوند، بدون نیاز به تغییر دستی. این اتصالات ابتدا برای مشترکین Pro در هفته آینده عرضه میشوند و سپس به طور گستردهتری در دسترس قرار خواهند گرفت. این یکپارچهسازیها، کارایی و کاربردی بودن ChatGPT را برای وظایف روزمره به شدت افزایش خواهد داد.
یک حالت صدای پیشرفته جدید (Advanced Voice) دستورالعملها را بهتر درک میکند و به کاربران امکان میدهد لحن و شیوه ارائه را تنظیم کنند. حالت صدا در تمام سطوح کاربری در دسترس خواهد بود و در GPTهای سفارشی نیز گنجانده میشود. در 30 روز آینده، OpenAI “حالت صدای استاندارد” (Standard Voice Mode) قدیمی را بازنشسته کرده و به طور کامل به این تجربه یکپارچه تغییر خواهد داد. این پیشرفتها، تعامل صوتی با ChatGPT را به سطحی جدید از طبیعی بودن و کارایی میرساند.
با طراحی ایمنتر، استدلال قویتر، ابزارهای توسعهدهنده گستردهتر و دسترسی وسیعتر کاربران، GPT-5 نشاندهنده یک اکوسیستم هوش مصنوعی در حال بلوغ است که گام به گام به کاربرد واقعی در مقیاس جهانی نزدیکتر میشود. رویکرد OpenAI این بار کمتر به زرق و برق و بیشتر به یکپارچهسازی اختصاص دارد. GPT-5 یک پیشنهاد جداگانه نیست که کاربران باید به دنبال آن باشند – بلکه به سادگی وجود دارد و ابزارهایی را که میلیونها نفر در حال حاضر استفاده میکنند، هوشمندتر و تواناتر میکند و طیف جدیدی از موارد استفاده را برای توسعهدهندگان باز مینماید.
منبع: VentureBeat – OpenAI از GPT-5، نانو، مینی و پرو رونمایی کرد