پس از سالها گمانهزنی و هایپ، شرکت OpenAI به طور رسمی از مجموعه جدیدی از مدلهای زبان بزرگ (LLMs) خود رونمایی کرد. این مجموعه شامل نسخههای مختلفی از GPT-5 است که پیشرو مدتها انتظار کشیده شده برای مدل GPT-4 این شرکت، که در مارس 2023 یعنی تقریباً 2.5 سال پیش عرضه شده بود، محسوب میشود. این اقدام نشاندهنده یک جهش قابل توجه در قابلیتهای هوش مصنوعی است که مرزهای جدیدی را برای کاربردهای عملی تعریف میکند.
OpenAI چهار نسخه متمایز از این مدل را با نامهای GPT-5، GPT-5 Mini، GPT-5 Nano و GPT-5 Pro عرضه کرده است. این نسخهها برای پاسخگویی به نیازهای متفاوت کاربران از نظر سرعت، هزینه و عمق محاسباتی بهینهسازی شدهاند. این استراتژی امکان استفاده از این مدلها را در طیف وسیعی از محیطها، از برنامههای کاربردی مصرفکننده تا محیطهای پیچیده سازمانی، فراهم میآورد.
مدل GPT-5، با طراحی ایمنتر، قابلیت استدلال قویتر، ابزارهای توسعهدهنده گستردهتر، و دسترسی وسیعتر برای کاربران، اکوسیستم هوش مصنوعی را در مرحله بلوغ نشان میدهد. این توسعهها نه تنها به افزایش کارایی سیستمهای هوش مصنوعی موجود کمک میکنند، بلکه راه را برای نسل جدیدی از کاربردهای هوش مصنوعی هموار میسازند که پیش از این قابل تصور نبودند.
معرفی خانواده GPT-5: پاسخی به نیازهای متنوع هوش مصنوعی
در قلب این عرضه جدید، GPT-5 قرار دارد که به عنوان مدل کامل استدلالمحور شناخته میشود و برای انجام وظایف عمومی با کیفیت بالا در ChatGPT و API شرکت OpenAI مورد استفاده قرار میگیرد. این مدل به گونهای طراحی شده است که بتواند پیچیدهترین پرسشها را پردازش کرده و پاسخهای دقیق و جامع ارائه دهد، که آن را به ابزاری قدرتمند برای کاربران و توسعهدهندگان تبدیل میکند.
GPT-5 Pro، نسخهای پیشرفتهتر با قابلیت استدلال گسترده و توان محاسباتی موازی است که به طور خاص برای محیطهای پیچیده سازمانی و پژوهشی طراحی شده است. این مدل پاسخهای دقیقتر و قابل اعتمادتری را ارائه میدهد، به ویژه در پرسشهای مبهم یا چند مرحلهای که نیاز به تجزیه و تحلیل عمیق دارند. این قابلیتها به سازمانها اجازه میدهد تا تصمیمگیریهای پیچیدهتر و مبتنی بر داده را با اطمینان بیشتری انجام دهند.
در مقابل، GPT-5 Mini، نسخهای کوچکتر و سریعتر از مدل اصلی است که برای کاهش تأخیر و مصرف منابع بهینهسازی شده است. این مدل به عنوان یک راه حل جایگزین در مواقعی که محدودیتهای استفاده وجود دارد یا زمانی که استدلال حداقلی کافی است، به کار میرود. GPT-5 Nano نیز سبکترین مدل در این خانواده است که برای سرعت و کارایی در برنامههای با حجم بالا یا حساس به هزینه ساخته شده است. این مدل، با وجود اندازه کوچکتر، قابلیت استدلال خود را حفظ کرده و برای استقرار در دستگاههای همراه، سیستمهای جاسازی شده یا برنامههای با محدودیت تأخیر، ایدهآل است.
نه هوش عمومی مصنوعی (AGI)، اما پیشرفتهای چشمگیر
نکته مهم در مورد عرضه GPT-5، نه آنچه که هست، بلکه آنچه که نیست: هوش عمومی مصنوعی (AGI). AGI هدف اعلام شده OpenAI، یعنی سیستمی مستقل از هوش مصنوعی که در بیشتر کارهای ارزشمند اقتصادی از انسانها پیشی میگیرد، محسوب میشود. صرف نظر از باور شخصی در مورد امکان یا مطلوبیت چنین سیستمی، اعلام AGI توسط OpenAI میتوانست تأثیرات تجاری مهمی داشته باشد، از جمله بندی در قرارداد این شرکت با مایکروسافت که به OpenAI اجازه میدهد در صورت دستیابی به AGI یا سود بیش از 100 میلیارد دلار، دسترسی مایکروسافت به مدلهای جدید را محدود کند.
با این حال، به گفته سم آلتمن، همبنیانگذار و مدیرعامل OpenAI، “به روشی که بیشتر ما AGI را تعریف میکنیم، هنوز چیزی بسیار مهم – در واقع، بسیاری چیزهای بسیار مهم – کم داریم، اما یک مورد بزرگ، مدلی است که به طور مداوم در حین استقرار یاد میگیرد، و GPT-5 چنین قابلیتی ندارد.” این نشان میدهد که OpenAI با وجود پیشرفتهای چشمگیر، هنوز AGI را به طور کامل محقق نشده نمیداند و بر روی توسعه قابلیتهای کلیدی مانند حافظه پایدار، استقلال و سازگاری در وظایف مختلف تمرکز دارد.
با این حال، نتایج بنچمارکهای به اشتراک گذاشته شده توسط OpenAI نشان میدهد که GPT-5 به آستانه عملکردی برابر یا حتی بهتر از میانگین عملکرد متخصصان انسانی در وظایف مختلف در حوزههای حقوق، لجستیک، فروش و مهندسی نزدیک شده است. OpenAI بیان میکند: “هنگام استفاده از استدلال، GPT-5 تقریباً در نیمی از موارد با متخصصان برابر یا بهتر عمل میکند، در حالی که از OpenAI o3 و ChatGPT Agent پیشی میگیرد.” این نتایج حاکی از پتانسیل عظیم GPT-5 برای تحول در صنایع مختلف است.

قابلیت «نرمافزار بر اساس تقاضا»: مرز جدید بهرهوری
با وجود مدلهای جایگزین فراوان از OpenAI و رقبای رو به رشد، از جمله استارتاپهای چینی که مدلهای متنباز قدرتمندی را ارائه میدهند، GPT-5 چه مزایایی دارد؟ آلتمن این جهش در قابلیت را فراتر از یک پیشرفت جزئی توصیف کرد. او تجربه استفاده از GPT-5 را به ارتقا از یک صفحه نمایش پیکسلی به یک صفحه نمایش رتینا تشبیه کرد – تجربهای که کاربران به سادگی نمیخواهند از آن بازگردند.
آلتمن گفت: “GPT-3 شبیه صحبت با یک دانشآموز دبیرستانی بود. GPT-4 شبیه یک دانشجوی دانشگاهی بود. GPT-5 برای اولین بار احساس صحبت با یک متخصص در سطح دکترا را در جیب شما ایجاد میکند.” این توصیف، انتظارات بالایی را برای قابلیتهای جدید GPT-5 ایجاد میکند، به ویژه در زمینه فهم عمیق و پاسخگویی تخصصی.
یکی از چشمگیرترین قابلیتهای نمایش داده شده برای خبرنگاران در طول تماس ویدیویی، توانایی تولید کد برای یک برنامه وب کاملاً کاربردی تنها با یک دستور متنی بود. به عنوان مثال، یک برنامه آموزش زبان فرانسه با بازی داخلی که در آن عبارات انگلیسی به فرانسوی هر بار که کاربر ماوس مجازی را برای جمعآوری برشهای پنیر هدایت میکرد، نمایش داده میشد، با شخصیتهای الهامگرفته از ایموجی، پسزمینه و منوهای تعاملی قابل کلیک. دستور ورودی نیز تنها یک پاراگراف بود که نشاندهنده قدرت خارقالعاده مدل در درک دستورات پیچیده و تبدیل آنها به خروجیهای عملی است.
به گفته آلتمن: “ایده نرمافزار بر اساس تقاضا بخش تعیینکنندهای از دوران جدید GPT-5 خواهد بود.” این قابلیت نه تنها برای توسعهدهندگان بلکه برای کاربران عادی نیز که میتوانند ایدههای خود را به سرعت به واقعیت تبدیل کنند، بسیار ارزشمند است. اگرچه این قابلیت اولیه – تبدیل دستور به نرمافزار کاربردی – پیش از این در مدلهای قبلی OpenAI مانند o3 و o4-mini، o4-high، و خدمات رقیب مانند Claude Artifacts از Anthropic نیز وجود داشته است، اما مزیت GPT-5 در سرعت و کامل بودن آن است. این مدل برنامه دمو را تنها در عرض چند دقیقه تولید کرد، با کمترین باگ و تجربهای کاملاً قابل بازی در یک “شات”، یعنی با یک دستور واحد بدون نیاز به مکالمه رفت و برگشت.
دسترسی گسترده و مدل قیمتگذاری
GPT-5 به مشترکین پریمیوم محدود نشده است. OpenAI این مدل را در تمام سطوح ChatGPT، از جمله برای کاربران رایگان، در دسترس قرار داده است – اقدامی عمدی و همسو با مأموریت شرکت برای اطمینان از مزایای گسترده هوش مصنوعی. کاربران سطح رایگان میتوانند به GPT-5 و GPT-5 Mini دسترسی داشته باشند، البته با محدودیتهای استفاده که هنوز به طور دقیق تعریف نشدهاند و احتمالاً بسته به تقاضا تغییر خواهند کرد.
مشترکین سطح ChatGPT Plus (20 دلار در ماه) سهمیه استفاده بالاتری دریافت میکنند، در حالی که مشترکین ChatGPT Pro (200 دلار در ماه)، Team (30 دلار در ماه یا 240 دلار سالانه) و Enterprise (قیمتگذاری متغیر بسته به اندازه شرکت و میزان استفاده) دسترسی نامحدود یا اولویتدار دارند. GPT-5 Pro نیز در روزهای آینده برای مشتریان Team، Enterprise و EDU در دسترس قرار خواهد گرفت.
تجربه یکپارچه جدید ChatGPT، نیاز به انتخاب دستی مدل را از بین میبرد. هنگامی که کاربران به محدودیتهای استفاده از GPT-5 میرسند، سیستم به طور خودکار به GPT-5 Mini تغییر میکند – یک جایگزین سبکتر اما همچنان بسیار توانا. این رویکرد به کاربران امکان میدهد تا بدون وقفه از خدمات هوش مصنوعی بهرهمند شوند و تجربه کاربری روانتری را ارائه میدهد.
بهبودهای بیسابقه در دقت و عملکرد
طبق گفته OpenAI، GPT-5 دقیقترین، پاسخگوترین و آگاهترین سیستم هوش مصنوعی به محتوا است که این شرکت تاکنون عرضه کرده است. این مدل خطاهای توهمی را کاهش میدهد، استدلال چند مرحلهای را با قابلیت اطمینان بیشتری مدیریت میکند و کد، محتوا و پاسخهای با کیفیتتری را در حوزههای مختلف تولید میکند. این پیشرفتها به کاربران امکان میدهد تا به نتایج دقیقتر و قابل اعتمادتر دست یابند، که برای کاربردهای حیاتی مانند برنامهنویسی و تجزیه و تحلیل دادهها ضروری است.
سیستم GPT-5 حدود 45% خطاهای واقعی کمتری نسبت به GPT-4o در ترافیک دنیای واقعی دارد و تا 80% کمتر در هنگام استفاده از حالت “تفکر” خود. این حالت، که کاربران میتوانند با صراحت از مدل بخواهند که زمان بیشتری را صرف کند، امکان پاسخهای پیچیدهتر و قویتر را فراهم میکند – که در برخی تنظیمات توسط GPT-5 Pro پشتیبانی میشود. در آزمایشها، GPT-5 Pro نمرات جدید و پیشرو را در بنچمارکهایی مانند GPQA (88.4%)، ریاضی AIME 2025 (100% هنگام استفاده از پایتون برای پاسخ به سؤالات) و HealthBench Hard (46.2%) به ثبت رسانده است.

پیشرفتهای عملکرد در بنچمارکهای کلیدی آکادمیک و دنیای واقعی به وضوح مشاهده میشود. در زمینه کدنویسی، GPT-5 نتایج جدید و پیشرو را در SWE-Bench Verified (74.9%) و Aider Polyglot (88%) به ثبت رسانده است. شاید باورنکردنیترین نکته این است که در Humanity’s Last Exam – یک بنچمارک جدید شامل 2,500 وظیفه فوقالعاده دشوار برای برنامهها – GPT-5 Pro به رکورد 42% دست یافته است، که رقبا و تمام مدلهای قبلی OpenAI به جز ChatGPT agent جدیدی که ماه گذشته رونمایی شد و کامپیوتر و مکاننما خود را مانند انسان کنترل میکند، را پشت سر گذاشته است.

در وظایف نوشتاری، GPT-5 با ظرافت بیشتری با لحن، زمینه و قصد کاربر سازگار میشود. این مدل در حفظ انسجام، سازماندهی واضح اطلاعات و تکمیل وظایف نوشتاری پیچیده بهتر عمل میکند. این بهبودها تنها فنی نیستند – تیم OpenAI تأکید کرد که GPT-5 در مکالمات طبیعیتر و انسانیتر احساس میشود. موارد استفاده مربوط به سلامت نیز بهبود یافتهاند. اگرچه OpenAI همچنان هشدار میدهد که ChatGPT جایگزینی برای متخصصان پزشکی نیست، اما GPT-5 در پرچمگذاری نگرانیها، کمک به کاربران در تفسیر نتایج پزشکی و راهنمایی آنها در آمادهسازی برای قرار ملاقاتها یا ارزیابی گزینهها فعالتر عمل میکند. سیستم همچنین پاسخها را بر اساس مکان کاربر، دانش پسزمینه و زمینه تنظیم میکند – که منجر به کمک ایمنتر و شخصیسازی شدهتر میشود. یکی از مهمترین بهروزرسانیها در تکمیلهای ایمن است، یک سیستم جدید که به GPT-5 کمک میکند از رد ناگهانی یا خروجیهای ناامن جلوگیری کند. به جای رد صریح پرسشها، GPT-5 تلاش میکند تا مفیدترین پاسخ را در محدودیتهای ایمنی خود ارائه دهد و توضیح میدهد که چه زمانی نمیتواند کمک کند – تغییری که به طور چشمگیری رد شدنهای غیرضروری را کاهش میدهد در حالی که قابلیت اعتماد را حفظ میکند.
ابزارهای جدید برای توسعهدهندگان و آینده ChatGPT
GPT-5 همچنین یک ارتقاء بزرگ برای توسعهدهندگانی است که بر روی سیستمهای عاملیتمحور و گردشکارهای با کمک ابزار کار میکنند. OpenAI مجموعهای از کنترلهای توسعهدهنده-پسند را در API GPT-5 معرفی کرده است، از جمله: «فراخوانی توابع آزاد» که اکنون ابزارها میتوانند رشتههای خام مانند پرسشهای SQL یا دستورات پوسته را بدون نیاز به ساختار JSON بپذیرند. «کنترل تلاش استدلال» که توسعهدهندگان میتوانند بین پاسخهای سریع و پردازش تحلیلی عمیقتر بسته به وظیفه جابهجا شوند. «کنترل وضوح» که یک پارامتر جدید به کاربران اجازه میدهد تا انتخاب کنند که پاسخها مختصر، استاندارد یا با جزئیات باشند. «خروجیهای ساختاریافته با محدودیتهای گرامری» که توسعهدهندگان اکنون میتوانند خروجیها را با استفاده از گرامرهای سفارشی یا عبارات منظم هدایت کنند و «مقدمههای فراخوانی ابزار» که GPT-5 اکنون میتواند قبل از استفاده از ابزارها یا درخواستهای خارجی، استدلال خود را توضیح دهد.
توسعهدهندگان میتوانند از طریق پلتفرم OpenAI به GPT-5 با قیمتهای زیر دسترسی داشته باشند:
مدل / سطح | هزینه ورودی (به ازای هر 1M توکن) | هزینه خروجی (به ازای هر 1M توکن) | یادداشتها |
---|---|---|---|
GPT‑5 | $1.25 (قبل از کش) | $10 | با حداکثر 90% تخفیف کش ورودی |
GPT‑5‑mini | $0.50 | $5 | — |
GPT‑5‑nano | $0.15 | $1.50 | — |
Claude Sonnet 4 | $3 | $15 | تا 90% تخفیف کش پیام |
Claude Opus 4 | $15 | $75 | مدل رده بالا برای وظایف پیچیده |
Gemini 2.5 Pro (≤200K) | $1.25 | $10 | پیامهای تعاملی تا 200K توکن |
Gemini 2.5 Pro (Batch ≤200K) | $0.625 | $5 | پردازش دستهای هزینه را کاهش میدهد |
Gemini 2.5 Pro (>200K) | $2.50 | $15 | برای پیامهای طولانی بیش از 200K توکن |
Gemini 2.5 Flash‑Lite | $0.10 | $0.40 | به صرفهترین LLM گوگل تا به امروز |
پنجره زمینه اکنون 256,000 توکن را پوشش میدهد (تقریباً به اندازه یک کتاب 600-800 صفحهای از متن) که به GPT-5 اجازه میدهد اسناد به طور قابل توجهی بزرگتر و مکالمات گستردهتر را نسبت به سلف خود، GPT-4 Turbo، مدیریت کند. برای کسانی که به ظرفیت بیشتری نیاز دارند، GPT-4.1 (که پنجره زمینه 1 میلیون توکنی را پشتیبانی میکند) همچنان در دسترس است. در مقایسه با رقبای اصلی – Anthropic و Google – مدلهای GPT-5 OpenAI از نظر قیمت از طریق API برابر یا ارزانتر هستند که فشار بیشتری بر روی کاهش هزینه هوش مصنوعی وارد میکند.
چندین شرکت برجسته قبلاً GPT-5 را در آزمایشهای اولیه به کار گرفتهاند. JetBrains از آن برای تقویت ابزارهای توسعهدهنده هوشمند استفاده میکند و Notion GPT-5 را برای بهبود تولید سند و گردشکارهای بهرهوری ادغام کرده است. در استارتاپ ابزار توسعهدهنده هوش مصنوعی Cursor، مایکل تروئل، همبنیانگذار و مدیرعامل، در نقل قولی که توسط OpenAI به خبرنگاران ارائه شد، گفت: “تیم ما GPT-5 را به طرز چشمگیری هوشمند، قابل هدایت و حتی دارای شخصیتی یافته است که در هیچ مدل دیگری ندیدهایم. این مدل نه تنها باگهای پنهان و دشوار را شناسایی میکند، بلکه میتواند عوامل پسزمینه طولانی و چند مرحلهای را نیز اجرا کند تا وظایف پیچیده را به پایان برساند – انواع مشکلاتی که قبلاً مدلهای دیگر را دچار مشکل میکردند. این مدل به ابزار روزمره ما برای همه چیز از برنامهریزی PR تا تکمیل ساختهای end-to-end تبدیل شده است.”
سایر مشتریان نیز دستاوردهای بزرگی را گزارش میکنند: GitLab کاهش حجم فراخوانی ابزار را ذکر میکند، GitHub بهبودهایی در استدلال در پایگاههای کد بزرگ را نشان میدهد، و Uber در حال آزمایش GPT-5 برای برنامههای خدماتی زمان واقعی و آگاه به دامنه است. در Amgen، این مدل قبلاً کیفیت خروجی را بهبود بخشیده و ابهام را در وظایف علمی کاهش داده است. با طراحی ایمنتر، استدلال قویتر، ابزارهای توسعهدهنده گستردهتر، و دسترسی وسیعتر برای کاربران، GPT-5 اکوسیستم هوش مصنوعی را در مرحله بلوغ نشان میدهد که گام به گام به کاربرد واقعی در مقیاس جهانی نزدیکتر میشود.
عرضه GPT-5 با چندین ویژگی جدید که اکنون و به زودی به ChatGPT اضافه میشوند، همزمان است. کاربران اکنون میتوانند رابط کاربری را با رنگهای چت (با گزینههای انحصاری برای کاربران پولی) شخصیسازی کنند و شخصیتهای از پیش تعیین شده مانند Cynic، Robot، Listener و Nerd را آزمایش کنند – که برای مطابقت با سبکهای ارتباطی مختلف طراحی شدهاند. ChatGPT همچنین به زودی از ادغام یکپارچه با Gmail، Google Calendar و Google Contacts پشتیبانی خواهد کرد. پس از فعالسازی، این خدمات به طور خودکار در طول چتها مورد ارجاع قرار خواهند گرفت، بدون نیاز به تغییر دستی. این اتصالات هفته آینده برای مشترکین Pro راهاندازی میشوند و در ادامه به طور گستردهتر در دسترس قرار خواهند گرفت.
یک حالت صدای پیشرفته جدید، دستورات را بهتر درک میکند و به کاربران امکان میدهد لحن و نحوه بیان را تنظیم کنند. صدا در تمام سطوح کاربری در دسترس خواهد بود و در GPTهای سفارشی نیز گنجانده خواهد شد. در 30 روز آینده، OpenAI “حالت صدای استاندارد” قدیمی را بازنشسته کرده و به طور کامل به این تجربه یکپارچه منتقل خواهد شد. رویکرد OpenAI این بار کمتر به دنبال زرق و برق و بیشتر به دنبال ادغام است. GPT-5 یک پیشنهاد جداگانه نیست که کاربران مجبور به جستجوی آن باشند – این مدل به سادگی وجود دارد و ابزارهایی را که میلیونها نفر قبلاً استفاده میکنند، هوشمندتر و تواناتر میکند و طیف کاملی از موارد استفاده جدید را برای توسعهدهندگان باز میکند.
منبع: VentureBeat