بازگشت OpenAI به مدلهای متنباز
OpenAI سرانجام مدلهای زبان بزرگ با وزن باز (open-weight) خود را پس از سالها انتظار و پس از آخرین انتشار مدل GPT-2 در سال ۲۰۱۹، منتشر کرد. این مدلهای جدید که با نام “gpt-oss” شناخته میشوند، در دو اندازه مختلف در دسترس هستند و در چندین معیار، عملکردی مشابه با مدلهای o3-mini و o4-mini این شرکت از خود نشان میدهند. برخلاف مدلهای قبلی OpenAI که تنها از طریق رابط وب این شرکت قابل دسترسی بودند، این مدلهای باز جدید را میتوان آزادانه دانلود کرد، روی لپتاپها و سایر دستگاههای محلی اجرا کرد و حتی برای مقاصد خاص تغییر داد. این رویداد، نشاندهنده تغییر جهت قابل توجهی در استراتژی OpenAI است که برای مدت طولانی به دلیل مدلهای “بسته” خود با انتقاداتی مواجه بود.
در طول سالیان متمادی که OpenAI هیچ مدل زبان بزرگ متنبازی منتشر نکرده بود، برخی از کاربران با لقب تحقیرآمیز “ClosedAI” از این شرکت یاد میکردند. این حس سرخوردگی در چند ماه گذشته، زمانی که انتشار این مدلهای مدتها انتظار کشیده، دو بار به تعویق افتاد – ابتدا در ماه ژوئن و سپس در ماه ژوئیه – شدت گرفت. با این حال، با انتشار مدلهای “gpt-oss”، OpenAI دوباره خود را به عنوان یک بازیگر مهم برای کاربران مدلهای متنباز معرفی میکند و شکافی را که در اکوسیستم هوش مصنوعی احساس میشد، پر میکند. این اقدام میتواند نقطه عطفی در رویکرد این شرکت به اشتراکگذاری فناوری هوش مصنوعی با جامعه گستردهتر باشد.
چرا انتشار مدلهای متنباز اهمیت دارد؟
مدلهای با وزن باز، امکان شفافیت و قابلیت بازرسی بیسابقهای را فراهم میکنند که برای پیشرفت تحقیقات و تضمین ایمنی و اخلاق در هوش مصنوعی حیاتی است. توسعهدهندگان، پژوهشگران و حتی کسبوکارهای کوچک میتوانند این مدلها را دانلود کرده و برای نیازهای خاص خود سفارشیسازی کنند، بدون اینکه به سرورها یا APIهای اختصاصی وابسته باشند. این آزادی عمل، نوآوری را تشویق میکند و به کاربران امکان میدهد تا کنترل بیشتری بر دادهها و مدلهای خود داشته باشند. همچنین، این رویکرد به کاهش هزینههای عملیاتی برای شرکتهایی که نیاز به پردازش حجم زیادی از دادهها به صورت محلی دارند، کمک شایانی میکند.
علاوه بر این، انتشار مدلهای متنباز میتواند به دموکراتیزه شدن دسترسی به هوش مصنوعی پیشرفته کمک کند. شرکتهای کوچکتر و استارتاپها، که ممکن است منابع مالی لازم برای استفاده از مدلهای تجاری گرانقیمت را نداشته باشند، اکنون میتوانند از فناوریهای پیشرفته OpenAI بهرهمند شوند. این امر میتواند به ایجاد یک چشمانداز هوش مصنوعی متنوعتر و رقابتیتر منجر شود، جایی که نوآوری تنها در انحصار چند غول فناوری نیست. این قابلیت، به ویژه در مناطقی که دسترسی به زیرساختهای ابری محدود است، اهمیت بیشتری پیدا میکند.
رقابت در چشمانداز هوش مصنوعی
این اقدام OpenAI به ویژه در زمانی قابل توجه است که شرکت متا (Meta)، که پیش از این با مدلهای لاما (Llama) خود بر چشمانداز مدلهای متنباز آمریکایی تسلط داشت، ممکن است به سمت انتشار مدلهای بسته تغییر جهت دهد. در همین حال، مدلهای متنباز چینی مانند محصولات DeepSeek، Kimi K2 و سری Qwen علیبابا، در حال محبوبتر شدن از رقبای آمریکایی خود هستند. این تغییر دینامیک، فشار جدیدی را بر شرکتهای آمریکایی وارد میکند تا در زمینه مدلهای متنباز، رقابتیتر عمل کنند.
کیسی دوراک، مدیر برنامه تحقیقاتی در OpenAI، در یک جلسه توجیهی رسانهای در مورد انتشار این مدلها اظهار داشت: “اکثر قریب به اتفاق مشتریان [شرکتی و استارتاپی] ما در حال حاضر از مدلهای متنباز زیادی استفاده میکنند.” او افزود: “از آنجا که هیچ مدل متنباز [رقابتی] از OpenAI وجود نداشت، ما میخواستیم این شکاف را پر کنیم و به آنها اجازه دهیم تا از فناوری ما در سراسر جهان استفاده کنند.” این اظهارات نشان میدهد که OpenAI به تقاضای بازار برای مدلهای انعطافپذیرتر و قابل دسترستر پاسخ میدهد.
مزایای مدلهای متنباز برای سازمانها
مدلهای جدید OpenAI در دو اندازه عرضه میشوند که اندازه کوچکتر آن از لحاظ نظری میتواند روی ۱۶ گیگابایت رم اجرا شود – حداقل مقدار رمی که اپل در حال حاضر در رایانههای خود ارائه میدهد. مدل بزرگتر به یک لپتاپ رده بالا یا سختافزار تخصصی نیاز دارد. این تنوع در اندازه، به کاربران امکان میدهد تا مدل متناسب با نیازها و منابع سختافزاری خود را انتخاب کنند.
مدلهای متنباز، موارد استفاده کلیدی متعددی دارند. برخی سازمانها ممکن است بخواهند مدلها را برای اهداف خاص خود سفارشی کنند یا با اجرای مدلها روی تجهیزات خود، در هزینهها صرفهجویی کنند، هرچند که این تجهیزات هزینه اولیه قابل توجهی دارند. سایرین – مانند بیمارستانها، شرکتهای حقوقی و دولتها – ممکن است به دلایل امنیت دادهها به مدلهایی نیاز داشته باشند که بتوانند به صورت محلی اجرا شوند. این نیاز به کنترل و حریم خصوصی، یکی از محرکهای اصلی برای اتخاذ مدلهای متنباز است.
OpenAI با انتشار مدلهای متنباز خود تحت مجوز آزاد Apache 2.0، چنین فعالیتهایی را تسهیل کرده است. این مجوز به مدلها اجازه میدهد تا برای اهداف تجاری مورد استفاده قرار گیرند. ناتان لمبرت، رهبر تیم پس از آموزش در موسسه هوش مصنوعی آلن، این انتخاب را ستودنی میداند: چنین مجوزهایی برای انتشار مدلهای متنباز چینی معمول است، اما متا مدلهای لاما خود را تحت یک مجوز سفارشی و محدودتر منتشر کرده است. لمبرت میگوید: “این یک چیز بسیار خوب برای جامعه متنباز است.”
نقش مدلهای متنباز در تحقیقات و اکوسیستم هوش مصنوعی
محققانی که در مورد نحوه عملکرد مدلهای زبان بزرگ (LLM) تحقیق میکنند نیز به مدلهای متنباز نیاز دارند تا بتوانند این مدلها را با جزئیات بررسی و دستکاری کنند. پیتر هندرسون، استادیار دانشگاه پرینستون که به طور گسترده با مدلهای متنباز کار کرده است، میگوید: “بخشی از این موضوع، مربوط به تأیید مجدد سلطه OpenAI در اکوسیستم تحقیقاتی است.” هندرسون میافزاید: اگر محققان، مدلهای gpt-oss را به عنوان ابزارهای کاری جدید خود بپذیرند، OpenAI میتواند از مزایای ملموسی بهرهمند شود – ممکن است نوآوریهای کشف شده توسط سایر محققان را در اکوسیستم مدل خود ادغام کند. این همکاری متقابل بین جامعه متنباز و شرکتهای تجاری، میتواند به سرعت بخشیدن به پیشرفت هوش مصنوعی کمک کند.
به طور کلیتر، لمبرت میگوید، انتشار یک مدل متنباز در حال حاضر میتواند به OpenAI کمک کند تا موقعیت خود را در یک محیط هوش مصنوعی به طور فزایندهای شلوغ، دوباره تثبیت کند. او میگوید: “این به سالها پیش بازمیگردد، زمانی که آنها به عنوان شرکت هوش مصنوعی ‘اصلی’ شناخته میشدند.” کاربرانی که میخواهند از مدلهای متنباز استفاده کنند، اکنون گزینه خواهند داشت تا تمام نیازهای خود را با محصولات OpenAI برآورده کنند، به جای اینکه در صورت نیاز به اجرای محلی، به مدلهای لاما متا یا Qwen علیبابا روی آورند. این حرکت میتواند به OpenAI کمک کند تا وفاداری توسعهدهندگان را جلب کرده و جایگاه خود را در بازار تقویت کند.
پیامدهای ژئوپلیتیکی مدلهای هوش مصنوعی متنباز
افزایش مدلهای متنباز چینی مانند Qwen در طول سال گذشته، ممکن است عامل مهمی در محاسبات OpenAI بوده باشد. یک کارمند OpenAI در جلسه توجیهی رسانهای تاکید کرد که این شرکت این مدلهای متنباز را پاسخی به اقدامات هیچ شرکت هوش مصنوعی دیگری نمیبیند، اما OpenAI به وضوح به پیامدهای ژئوپلیتیکی سلطه مدلهای متنباز چین توجه دارد. این شرکت در یک پست وبلاگی که انتشار مدلها را اعلام کرد، نوشت: “دسترسی گسترده به این مدلهای توانمند با وزن باز که در ایالات متحده ایجاد شدهاند، به گسترش ریلهای دموکراتیک هوش مصنوعی کمک میکند.” این عبارت نشاندهنده آگاهی OpenAI از نقش هوش مصنوعی در قدرت نرم ملی است.
از زمانی که DeepSeek در اوایل سال ۲۰۲۵ وارد صحنه هوش مصنوعی شد، ناظران متوجه شدند که مدلهای چینی اغلب از صحبت در مورد موضوعاتی که حزب کمونیست چین آنها را ممنوع اعلام کرده است، مانند میدان تیانآنمن، خودداری میکنند. چنین مشاهداتی – و همچنین خطرات بلندمدت، مانند احتمال اینکه مدلهای عامل بتوانند به طور هدفمند کد آسیبپذیر بنویسند – برخی از کارشناسان هوش مصنوعی را نگران افزایش پذیرش مدلهای چینی کرده است. هندرسون میگوید: “مدلهای متنباز شکلی از قدرت نرم هستند.” این رقابت بر سر ارزشها و کنترل اطلاعات، به ابعاد جدیدی در حوزه هوش مصنوعی دست یافته است.
مزایای سیاسی برای OpenAI
لمبرت روز دوشنبه گزارشی (با عنوان Atom Project) منتشر کرد که در آن مستند شده است چگونه مدلهای چینی در حال پیشی گرفتن از مدلهای آمریکایی مانند لاما هستند و خواستار تعهد مجدد به مدلهای متنباز داخلی شده است. چندین محقق و کارآفرین برجسته هوش مصنوعی، مانند کلمنت دلانگ (مدیرعامل HuggingFace)، پرسی لیانگ از استنفورد، و مایلز برانداج (محقق سابق OpenAI)، این گزارش را امضا کردهاند. این نشاندهنده یک اجماع رو به رشد در میان جامعه هوش مصنوعی آمریکا در مورد اهمیت توسعه مدلهای متنباز بومی است.
دولت ترامپ نیز در برنامه اقدام هوش مصنوعی خود بر توسعه مدلهای متنباز تاکید کرده است. با انتشار این مدل و اظهارات قبلی، OpenAI خود را با این موضع همسو میکند. ریشی بوماسانی، محقق ارشد در موسسه استنفورد برای هوش مصنوعی انسانمحور میگوید: “در پروندههای خود در مورد برنامه اقدام، [OpenAI] به وضوح نشان داد که آنها مسئله ایالات متحده و چین را یک مسئله کلیدی میدانند و میخواهند خود را به عنوان عاملی بسیار مهم برای سیستم ایالات متحده معرفی کنند.”
و OpenAI ممکن است از همسویی با اولویتهای هوش مصنوعی دولت، مزایای سیاسی ملموسی کسب کند، لمبرت میگوید. همانطور که این شرکت به توسعه زیرساختهای محاسباتی گسترده خود ادامه میدهد، به حمایت سیاسی و تاییدیه نیاز خواهد داشت و یک رهبری همدل میتواند راهگشا باشد. این تعامل بین فناوری، سیاست و اقتصاد، نشاندهنده پیچیدگیهای روزافزون در دنیای هوش مصنوعی است.
منبع مقاله: MIT Technology Review