لابراتوار ماشین‌های هوشمند، API آموزشی تینکر را به بهره‌برداری عمومی رسانده و سه قابلیت عمده از جمله مدل استدلالی کیمی K2، نمونه‌برداری سازگار با OpenAI و ورودی تصویری مدل‌های زبانی Qwen3-VL را افزوده است. برای مهندسان هوش مصنوعی، تینکر راهی عملی برای بهینه‌سازی مدل‌های پیشرفته بدون نیاز به ساخت زیرساخت آموزشی توزیع‌شده است.

تینکر چه می‌کند؟

تینکر یک API آموزشی است که بهینه‌سازی مدل‌های زبانی بزرگ را بدون نیاز به مدیریت سنگین آموزش توزیع‌شده فراهم می‌کند. شما یک حلقه ساده پایتون می‌نویسید که بر روی یک ماشین با CPU اجرا می‌شود. تینکر حلقه را روی یک کلاستر GPU مپ می‌کند و محاسبات دقیق شما را اجرا می‌کند.

API مجموعه محدودی از ابزارها را مثل forward_backward برای محاسبه گرادیان‌ها و sample برای تولید خروجی‌ها در اختیار قرار می‌دهد. این روش برای کسانی مناسب است که می‌خواهند از آموزش تحت نظارت یا تقویت استفاده کنند، اما نمی‌خواهند با مسائل پیچیده مدیریت GPU روبرو شوند.

تغییرات جدید و کیمی K2

تغییر عمده در به‌روزرسانی دسامبر ۲۰۲۵ این است که تینکر اکنون بدون لیست انتظار در دسترس است. کاربران می‌توانند به راحتی ثبت‌نام کنند، مدل‌ها و قیمت‌ها را مشاهده کنند و نمونه‌های آماده را اجرا کنند.

اکنون کاربران می‌توانند moonshotai/Kimi-K2-Thinking را بر روی تینکر بهینه‌سازی کنند. کیمی K2 با حدود یک تریلیون پارامتر، به‌عنوان بزرگ‌ترین مدل در کاتالوگ تینکر ظاهر می‌شود.

نمونه‌برداری سازگار با OpenAI

تینکر یک مسیر موازی جدید اضافه می‌کند که از واسط OpenAI استفاده می‌کند. یک چک‌پوینت مدل در تینکر می‌تواند به‌صورت URI مراجعه شود و از طریق مشتریان OpenAI برای نمونه‌برداری استفاده شود.

ورودی تصویری با Qwen3-VL

قابلیت دوم اصلی، ورودی تصویری است. تینکر اکنون مدل‌های زبانی Qwen3-VL را ارائه می‌دهد که امکان آموزش و نمونه‌برداری از طریق همان سطح API فراهم می‌کند.

برای ارسال یک تصویر به مدل، ModelInput را طوری می‌سازید که شامل ImageChunk و تکه‌های متنی باشد. این روش از ورود چندگانه در API پشتیبانی می‌کند.

رقابت Qwen3-VL با DINOv2 در طبقه‌بندی تصاویر

تیم تینکر مدل Qwen3-VL-235B-A22B-Instruct را به‌عنوان یک طبقه‌بند تصویر بهینه‌سازی کرد. از چهار دیتاست استاندارد استفاده شد:

  • Caltech 101
  • Stanford Cars
  • Oxford Flowers
  • Oxford Pets

مدل زبان Qwen3-VL با ورودی تصویری، طبقه‌بندی را به‌صورت تولید متن انجام می‌دهد. آن‌ها DINOv2 را به‌عنوان خط‌مبنای خود تنظیم کردند. هر دو مدل Qwen3-VL-235B و DINOv2 با استفاده از آداپتورهای LoRA در تینکر آموزش داده شدند. هدف کارآیی داده‌ها بود.

نکات کلیدی

  1. تینکر اکنون برای همه در دسترس است و کاربران می‌توانند مدل‌های زبانی با وزن باز را بهینه‌سازی کنند.
  2. پلتفرم از مدل استدلالی کیمی K2 با ۱ تریلیون پارامتر پشتیبانی می‌کند.
  3. تینکر یک واسط استنتاج سازگار با OpenAI را ارائه می‌دهد که به شما اجازه می‌دهد از چک‌پوینت‌ها نمونه‌برداری کنید.
  4. ورودی تصویری با مدل‌های Qwen3-VL امکان ایجاد خطوط آموزش چندگانه را فراهم می‌کند.
  5. Qwen3-VL 235B در تینکر، عملکرد بهتری در طبقه‌بندی تصاویر نسبت به خط‌بنای DINOv2 دارد.