آزمایشگاه ماشین‌های فکری API تمرینی تینکر را به نسخه عمومی انتقال داده و سه قابلیت مهم به آن افزوده است: مدل کیمی K2 برای استنتاج، نمونه‌گیری سازگار با OpenAI و ورودی تصویری از طریق مدل‌های زبان تصویری Qwen3-VL. این ویژگی‌ها تینکر را به ابزاری عملی برای مهندسان هوش مصنوعی تبدیل می‌کند تا بدون نیاز به زیرساخت‌های توزیع‌شده، مدل‌های مرزی را به‌روز کنند.

تینکر چه کاری انجام می‌دهد؟

تینکر یک API تمرینی است که بر روی تنظیم دقیق مدل‌های زبان بزرگ تمرکز دارد و کارهای سنگین مربوط به تمرین توزیع‌شده را پنهان می‌کند. شما می‌توانید با یک حلقه پایتون ساده که فقط بر روی یک ماشین CPU اجرا می‌شود، داده‌ها و محیط یادگیری را تعریف کنید و تینکر این حلقه را روی گروهی از GPUها نگاشت می‌کند و محاسبات مورد نظر را اجرا می‌کند.

نسخه عمومی و کیمی K2

به‌روزرسانی جدید، تینکر را از لیست انتظار خارج کرده و هر کسی می‌تواند ثبت‌نام کرده و از مدل‌های جاری و قیمت‌ها مطلع شود. کاربران می‌توانند مدل استنتاجی کیمی K2 را با حدود یک تریلیون پارامتر تنظیم دقیق کنند. این مدل بزرگترین مدل موجود در فهرست تینکر است.

نمونه‌گیری سازگار با OpenAI

تینکر از یک رابط نمونه‌گیری سازگار با OpenAI برخوردار است که به کاربران اجازه می‌دهد از Checkpointهای در حال تمرین با استفاده از URI مدل‌های tinker://… نمونه‌برداری کنند.

ورودی تصویری با Qwen3-VL

تینکر اکنون دو مدل زبان تصویری Qwen3-VL را ارائه می‌دهد که به توسعه‌دهندگان امکان می‌دهد تا ورودی‌های چند حالتی ایجاد کنند که ترکیب ImageChunk و متن را با استفاده از همان API مبتنی بر LoRA فراهم کنند.

Qwen3-VL در مقابل DINOv2 در طبقه‌بندی تصاویر

تینکر مدل Qwen3-VL را به عنوان یک طبقه‌بند تصویر بر روی چهار مجموعه داده استاندارد تنظیم دقیق کرده و به کارایی بهتر آن نسبت به DINOv2 اشاره می‌کند و بر بهره‌وری داده‌های مدل‌های بزرگ زبان تصویری تأکید دارد.