گوگل کلود: تراشه Ironwood و ماشین‌های مجازی Axion برای عصر جدید هوش مصنوعی

گوگل کلود با معرفی تراشه Ironwood و ماشین‌های Axion سرعت و کارایی زیرساخت هوش مصنوعی را در مقیاس بزرگ افزایش می‌دهد.

به گزارش تجارت نیوز، در تازه‌ترین اطلاع‌رسانی گوگل کلود (Google Cloud)، از در دسترس قرار گرفتن رسمی نسل هفتم TPU، با نام Ironwood TPU  و نیز مجموعه جدیدی از ماشین‌های مجازی مبتنی بر معماری Arm، با نام Axion CPU، رونمایی شد. این محصولات با وعده ارتقای قابل توجه در عملکرد، کارایی انرژی، و کاهش هزینه‌ها، قرار است زیرساخت‌‌های هوش مصنوعی مقیاس بزرگ را متحول کنند.

Ironwood، «قدرت خام» برای آموزش و استفاده از مدل‌ها

Ironwood به‌طور خاص برای بارهای کاری سنگین طراحی شده است؛ از آموزش مدل‌های عظیم تا یادگیری تقویتی پیچیده و نیز سرو مدل‌های هوش مصنوعی با تاخیر بسیار کم.

گوگل اعلام کرده که این TPU در مقایسه با TPU v5p ده برابر عملکرد پیک دارد، و نسبت به TPU v6e (با نام «Trillium») بیش از چهار برابر عملکرد بهتر در هر چیپ برای آموزش و استنتاج فراهم می‌کند.

یکی از ویژگی‌های برجسته Ironwood توانمندی آن در تشکیل «سوپرپاد» است: اتصال هزاران چیپ به هم با شبکه‌ای فوق‌پیشرفته (Inter-Chip Interconnect) با پهنای باند بسیار بالا، که اجازه می‌دهد تا ۹٬۲۱۶ چیپ در یک پاد واحد به‌صورت هماهنگ کار کنند.

در مقیاس کامل، این سیستم قادر است قدرت محاسباتی بی‌سابقه‌ای را ارائه دهد؛ مناسب برای مدل‌هایی با میلیاردها پارامتر و کارهای استنتاج (inference) بسیار سنگین. پاسخ اولیه بازار به Ironwood بسیار مثبت بوده است؛ به‌عنوان مثال شرکت Anthropic قصد دارد بر اساس این زیرساخت، تا میلیون‌ها TPU را برای ارائه مدل‎های خود در مقیاس گسترده استفاده کند.

همچنین شرکت‌های فعال در حوزه‌های تولید تصویر و ویدیو یا مدل‌های چندرسانه‌ای می‌گویند Ironwood می‌تواند تولید محتوای با کیفیت‌تر و با فریم‌ریت و دقت بالاتر را ممکن کند.

Axion، کامپیوتر عمومی با بهره‌وری و صرفه اقتصادی

در کنار شتاب‌دهنده تخصصی TPU، گوگل کلود مجموعه جدیدی از ماشین‌های مجازی مبتنی بر Axion را نیز معرفی کرده است. این CPU های سفارشی بر پایه معماری Arm طراحی شده‌اند تا برای کارهای عمومی‌تر، مانند سرویس‌های وب، پایگاه داده، پردازش دسته‌ای، آماده‌سازی داده، مورد استفاده قرار گیرند. از جمله گزینه‌های فعلی می‌توان به ماشین مجازی N4A (در حالت پیش‌نمایش) اشاره کرد که نسبت قیمت به کارایی آن تا دو برابر بهتر از ماشین‌های مبتنی بر x86 نسل فعلی است.

در آینده نیز نسخه bare-metal با نام C4A metal در دسترس قرار می‌گیرد؛ این نمونه برای محیط‌هایی با نیازهای خاص مانند توسعه نرم‌افزار نیتیو ARM، شبیه‌سازی، یا بارهای کاری حساس به پیکربندی سخت‌افزاری مناسب است.

سه گزینه اصلی در پورتفولیوی Axion شامل N4A، C4A، و C4A metal هستند؛ این تنوع به کاربران کمک می‌کند بدون صرف هزینه‌های زیاد یا قربانی کردن عملکرد، زیرساخت خود را با توجه به نیاز دقیق انتخاب کنند.

به طور مشخص، Axion به‌عنوان ستون فقرات عملیاتی برای بارهای کاری روزمره، مانند آماده‌سازی داده، میزبانی سرویس‌ها، پردازش داده‌های انبوه عمل می‌کند؛ در حالی که Ironwood مسئولیت سنگین آموزش یا ارائه مدل‌های هوش مصنوعی را بر عهده دارد.

رویکرد سطح سیستمی: هم‌طراحی سخت‌افزار و نرم‌افزار

گوگل کلود تاکید کرده که Ironwood و Axion تنها سخت‌افزار نیستند، بلکه بخشی از سیستمی گسترده به‌نام AI Hypercomputer هستند؛ سیستمی که محاسبات، شبکه، ذخیره‌سازی و نرم‌افزار را با هم هماهنگ می‌کند تا کارایی، مقیاس‌پذیری و بهره‌وری انرژی را به نهایت برساند.

در لایه نرم‌افزاری، امکاناتی مانند ادغام با Google Kubernetes Engine برای زمانبندی هوشمند و مدیریت خوشه‌ها، پشتیبانی از چارچوب‌های متن‌باز برای مدل‌های زبان بزرگ مثل MaxText، و نیز تسهیل اجرای استنتاج با استفاده از ترکیب GPU و TPU یا به‌طور مستقل در vLLM و استفاده از GKE Inference Gateway برای توزیع بار، دیده می‌شود.

این هم‌طراحی سخت‌افزار-نرم‌افزار باعث می‌شود مشتریان بتوانند از مزایای Ironwood به عنوان یک شتاب‌دهنده بسیار قدرتمند بهره ببرند، بدون اینکه پیچیدگی‌های فنی توسعه یا نگهداری زیرساخت به آنها تحمیل شود.

چشم‌انداز: تحول در زیرساخت‌های هوش مصنوعی

با عرضه Ironwood و Axion، Google Cloud خود را برای عصر جدیدی آماده کرده است؛ عصری که در آن نه فقط آموزش مدل‌های عظیم، بلکه ارائه سریع، پاسخگو و مقرون به صرفه آن‌ها به کاربران در مقیاس بزرگ اهمیت دارد. ترکیب این دو نوع زیرساخت، شتاب‌دهنده تخصصی و محاسبات عمومی کم‌هزینه، انعطاف و توان عملیاتی گسترده برای شرکت‌ها و توسعه‌دهندگان فراهم می‌آورد. این تغییر می‌تواند تاثیر زیادی بر صنعت هوش مصنوعی بگذارد: شرکت‌ها می‌توانند با هزینه کمتر، مقیاس بزرگ‌تری را پوشش دهند؛ مدل‌های پیچیده‌تر و کاربردی‌تر تولید کنند؛ و در نهایت، تجربه کاربری بهتری برای سرویس‌ها و محصولات مبتنی بر هوش مصنوعی فراهم آورند.

منبع

Author: admin

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *