Yandex Rilis YaFSDP, Alat Pelatihan Pembelajaran Mesin Model LLM

Selama pelatihan large language model (LLM), pengembang harus mengelola tiga sumber daya utama secara efisien, mencakup daya komputasi, memori prosesor, dan komunikasi prosesor. YaFSDP menghemat dua sumber daya yang pertama dan membantu mempercepat proses pelatihan LLM. Foto: Ist

Manfaat YaFSDP

Pelatihan LLM merupakan proses yang memakan waktu dan menggunakan sumber daya besar sekaligus intensif. Engineer atau insinyur yang mendalami pembelajaran mesin dan perusahaan yang mengembangkan sendiri LLM-nya perlu investasi besar untuk waktu dan sumber daya GPU dalam melatih model pembelajaran mesinnya. Tentu ini akan memakan biaya yang tidak sedikit. Semakin besar modelnya, semakin besar pula waktu dan biaya yang dibutuhkan untuk pelatihannya.

YaFSDP Yandex bekerja dengan menghilangkan inefisiensi komunikasi GPU, memastikan bahwa pelatihan hanya membutuhkan memori prosesor yang diperlukan dan membuat interaksi GPU tidak terganggu.

YaFSDP mengoptimalkan kecepatan dan kinerja pembelajaran, memungkinkan pengembang AI di seluruh dunia untuk menggunakan lebih sedikit daya komputasi dan sumber daya GPU saat melatih model mereka. Misalnya, dalam skenario pra-pelatihan yang melibatkan model dengan 70 miliar parameter, YaFSDP mampu menghemat biaya penggunaan sumber daya sekitar 150 GPU antara $0,5 hingga $1,5 juta (tergantung pada penyedia atau platform GPU virtual yang digunakan) per bulannya.