Ipol.idIpol.id
Aa
  • Home
  • News
  • Nasional
    • Jabodetabek
    • Jakarta Raya
    • Nusantara
  • Internasional
  • Politik
  • Hukum
  • Kriminal
  • Ekonomi
  • Olahraga
  • Otomotif
  • Si Ipol
  • Opini
  • More
    • Video
    • Gaya hidup
    • Sosok
    • Tekno/Science
    • Galeri
    • Indeks Berita
Reading: Yandex Rilis YaFSDP, Alat Pelatihan Pembelajaran Mesin Model LLM
Share
Ipol.idIpol.id
Aa
Cari berita disini...
  • Home
  • News
  • Nasional
    • Jabodetabek
    • Jakarta Raya
    • Nusantara
  • Internasional
  • Politik
  • Hukum
  • Kriminal
  • Ekonomi
  • Olahraga
  • Otomotif
  • Si Ipol
  • Opini
  • More
    • Video
    • Gaya hidup
    • Sosok
    • Tekno/Science
    • Galeri
    • Indeks Berita
Follow US
  • Redaksi
  • Pedoman Pemberitaan Media Siber
  • Standar Perlindungan Profesi Wartawan IPOL.ID
  • Privacy Policy
  • Disclaimer
Ipol.id > Tekno/Science > Yandex Rilis YaFSDP, Alat Pelatihan Pembelajaran Mesin Model LLM
Tekno/Science

Yandex Rilis YaFSDP, Alat Pelatihan Pembelajaran Mesin Model LLM

Iqbal
Iqbal Published 12 Jun 2024, 14:27
Share
7 Min Read
Selama pelatihan large language model (LLM), pengembang harus mengelola tiga sumber daya utama secara efisien, mencakup daya komputasi, memori prosesor, dan komunikasi prosesor. YaFSDP menghemat dua sumber daya yang pertama dan membantu mempercepat proses pelatihan LLM.
Selama pelatihan large language model (LLM), pengembang harus mengelola tiga sumber daya utama secara efisien, mencakup daya komputasi, memori prosesor, dan komunikasi prosesor. YaFSDP menghemat dua sumber daya yang pertama dan membantu mempercepat proses pelatihan LLM. Foto: Ist
SHARE
Daftar Isi:
Efisiensi Pelatihan YaFSDPUntuk Referensi

Efisiensi Pelatihan YaFSDP

YaFSDP merupakan metode FSDP yang disempurnakan sehingga mampu mengungguli pelatihan LLM pada tahapan pelatihan yang paling banyak menggunakan komunikasi seperti pra-pelatihan, penyelarasan, dan perbaikan. Ketika dipakai pada model LLM open source seperti Llama 2 dan Llama 3 dengan 70 miliar parameter (70B), YaFSDP menunjukkan peningkatan yang signifikan dalam hal kecepatan pelatihan sebesar 21% (untuk Llama 2 70B) dan 26% (untuk Llama 3 70B).

“YaFSDP telah menunjukkan hasil yang mengesankan pada model yang menangani 13 hingga 70 miliar parameter, dengan kinerja yang sangat kuat pada kisaran 30 hingga 70 miliar,” kata, Mikhail Khruschev. “Saat ini, kami melihat bahwa YaFSDP paling cocok untuk model open-source yang digunakan secara luas berdasarkan arsitektur LLaMA.”

YaFSDP bukanlah alat open-source pertama dari Yandex. Perusahaan ini sebelumnya telah membagikan beberapa alat lain yang telah menjadi populer di kalangan komunitas ML. Di antaranya:

  • CatBoost, sebuah perpustakaan berkinerja tinggi untuk meningkatkan gradien pada pohon keputusan atau decision trees.

    Baca Juga

    komdigi yandex
    Komdigi Gandeng Yandex Buka Pelatihan dan Kompetisi Machine Learning Gratis
    Kecerdasan Buatan (AI) Yandex Buat Resolusi dan Detail Gambar Lebih Tajam
    Yandex Mulai Uji Coba Fitur Baru di Telegram Channel, Benarkah Menarik?
  • YTsaurus, platform big data untuk distribusi penyimpanan dan pemrosesan.

  • AQLM, salah satu algoritma kuantisasi, atau pemetaan input dengan nilai set besar ke dalam output dengan kelompok set lebih kecil, tercanggih untuk kompresi ekstrim model bahasa besar, yang dikembangkan bersama oleh Yandex Research, HSE University, IST Austria, dan NeuralMagic.

  • Petals, perpustakaan yang dirancang untuk menyederhanakan proses pelatihan dan penyempurnaan LLM, yang dikembangkan melalui kolaborasi antara Yandex Research dengan HSE University, University of Washington, Hugging Face, ENS Paris-Saclay, dan Yandex School of Data Analysis.

Untuk Referensi

Selama pelatihan large language model (LLM), pengembang harus mengelola tiga sumber daya utama secara efisien, mencakup daya komputasi, memori prosesor, dan komunikasi prosesor. YaFSDP menghemat dua sumber daya yang pertama dan membantu mempercepat proses pelatihan LLM.

Pelatihan LLM bergantung pada banyak GPU yang diorganisasikan ke dalam cluster – susunan prosesor grafis yang saling terhubung, dimana sejumlah perhitungan besar bisa dilakukan untuk melatih model dengan miliaran parameter. Mendistribusikan perhitungan di antara prosesor dalam sebuah cluster membutuhkan komunikasi yang konstan, yang sering menjadi “hambatan”, sehingga memperlambat proses pelatihan dan mengakibatkan penggunaan daya komputasi yang tidak efisien.

Untuk mengatasi hambatan ini, pengembang Yandex menciptakan YaFSDP, sebuah metode yang meningkatkan komunikasi GPU dan mengoptimalkan kecepatan dan kinerja pembelajaran. Ketika dikombinasikan dengan solusi peningkatan kinerja Yandex lainnya, metode ini mempercepat proses pelatihan hingga 45%

YaFSDP bekerja dengan menghilangkan inefisiensi komunikasi GPU, yang mengarah pada penggunaan jaringan yang dioptimalkan dan mengurangi beban memori. Hal ini memastikan bahwa pelatihan hanya membutuhkan memori prosesor yang diperlukan dan membuat interaksi GPU tidak terganggu, sehingga memudahkan pengoptimalan lebih lanjut seperti meminimalkan waktu komunikasi prosesor. Hal ini menghasilkan peningkatan yang signifikan dalam kinerja dan efisiensi memori.

Metode YaFSDP dapat digunakan secara efektif untuk model AI generatif teks berbasis transformator dengan banyak lapisan (multilayer perceptron) seperti LLaMA. Dalam skenario pra-pelatihan yang melibatkan model dengan 70 miliar parameter, menggunakan YaFSDP dapat menghemat sumber daya sekitar 150 GPU.

Jika dibandingkan dengan FSDP, kecepatan akhir yang ditunjukkan oleh YaFSDP pada Llama 2 dan Llama 3 menunjukkan peningkatan yang signifikan dalam efisiensi pelatihan. (ahmad)

Previous Page1234
GN

Follow Akun Google News Ipol.id

Jangan sampai kamu ketinggalan update berita menarik dari kami
TAGGED: LLM, machine learning, Yandex, Yandex YaFSDP
Share this Article
Facebook Twitter Whatsapp Whatsapp LinkedIn Telegram Copy Link
Previous Article Sekjen Kemnaker Anwar Sanusi saat mendampingi Menteri Ketenagakerjaan melakukan pertemuan dengan Duta Besar Luar Biasa dan Berkuasa Penuh RI untuk Kerajaan Belanda, Mayerfas di Den Haag, Belanda, awal pekan ini. Foto: Kemnaker Indonesia Perkuat Perlindungan Pekerja Migran di Belanda
Next Article Pekerja HSSE Pertamina menjaga proses pembangunan Refinery Development Masterplan (RDMP) Kilang Pertamina, RDMP menjadi salah satu program dengan serapan TKDN. Foto: Dok Pertamina Tahun 2023 Pertamina Gunakan Tingkat Komponen Dalam Negeri hingga Rp 374 Triliun

TERPOPULER

TERPOPULER
IMG 20260524 WA0088
HeadlineNews

Ramalan Zodiak Pekan Ini 24–31 Mei 2026: Ada Kabar Mengejutkan soal Cinta dan Rezeki

Olahraga
Hydroplus Soccer League Surabaya 2026: Tigers Football Academy dan Arema FC Women Berbagi Gelar di Dua Kategori Umur
24 May 2026, 08:43
HeadlineOlahraga
Meski kalah di Markas Valencia, Barca Tetap Juara La Liga
24 May 2026, 07:25
Olahraga
5000 Pelari Ramaikan Starbucks Run 2026 di GBK
24 May 2026, 12:08
News
RSC-WSC Gelar Temu Kangen: Edukasi Lawan Love Scam
24 May 2026, 13:15
Ipol.idIpol.id
Follow US

IPOL.ID telah diverifikasi oleh Dewan Pers
Sertifikat Nomor 1084/DP-Verifikasi/K/IV/2023
https://dewanpers.or.id/data/perusahaanpers

Copyright © IPOL.ID. All Rights Reserved.

  • Redaksi
  • Pedoman Pemberitaan Media Siber
  • Standar Perlindungan Profesi Wartawan IPOL.ID
  • Privacy Policy
  • Disclaimer
Logo Ipol.id Logo Ipol.id
Welcome Back!

Sign in to your account

Lost your password?