AMD가 첫 번째 소형 언어 모델(Small Language Model, SLM)을 출시했습니다. 이름은 AMD-135M으로, 빠른 추론 속도를 자랑하는 "추측 디코딩(Speculative Decoding)" 기술을 탑재했습니다. 이는 대형 언어 모델(Large Language Model, LLM)의 한계를 보완하며, 특정 용도에 최적화된 성능을 제공합니다.
이 모델은 AMD Instinct™ MI250 가속기를 사용하여 6700억 개의 토큰으로 훈련되었습니다.
https://community.amd.com/t5/ai/amd-unveils-its-first-small-language-model-amd-135m/ba-p/711368
AMD Unveils Its First Small Language Model AMD-135M
In the ever-evolving landscape of artificial intelligence, large language models (LLMs) like GPT-4 and Llama have garnered significant attention for their impressive capabilities in natural language processing and generation. However, small language model
community.amd.com
AMD-Llama-135M-code 모델을 사용한 결과, 데이터센터용 MI250 가속기와 AI PC용 Ryzen AI 프로세서에서 추론 속도가 비약적으로 증가했습니다. 이 성능 개선 덕분에, 소형 모델(SLM)과 대형 모델(LLM) 모두 효율적인 AI 워크플로우를 제공합니다.
AMD는 이 모델을 오픈소스로 공개하여 AI 커뮤니티의 발전에 기여하고 있습니다. 개발자들은 이를 활용해 다양한 AI 모델을 개발할 수 있으며, 관련 코드와 데이터셋은 GitHub에서 확인할 수 있습니다.
AMD의 첫 SLM 모델인 AMD-135M은 AI 기술의 발전을 이끌고 있으며, 더 넓은 범위에서 활용될 것입니다.
AMD의 첫 소형 언어 모델(SLM)인 AMD-135M 출시는 AI 업계에서 중요한 의미를 가집니다. 대형 언어 모델(LLM)이 인공지능의 발전을 주도해온 상황에서, 소형 모델(SLM)은 더욱 특화된 용도와 효율적인 성능을 제공하며 새로운 방향을 제시하고 있습니다.
The Intelligence Age (인공지능의 시대) (1) | 2024.09.26 |
---|---|
메타, 첫 멀티모달모델 '라마 3.2' 출시..."오픈AI·앤트로픽과 경쟁" (3) | 2024.09.26 |
댓글 영역