본문 바로가기

Transformer1

Large Language Models (LLMs) 이론 및 등장 배경 이번 포스팅에서는 대규모 언어 모델(Large Language Models, LLMs)의 바탕이 되는 트랜스포머 모델의 등장 배경과 LLM이 나올 수 있었던 이유에 대해서 알아보도록 하겠습니다.1. 기존 순환신경망 (Recurrent Neural Network)의 한계와 트랜스포머의 등장 LLM은 텍스트를 인식하고 생성하는 등의 작업을 수행할 수 있는 일종의 생성형 인공지능(Generative AI) 입니다. 기존의 AI 모델들과 달리 LLM은 방대한 양의 텍스트 데이터를 학습하여 뛰어난 언어 이해 및 생성 능력을 갖추게 되었습니다. 이러한 발전이 가능했던 핵심 요인은 바로 '트랜스포머(Transformer)' 아키텍처의 등장입니다. 트랜스포머 모델은 2017년 구글 연구팀이 발표한 "Attent.. 2025. 3. 14.

이전 1 다음

티스토리툴바