본문 바로가기
반응형

Develop/AI3

LLM 이해하기 - 딥러닝부터 LLM까지 서론 AI 이야기를 듣다 보면 비슷해 보이는 단어들이 많이 보인다. 딥러닝, LLM, 자연어 처리 등 이런 유사해 보이는 단어들을 정의하고, 내부 구현을 살펴보기보다는 기본적인 개념에 대해 정리해보려고 한다. 내용은 LLM을 활용한 실전 AI 애플리케이션 개발을 많이 참고하였다. 요즘 누구나 ChatGPT나 Gemini를 일상 속에서 쉽게 활용하고는 한다. ChatGPT와 Gemini는 LLM을 활용한 서비스인데, 대체 어떤 원리로 답변을 만들어내는 걸까? 굉장히 단순하다. 주어진 입력에서 다음에 올 적절한 단어를 확률적으로 선택하고, 문장이 끝날 때까지 이 '적절한 단어를 확률적으로 선택'하는 과정을 반복한다. 이런 식으로 다음에 올 단어를 예측하는 모델을 언어 모델이라 부르기도 하고, 사람과 비슷한 .. 2026. 1. 31.
RAG란? 지난번 LangChain이란? 포스팅에서 RAG를 아래와 같이 설명했다. 1. RAG= Retrieval Augmented Generation, 검색 증강 생성외부 데이터를 참조하여 LLM의 정확도와 신뢰성 향상에 도움을 주는 기술 그런데 왜 외부 데이터를 참조해야 하는 걸까? 그냥 LLM이 가진 정보만으로도 응답이 잘 만들어지지 않나? 의문을 가질 수 있다. 2. 왜 외부 데이터를 참조해야 할까? LLM은 학습된 데이터를 이용해 응답을 생성한다. 만약 내 구글 캘린더 등에 저장된 데이터를 기반으로 질문한다면 LLM은 잘못된 정보를 응답할 가능성이 크다. 이때 내 구글 캘린더의 정보를 LLM에게 전달할 수 있다면? LLM은 해당 정보를 기반으로 올바른 응답을 생성할 수 있다. RAG를 한국어로 직역하면.. 2025. 11. 4.
LangChain이란? AI 기본 용어 정리 LangChain을 훑어가기 앞서, 나는 LLM = LangChain = AI라고 생각할 정도로 AI에 대해 잘 몰랐다. 그래서 AI를 공부하겠답시고 LangChain 강의를 들었는데... 전혀 다른 개념이었다. 나 같은 사람이 생기기 전에 일단은 LLM, LangChain, RAG 등 'AI 얘기하다 보면 많이 이야기되는 AI 용어들'을 한번 짚고 넘어가 보겠다. AI= Artificial Intelligence, 인공지능계산 시스템이 학습, 추론, 문제 해결, 의사결정 등 인간의 지능과 연관된 작업을 수행할 수 있는 능력 LLM= Large Language Model, 대규모 언어 모델자연어 이해 및 생성에 특화된 모델로, 인공지능의 일종대규모 데이터를 스스로 학습하는 방식으로 .. 2025. 11. 3.
반응형