본문 바로가기
책과 독서/독후감, 서평

LLM 엔지니어의 필독서 'LLM 엔지니어링'

by 공학코드 2025. 6. 29.

공지사항

  1. 제가 운영하는 네이버 카페 개발자 커뮤니티 코어큐브(https://cafe.naver.com/ewsncube)에 가입하시면 컴퓨터 관련 학습 자료와 질의응답을 제공받으실 수 있습니다.

  2. 모빌리티 AI 개발자 교육 과정(국비무료)을 안내드립니다.
    [에스트래픽/코스닥상장사/중견기업] 스마트 모빌리티 DX Academy (8월 12일 마감) https://www.mbccomputer.co.kr/front/education/course/1571

728x90
반응형
한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다. 

책을 읽게된 배경

연구 목적으로 LLM을 활요해 특정 업무를 자동화하는 프로그램을 만드는 중인데 마침 한빛미디어에서 관련 책을 제공해주어서 읽게 되었다.

책 표지

책의 개요

'LLM 엔지니어링'은 한빛미디어에서 2025년 5월 2일 출간된 실무 중심의 LLM 애플리케이션 엔지니어링 안내서이다. 이 책은 데이터 수집부터 모델 파인튜닝, 평가, 추론 최적화, 배포, 운영 자동화(LLMOps)까지 LLM 전 생애 주기를 체계적으로 설명하고 있다. 웹스크래핑과 몽고DB, Qdrant 기반 데이터 저장 및 검색부터 시작해 ‘LLM Twin’이라는 개인화 AI 캐릭터를 구현하면서, 실전에 가까운 구성을 따라가며 학습할 수 있다.

저자 소개

저자는 폴 이우수틴(Paul Iusztin)과 막심 라본(Maxim Rabon)이다. 폴 이우수틴은 7년 이상 생성형 AI, 컴퓨터 비전, MLOps 솔루션을 개발한 시니어 ML/MLOps 엔지니어로, 최근에는 Metaphysic에서 대규모 신경망을 프로덕션 환경에 적용하는 핵심 역할을 수행하였다. 또한 ML 시스템 교육 채널 ‘Decoding ML’을 창립하며 기술 전파에도 힘쓰고 있다. 막심 라본은 파리 폴리테크닉(MINES Paris)에서 박사 학위를 받은 후 Liquid AI의 모델 최적화 총괄 책임자로 활동 중이며, 구글 AI/ML 분야 개발자로도 근무한 경력을 가지고 있다. 그는 오픈소스 커뮤니티에 다양한 툴과 모델(LLM AutoEval, NeuralDaredevil 등)을 기여해 왔으며, 기술 블로그도 활발히 운영하고 있다. 역자로는 조우철 씨가 참여했다. 포스코이앤씨 AI 연구원으로 일하며 LLM 기반 입찰·계약 문서 검토 솔루션을 개발한 실무자이다. 번역은 전문성과 현장 경험을 기반으로 정확하면서도 읽기 쉽게 진행되었다.

대상 독자

이 책은 다음과 같은 독자에게 적합하다.

  • LLM 개발자를 목표로 하거나 이미 챗GPT 등 API 활용 경험은 있으나 직접 서비스를 구축하고 싶은 개발자
  • RAG, LoRA·QLoRA 등 최신 파인튜닝 기법에 대한 이해와 실습을 원하는 AI 엔지니어
  • LLMOps 기반으로 서비스를 안정적으로 배포하고 운영하고자 하는 ML 시스템 엔지니어
  • 팀장이나 기술 리더 입장에서 데이터 설계, 파이프라인 구축, 배포 전략 등 LLM 전 과정을 체계적으로 익히고자 하는 경우

LLM 개발의 기본 개념뿐만 아니라 설계부터 운영까지 전체 흐름을 깊이 있게 익히고자 하는 독자들에게 특히 적합하다.

추천 독자

이 책을 추천하고 싶은 주요 독자는 아래와 같다.

  • 실전 중심의 개발자: 단순히 API를 호출하는 수준을 넘어, RAG 구축, 파인튜닝, 모델 최적화, 마이크로서비스 형태로의 배포까지 직접 구현하고 싶은 분
  • AI 엔지니어 / MLOps 실무자: LLMOps를 구축하고 이를 통해 지속적으로 운영성과를 개선하고자 하는 분
  • 기술 리더 / 팀장: LLM 기반 프로젝트를 기획 또는 책임지고 있으며, 전체 아키텍처를 설계하고 관리해야 하는 실무 관리자
  • 학생 및 연구자: 산업 현장에 적용 가능한 LLM 설계와 구현 과정을 깊이 배우고 싶은 이들
  • 스타트업 CTO: 아이디어를 빠르게 프로덕션화해야 하는 스타트업의 기술 리더

책의 특징

이 책의 특징은 아래와 같다.

  • ‘LLM Twin’ 실전 프로젝트 중심 구성
    개인화된 AI 캐릭터 LLM Twin 프로젝트를 통해 아이디어 단계에서 배포까지 모든 과정을 실제 구현해보는 형태로 구성되어 있어 학습 몰입도가 높다.
  • 전 과정 실습 중심
    웹 스크래핑 → DB 저장 → RAG 파이프라인 → 파인튜닝 → 정렬 최적화 → 추론 최적화 → FastAPI 배포 및 오토스케일링 → LLMOps 구축 등 프로덕션 수준의 워크플로를 따라가며 실무 능력을 키울 수 있다.
  • 최신 파인튜닝 및 최적화 기법 수록
    LoRA, QLoRA 기법은 물론 DPO(Direct Preference Optimization), 양자화·병렬 처리 기반 추론 최적화 등 실전에서 바로 사용할 수 있는 기술을 다루고 있다.
  • 배포 및 운영 단계 강조
    FastAPI 기반 마이크로서비스 서버 구현, 클라우드 오토스케일링 배포 전략, 버전 관리·모니터링을 포함한 LLMOps 전략 등 운영 관점의 실무 상세 내용이 담겨 있다.
  • 종합적 접근
    데이터 엔지니어링, 모델 개발, 시스템 구축, 서비스 운영에 이르는 전 과정을 하나의 책으로 종합적으로 다룬다. 따라서 ‘LLM 완전 실전 가이드’라 해도 과언이 아니다.

'LLM 엔지니어링'은 LLM을 활용하는 수준을 넘어 직접 설계하고 구축하며 운영한다는 목적을 가진 독자들에게 이상적인 책이다. 즉, 이론적 학습과 단순 실습을 넘어 생산 환경에 투입 가능한 수준의 LLM 서비스를 구현하는 데 필요한 모든 내용을 체계적으로 다룬다. AI 스타트업 개발자, 인하우스 AI 팀, MLOps 엔지니어, 기술 리더 모두에게 실전형 가이드를 제공한다. 기술의 폭과 깊이를 모두 충족하는 한 권의 책으로 강력히 추천한다.

 

 

728x90
반응형

댓글