AS IS -> TO BE

  • 홈
  • 태그
  • 방명록

Attention 1

8. print(model) 한 줄로 Transformer 구조 이해해보기 (feat. Llama-3.2-1B)

목차 1. print(model) 한 줄로 Transformer 구조 이해해 보기 (feat. Llama-3.2-1B)- 0) 전체 흐름 요약- 1) Embedding Layer- 2) Decoder Layers (총 16개)- 3) Final RMSNorm- 4) LM Head (출력층)- 5) 전체 흐름 재정리- 6) 느낀점 1. print(model) 한 줄로 Transformer 구조 이해해 보기 (feat. Llama-3.2-1B)Llama-3.2-1B 모델을 print(model) 했을 때 나오는 내부 레이어 구조를 출력해본 뒤,출력 결과물을 통해 Transformer 구조 속 요소를 하나하나 가볍게 뜯어볼 수 있었다. 이렇게 하나하나 뜯어본 요소들에 대해 적어본다. 0) 전체 흐름 요약 모..

AI 공부 2026.03.29
이전
1
다음
더보기
프로필사진

AS IS -> TO BE

서비스 사용자와 함께 하는 팀원들에게 모두 선한 영향력을 주는 기획자를 꿈꿉니다.

  • 분류 전체보기 (70)
    • 대학생! 핀테크 스타트업 PO가 되다 (22)
    • IT, 스타트업 쟁이의 대기업 취준일기 (13)
    • 바이브코딩 (2)
    • AI 공부 (8)
    • SOPT(IT 연합동아리)- Side projec.. (11)
    • 개발공부 (10)
    • 디자인공부 (2)
    • 기타 일기 (2)

Tag

서비스기획, 커리어, PO, ai, 취준, 실상, 소상공인, 스타트업, 면접왕이형, 옴스잡스, 자소서, 공채, 대기업, 대학생, PM, 핀테크, llm, GPT, 자기소개서, 진로,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/04   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30

방문자수Total

  • Today :
  • Yesterday :
LinkedIn Profile Surfit Portfolio

Copyright © AXZ Corp. All rights reserved.

  • 서핏 포트폴리오
  • 링크드인 프로필

티스토리툴바