pullwall
Well done! 코딩
pullwall
전체 방문자
오늘
어제
  • 분류 전체보기 (151)
    • 개발환경 (2)
    • java study (21)
    • 백준 단계별 (51)
    • 알고리즘 (3)
    • AI (43)
    • 클라우드 (3)
      • Kubernetes in Google (3)
    • 논문 (5)
    • 리눅스 (1)
    • AWS (4)
    • 수학 (15)
    • 기타 (1)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 백준 단계별
  • 알고리즘
  • Google
  • 단계별
  • 수학
  • Ai
  • Java
  • LLM
  • AWS
  • 선택정렬
  • 정렬
  • 논문리뷰
  • dataset
  • 정렬알고리즘
  • 자바
  • 백준
  • 쿠버네티스
  • Kubernetes
  • pytorch
  • 자바독학

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
pullwall
AI

seq2seq (시퀀스 to 시퀀스)

seq2seq (시퀀스 to 시퀀스)
AI

seq2seq (시퀀스 to 시퀀스)

2024. 9. 12. 22:03
728x90
해당 게시물은 "혁펜하임의 AI DEEP DIVE"를 수강하고 작성되었습니다.

https://ok-lab.tistory.com/180

 

seq2seq 의 구조는 위 그림과 같다.

 

각 셀은 LSTM이나 GRU를 주로 사용한다. (장기 의존성 문제를 최대한 해결하고자.. 하지만 100% 해결하지는 못함.)

 

또한 encoder의 마지막 context vector를 decoder의 처음 context vector으로 사용한다.

 

위 그림에서 볼 수 있듯 학습 시에는 정답을 decoder의 입력에 넣는다. (teacher forcing이라고 부른다.)

 

테스트 시에는 sos토큰이 decoder에 들어가서 나오는 출력인 y0y0을 그 다음 입력으로 사용하고 y0y0으로부터 나오는 출력인 y1y1을 그 다음 입력으로 사용하고.. 하는 형태이다. 이를 eos토큰이 나올 때까지 반복한다.

 

 

seq2seq도 RNN과 마찬가지로 문제점이 있다.

  1. 장기 의존성 문제를 겪는다. (encoder ,decoder 구조상 그럴 수 밖에 없다.)
  2. context vector에 마지막 단어의 정보가 가장 많이 담긴다.

 

728x90

'AI' 카테고리의 다른 글

[pytorch] 심층신경망 (Deep Neural Network) 예제 코드  (0) 2024.11.19
[pytorch] 선형 회귀 (Linear Regression) 예제 코드  (0) 2024.11.19
RNN (Recurrent Neural Network)  (0) 2024.09.12
VGGnet  (0) 2024.09.12
Padding, Stride, Pooling  (0) 2024.09.11
    'AI' 카테고리의 다른 글
    • [pytorch] 심층신경망 (Deep Neural Network) 예제 코드
    • [pytorch] 선형 회귀 (Linear Regression) 예제 코드
    • RNN (Recurrent Neural Network)
    • VGGnet
    pullwall
    pullwall
    Well done! 코딩pullwall 님의 블로그입니다.

    티스토리툴바

    단축키

    내 블로그

    내 블로그 - 관리자 홈 전환
    Q
    Q
    새 글 쓰기
    W
    W

    블로그 게시글

    글 수정 (권한 있는 경우)
    E
    E
    댓글 영역으로 이동
    C
    C

    모든 영역

    이 페이지의 URL 복사
    S
    S
    맨 위로 이동
    T
    T
    티스토리 홈 이동
    H
    H
    단축키 안내
    Shift + /
    ⇧ + /

    * 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.