개발일기장

  • 홈
  • 태그
  • 방명록

인공지능/최적화 2

Quantization

연산을 효율적으로 하기 위해 float에서 연산하는 것이 아닌 integer 연산을 합니다. 대신 정확도는 줄어듭니다 $r = S(q-z)$ q: quantized fixed-point value (integer) r: real float-point value S: scale (float) Z: zero-point (bias) 어느 모델의 weight가 다음과 같은 분포를 하고 있다고 가정해봅시다 -2 -1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 그리고 3비트로 아래의 수를 나타내고 싶다고 가정해봅시다.(uint3) uint3의 범위는 0($ \alpha_q $)~7($ \beta_q $)입니다 위 weight의 범위는 -2($ \alpha $)~14($ \beta $)입니다 총 ..

인공지능/최적화 2024.04.03

Convolution in Detail

Direct Convolution for 루프로 직접 계산(MAC : Multiply Accumulation operation) 캐시 사용하지 못함, 병렬처리 못함 GEMM(General Matrix Multiply) IM2COL로 Input과 Weight를 matrix로 변형해서 계산 GPU 연산에 빠르다 FFT-based Convolution weight와 input을 FFT로 변환해서 pointwise multiplication 수행 IFFT로 원복 (자세한 내용은 다음에 다루겠습니다) 2-D convolution $(G*F)[i,j]=\sum_m \sum_n G[i+m,j+n]F[m,n]$ i+m,j+n가 범위를 벗어나면 무시한다. Fourier Transform 후 곱셈 계산을 위해 filter..

인공지능/최적화 2024.03.25
이전
1
다음
더보기
프로필사진

공부하는 금융IT 운영자입니다

  • 분류 전체보기 (96)
    • 개발업무 (19)
      • 인프라 (6)
      • 개발 (13)
    • 알고리즘 (15)
    • 프로젝트 (11)
    • 오라클(ORACLE) 강의 (5)
    • MIT 6.824: Distributed Syst.. (7)
    • 인공지능 (10)
      • 최적화개론 (0)
      • 최적화 (2)
      • 대학원수업 (1)
      • 기타 (9)
      • TVM (4)
      • Knowledge Distillation (5)
    • 쿠버네티스 (8)

Tag

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

Archives

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바