인공지능/기타 9

Multimodal Unsupervised Image-to-Image Translation

Introductionmultimodal : 단일 모델로 여러가지 도메인(colorization, inpainting, attribute transfer, and style transfer)에 활용 가능 Method각 도메인에 속한 이미지는 이미지의 content와 style로 분리 가능하다(고 가정합니다)예를들어 보겠습니다도메인 X1은 기안84 그림체입니다도메인 X2은 사진입니다아래 그림처럼 봉지은이라는 사람은 도메인에 따라 style(그림체/사진)이 달라 이미지는 다르지만 본질(content)는 동일합니다 이미지 출처 : https://www.mk.co.kr/news/broadcasting-service/7545663 style은 도메인마다 다르지만 content space는 도메인이 다르더라도 동일..

인공지능/기타 2024.12.15

Deep Image Prior

CNN의 구조적인 특성에 따라, 이미지 1장으로(학습없이) 노이즈 제거, 해상도 복원, 이미지 인페인팅이 가능하다 What is prior사람이 왼쪽 이미지에서 오른쪽 이미지로 복원을 한다고 가정해보자사람은 귀가 어디에 있는지, 코가 어떻게 생겼는지 등의 정보를 이용해 오른쪽 이미지로 복원한다이러한 정보를 prior라고 한다일반적으로 딥러닝에서 super resolution을 할때 여러 이미지로부터 prior를 학습해 해상도 복원을한다본 논문에서는 Explicit prior는 필요없으며, CNN 구조 자체가 prior라고 한다즉, 학습 자체가 필요없다. 네트워크 구조와 손상된 이미지만으로 원 이미지 복원이 가능하다 Method${\begin{align*}x^* &= \arg\max_x p(x \mid \..

인공지능/기타 2024.12.14

Backpropagation for a Linear Layer

벡터 미분이 항상 생각이 안나서 정리합니다 Chain rule스칼라 f, 벡터 x,y가 주어져있습니다$\frac{\partial f}{\partial \textbf{x}} = \left[ \frac{\partial f}{\partial x_1} \;\; \frac{\partial f}{\partial x_2}  \right]$      $\frac{\partial f}{\partial \textbf{y}} = \left[ \frac{\partial f}{\partial y_1} \;\; \frac{\partial f}{\partial y_2} \;\; \frac{\partial f}{\partial y_3}  \right]$      ${\frac{\partial \textbf{y}}{\partial \..

인공지능/기타 2024.10.31

라그랑주 승수법 (Lagrange multipliers)

이 글을 보는 모든 분들은 라그랑주 승수법 개념은 알고 계실것 같습니다 고등학교 다닐 때 이런 문제를 많이 보셨을 것 같습니다(모의고사나 수능문제 있는지 찾아봤는데 못찾겠네요) $y = −x+1$ 위에 있는 점들 중 $f(x,y)=x^2+y$의 최소값을 찾아라 풀이$x^2+y=k$로 두고 그래프를 그립니다이차함수 그래프는 (0,k)를 지납니다k가 최소가 되려면 두 그래프가 접해야 합니다 라그랑주 승수법제약식 g(x,y)=k 이 주어졌을 때 (k는 임의의 상수) f(x,y)의 최대 또는 최소를 만족하는 점은 f와 g가 접하는 점에 있다이를 식으로 나타내면, 서로 gradient vector가 같아야 한다는 의미이다$\nabla f = \lambda \nabla g$ 제약식이 여러개 일때 라그랑주 승수법함수..

인공지능/기타 2024.08.05

Transformer: Attention is All you need

미뤘던 transformer 아키텍처입니다저는 최대한 원 논문 위주로 이해하려고 노력하는데 transformer는 논문만 보고 이해하는 것은 거의 불가능합니다영상 및 다른 자료들을 여러개 보는 것을 추천합니다 Overview 1. 단어들을 한번에 전달합니다 - 단어가 한번에 1개씩 들어가는 RNN과 달리 모든 단어들을 한번에 전달받고, Positional Encoding으로 단어의 순서를 표시합니다2. Encoder : query / key / value를 이용하여 문맥 정보를 이해하는 단계입니다 - Input끼리의 단어들간의 관계를 학습합니다3. Decoder : 이전 예측을 입력으로 받아 다음 단어를 예측합니다 - 이 과정에서 Encoder의 key와 value를 전달받아 Input의 전반적인 문맥을..

인공지능/기타 2024.07.27

[강화학습 요약] Policy Gradient

Policy-Based RL - No explicit value function - 최적의 Policy를 바로 구함 특징 - state-action value function을 parameterization이 쉽지 않을 때 쓰기 좋다 - 차원이 많거나 continuous action space 일 때 쓰기 좋다 - stochastic policy를 배울 수 있다 - local optima에 도달하는 경우가 많다 - variance가 크다 Policy Gradient $\tau = (s_0,a_0,r_0,...,s_{T-1},a_{T-1},r_{T-1},s_T)$ $R(\tau) = \sum_{t=0}^{T} R(s_t,a_t)$ (Monte-Carlo return) $V(\theta) = \sum_\ta..

인공지능/기타 2023.10.15

[강화학습 요약] SARSA / VFA / DQN

On policy : 현재 policy의 data만 사용 Off policy : 다른 policy의 data도 사용 Exploration : environment를 배우기 위해 다양한 action 취함 Exploitation : 이전의 policy로 best action취 $\epsilon$-greedy Policies Policy가 deterministic 할 때는 무조건 특정 action만 진행 가능. 하지만 다른 action도 취해야 policy와 다른 Q function도 계산이 가능하므로 $\epsilon$ 의 확률은 랜덤한 action을 따르고 1-$\epsilon$의 확률로 policy를 따른다. 이러한 policy를 $\epsilon$-greedy Policy라고 한다 $\epsilon$을..

인공지능/기타 2023.09.11

[강화학습 요약] Policy Iteration / MC / TD learning

Markov 참고로 Markov는 수학자 이름임 Markov Process 미래의 process는 현재의 상태에만 의존함 i.e. 동전 던지기로 앞/뒷면이 나오는 process에서 앞면이 직전에 10번 연속으로 나온 것과 상관없이 앞면/뒷면의 확률은 각각 50% Markov Chain : Sequence of states and their transition Markov State System에서 정의가능한 상태 i.e. S1 : 비가 온다 / S2 : 화창하다 / S3 : 흐리다 Policy 각각의 State에서 어떤 action을 취할 것 인지 Value function agent가 상태 s에서 policy를 따랐을 때 총 보상을 얼만큼 가질 수 있을 지 (미래의 보상도 포함) $V(s) = E[\s..

인공지능/기타 2023.08.27

Pytorch : 'RuntimeError: CUDA out of memory.'

파이토치 GPU 메모리 부족시 해결 방안 1. 메모리 제거 torch.cuda.empty_cache() GPU에서 사용하지 않는 cached memory를 제거 2. eval 단계에서 gradient 계산안하게 설정 with torch.no_grad(): eval 단계에서는 back propagation을 수행하지 않기 때문에 gradient 계산을 하지 않아도 된다 torch.no_grad()로 설정 가능하다 KoBERT NSMC finetuning 에서도 아래와 같이 test accuracy 계산 시 적용 가능하다 https://github.com/SKTBrain/KoBERT/blob/master/scripts/NSMC/naver_review_classifications_pytorch_kobert.i..

인공지능/기타 2022.11.10