DL basic 5

RNN

Sequential Model sequential data의 특성 상, 언제 그 데이터가 끝날지모른다. 몇개의 데이터가 들어올지에 상관없이 동작해야한다. 이것이 어려운 점으로 작용한다. 과거의 정보들을 고려해야하는 점이 첫 번째 어려움. Autoregressive model : 고려할 과거 정보를 특정 개수로 정해둠 Markov model (first-order autoregressice model) : 가정하기에, 내 현재는 과거에만 의존하며, 이 때 과거는 바로 전에 국한. 근데 이게 말이 안됨. 내일의 수능 공부는 전날 공부에만 의존한다 라는 뜻이기 때문. 많은 정보를 손실하게 됨. Latent autoregressive model : 히든 스테이트가 과거의 정보를 요약해 담고 있고, 이것에 의존해..

Study/Basics 2021.12.29

Optimization

용어 정리 Generalization Fitting Cross-validation train, validation, test data의 비중을 어떻게 해야하나? — cross validation (kfold validation) : train data 와 validation data를 k개로 나눠서 k-1개로 학습시키고 나머지 한개로 test hyper parameter를 지정하는 clue가 없으므로 최적의 학습법 찾아야함 Bias and Variance (둘 다 low인 게 좋음) Variance가 큰 모델은 비슷한 input이 들어와도 output이 다른것 (overfitting 될 확률 높음) Bias가 큰 모델은 분산이 작더라도 평균적으로 봤을 때 표적값에서 벗어난 것 Bootstrapping -..

Study/Basics 2021.12.29

Neural Network & Multi-Layer Perceptron

Neural Networks 애매하게 사람의 뇌를 모방? 함수를 모방하는 approximator Linear Neural networks “어떻게 w와 b를 찾을까?” - backpropagation과 gradient descent/ascent update stepsize를 자동으로 바꿔주는 optimizing이 필요 - adapted learning rate 차원이 다를 때 matrix 사용 두 개의 벡터 스페이스 간의 변환 : 선형성을 가지는 변환이 있을 때, 그 변환은 항상 행렬로 표현된다. 딥러닝은 결국 neural network를 deep하게 쌓겠다는 뜻. Nonlinear function Universal approximators Hidden layer가 하나 있는 Neural network ..

Study/Basics 2021.12.29

Deep learning Preview

What make you a good deep learner? Implementation Skills Math Skills (Linear Algebra, Probability) Knowing a lot of resent papers definition 인공지능의 정의 인간을 모방 (artificial Inteligence) 그 방법이 데이터를 통한 것임 (Machine learning) 학습하는 구조가 Neural networks임 (Deep learning) Key Components of deep learning 1. Data (강아지, 고양이 사진) 어떤 문제를 풀 것인가에 따라 다름 — Classification (강아지 고양이 분류) — semantic segmentation (이미지의 픽셀이 ..

Study/Basics 2021.12.29