단어 간 관계 일반적으로 특정 단어 사이의 관계를 확인하기 위해 사용하는 방법으로 word-word matrix + Cosine Similarity가 있다. ...is very complicated. Therefore, natural language is analyzed through several steps... 예를 들어 ±4 window를 사용한다면 특정 단어의 좌우 4 단어의 출현 빈도를 활용하는 것이다. 아래 matrix는 문서 전체에서 ±4 window로 단어 빈도를 카운트한 예시값이다. language science education culture 5 0 2 country 6 8 5 the 25 38 7 만약 culture와 country 간의 유사도를 알고 싶다면 아래와 같이 cosine ..
Batch 학습을 위해 사용할 데이터가 너무 많을 때 한 번에 학습시키는데 비용이 많이 들기 때문에 여러 개의 그룹으로 나누어 학습한다. 이때 나누어진 그룹을 Batch라고 한다. Batch Normaliztion Batch Normalization은 layer를 통과할 때마다 데이터 분포가 달라지는 Internal Covariate Shift를 해결할 수 있다. 따라서 정규화를 통해 안정적으로 학습될 수 있도록 한다. 정규화 스케일링 정규화란 데이터의 분포를 N(0, 1)로 조정하는 과정이다. 다시 말해 평균을 0, 분산을 1로 조정하는 과정이다. 아래 그래프에서 초록색 그래프가 정규화된 그래프이다. batch마다 분포가 다르기 때문에 정규화를 통해 일정하게 학습이 되도록 한다. 그렇기 때문에 정규화는..
dlib 모델 불러오기 # Conda 설치 > conda install -c conda-forge dlib # PIP 설치 > pip install dlib dlib의 get_frontal_face_detector는 HOG(Histogram of Oriented Gradient) + SVM을 활용해 사람의 얼굴을 인식한다. import dlib detector = dlib.get_frontal_face_detector() faces = detector(이미지) 위와 같이 함수를 이용해 detector객체를 가져오고 사람 얼굴이 포함된 이미지를 입력하면 관련 정보를 반환한다. 얼굴 인식 import cv2 import dlib detector = dlib.get_frontal_face_detector() ..