일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 자율성장 인공지능
- 딥러닝학습
- 데이터축소
- 로지스틱 최대우도
- 2차원동전뒤집기
- 비트마스킹
- 프로그래머스광고삽입
- MLE
- 딥러닝 가중치 갱신
- 카카오 메뉴리뉴얼
- 과적합방지
- 확률과우도
- 프로그래머스
- 스타수열
- 인공지능 경진대회
- 프로그래머스 2차원동전뒤집기 파이썬
- 프로그래머스 2차원동전뒤집기
- 스타수열 파이썬
- AI경량화
- 머신러닝 학습 검증
- 광고삽입 파이썬
- 딥러닝
- 딥러닝파라미터
- 메뉴리뉴얼 파이썬
- 프로그래머스 누적합
- k겹 교차검증
- 카카오 코테 메뉴리뉴얼
- 프로그래머스 스타수열
- 인공신경망 학습
- 모델경량화
- Today
- Total
목록전체 글 (46)
머신러닝 개발자의 러닝머신

목차 1. 단일 객체, 다중 속성 분류는 왜 필요할까 2. 모델 적용기 2-1. 데이터셋 구성 2-2. Mulit-Task Learning 모델링 3. 데이터 중심적 개발 3-1. 데이터 불균형 해소, Augmentation 3-2. Outlier 제거 4. Semi-Supervised Learning 준지도학습 5. 결과 및 회고 1. 단일 객체, 다중 속성 분류는 왜 필요할까 프로젝트 개요 이번 포스트는 작년 여름에 진행했던 2022 ETRI 자율성장 인공지능 리더보드 챌린지에 참가하며 진행했던 프로젝트입니다. 해당 대회는 4개의 하위 sub-task로 이루어져있고 첫 번째와, 두 번째 Task 부문에 참가하여 패션이미지의 다중 속성 분류 모델 개발을 주제로 프로젝트를 진행했습니다. 단일객체-다중 속..

0. 모델 성능 평가를 수행하는 이유 모델 성능 평가는 모델을 학습하고 최적의 모델을 만들어가는 과정에서 필수적입니다. 올바른 성능 평가가 이루어져야 모델의 완성도를 측정하고 학습 데이터에 과적합되지 않은 최적의 모델을 판단할 수 있습니다. 모델을 만드는 이유는 주어진 데이터를 학습하여 알려지지 않은 데이터/상황에 대한 예측을 수행하기 위함입니다. 따라서 이를 위해 다양한 알고리즘으로 모델을 학습하고 현재 데이터에서 최적의 성능을 보이는 모델을 찾아갑니다. 이렇게 학습 데이터에서 최적의 성능을 보이는 모델을 찾았다면, 이 모델이 실제로 알려지지 않은 새로운 데이터에 대해서도 예측을 잘 수행하는지를 평가해서 해당 모델을 최종적으로 선택할 지를 결정합니다. 이를 위해 데이터, 태스크의 목적에 따라 다양한 평..

안녕하세요 😄 오늘은 교차검증과 가장 많이 사용되는 k-fold 기법에 대해서 알아보겠습니다. 데이터의 편향을 고려해 이를 방지하고 검증의 신뢰를 높이기 위한 방법인데요, 자세한 원리와 구조에 대해 알아보겠습니다.~ 교차검증이란? 교차검증이란 데이터를 반복해서 여러 모델을 학습하여 모델의 성능을 평가하는 방법입니다. 조금 더 쉽게 말하자면 모델의 파라미터를 수정하는 과정에서 validation 데이터를 이용해 모델의 성능을 평가하게 되는데, test set을 제외한 전체 데이터에서 validation과 train 데이터를 달리 하면서 학습과 평가를 진행하여 모델의 성능을 평가하는 방법입니다. K-fold Cross Validation은 이러한 교차검증 방법론 중에 하나로, 가장 많이 사용하는 기법입니다...

/ 안녕하세요-🤓 오늘은 "회귀"의 개념과 선형 회귀, 로지스틱 회귀에 대해서 알아보겠습니다. 분류 문제에 주로 사용되는 로지스틱 회귀가 왜 연속 변수의 값을 예측하는 회귀의 문제인지 헷갈리는 일이 많이 많습니다. 그래서 회귀란 무엇인지, 선형회귀, 로지스틱 회귀의 비교, 로지스틱 회귀의 파라미터 추정과 결과 해석까지 알아보겠습니다. / 회귀(Regression)란? 회귀란 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법입니다. 즉, 독립변수와 종속변수 간의 상관관계를 모델링하여 알려진 데이터를 이용해 미래의 사건을 예측하는 방법입니다. 선형 회귀 (Linear Regression) 선형 회귀는 주어진 데이터 집합 X에 대해 종속변수 Y 사이의 관계를 선형식으..

안녕하세요🤓 오늘은 데이터 밀도 추정 방법으로 많이 사용되는 최대우도법에 대해서 알아보겠습니다.🔎 우도(likelihood, 가능도)란? 최대 우도법은 말 그대로 우도를 최대화하는 지점을 찾는 것을 의미합니다. 이를 이해하기 위해 우도의 개념에 대해 먼저 알아보겠습니다. 우도 (likelihood, 가능도)는 주어진 관측값(데이터)이 특정 확률분포에서 나왔을 가능성을 의미합니다. 즉, 우도는 데이터가 특정 확률모델과 잘 맞는 정도를 말합니다. 우도는 주어진 데이터에 대한 특정 확률 밀도의 값들을 모두 곱한 값으로 정의합니다. 최대 우도법 (Maximum Likelihood Estimation, MLE) 최대 우도법은 앞에서 언급한 것처럼, 주어진 데이터를 가장 잘 설명하는 확률 분포를 찾는 과정으로, 데..

안녕하세요🤓 오늘은 데이터 분석과 머신러닝에서 자주 등장하는 개념인 주성분 분석, PCA에 대해 알아보겠습니다. 주성분 분석(Principal Componet Analysis)이란? 주성분 분석에 대해 이해하려면 주성분이 무엇인지 알아야겠죠? 주성분이란 어떤 방향의 벡터가 가진 방향으로 데이터를 사영시켰을 때, 사영된 데이터들의 분산이 최대화되는 방향벡터를 의미합니다. 이때, 분산은 데이터가 퍼진 정도를 표현하는 통계량으로 분산이 크면 데이터가 평균을 중심으로 흩어져 그 분포를 분석하기에 용이합니다. 반대로, 분산이 작으면 데이터가 평균을 중심으로 밀접해있어 데이터의 중첩이 일어나 데이터의 개개 특징을 파악하기 비교적 어렵습니다. 아래 그림처럼 특정 벡터에 내적한 데이터들(빨간 점)이 왼쪽보다 오른쪽에서..

인공신경망의 학습: 순전파와 역전파 딥러닝의 학습은 크게 순전파와 역전파 두 단계로 진행된다. 1) 순전파(Feedforward) 순전파(feedforward)는 네트웨크에 훈련 데이터가 들어와 입력츨-은닉층-출력층을 거쳐 예측값을 계산하기 위해 신경망의 연산이 수행되는 과정이다. 즉, 각 뉴런(노드)이 이전 층의 뉴런에서 수신한 정보에 가중합 및 활성화 함수를 적용해 다음 층의 뉴런으로 값을 전달하는 과정이다. 모든 층의 연산을 거쳐 최종 출력단에서 출력값이 도출된다. 2) 오차 추정 그 다음, 이렇게 순전파 과정을 거쳐 나온 네트워크의 출력을 정답값과 비교해 손실(오차)를 추청한다. 이때, 앞서 포스팅 한 다양한 손실 함수를 적용할 수 있다. -> 손실함수 포스팅 https://eunsun-devel..

손실 함수(Loss Function) 란? 손실 함수는 학습을 통해 얻은 데이터의 추정치가 실제 데이터와 얼마나 차이가 나는지를 말하는 지표로, 학습률(learning rate)과 손실 함수의 순간 기울기를 이용해 오차를 최소화 하는 방향으로 인공신경망의 가중치를 업데이트 한다. [경사 하강법] 손실 함수의 값이 클수록 정답과 출력 데이터와의 오차가 크다는 것을 의미하고, 반대로 이 값이 '0'에 가까울수록 완벽하게 추정할 수 있다는 의미이다. 대표적인 손실 함수로는 평균제곱오차(Mean Squared Error, MSE)와 크로스 엔트로피 오차(Cross Entropy Error, CEE)가 있다. 1. 평균 제곱 오차(Mean Squared Error, MSE) 평균 제곱 오차는 가장 많이 쓰이는 손..