본문 바로가기

AI/Machine Learning3

CRPS: Continuous Ranked Probability Score, NMAE: Normalized Mean Absolute Error 개념 정리 확률적 예측에 대한 평가로 널리 사용되는 지표로 CRPS와 NMAE가 있다. 여기서 확률적 예측이란 다음과 같은 상황을 말한다.보통 예측이라고 하면,내일 서울의 최고 기온은 25도일 것이다.이것 숫자 하나를 예측하는 것이다. 이 때 실제 기온 27도 라면, 절대 오차는 2이고 제곱 오차는 4일 것이다.그런데 확률적/통계적 모델은 다음과 같이 예측한다.내일 최고 기온은20~22도일 확률 10%22~24도일 확률 30%24~26도일 확률 40%26~28도일 확률 20% 이런 식으로 기온 전체에 대한 확률 분포를 예측한다. 이러한 확률 예측을 평가 하기 위한 방법이 CRPS나 NMAE가 되는 것이다.CRPS: Continuous Ranked Probability ScoreCRPS는 단변량 데이터에서 스코어를 .. 2025. 11. 17.
Kullback-Leibler divergence (KL Divergence) KL Divergence를 이해하기 위해서는 우선 Entropy와 Cross Entropy에 대해서 이해해야 한다. 1. Entropy Entropy의 정의 열의 이동과 더불어 유효하게 이용할 수 있는 에너지의 감소 정도나 무효 에너지의 증가 정도를 나타내는 양 정보를 내보내는 근원의 불확실도를 나타내는 양 정보량의 기대치를 이르는 말 표준국어대사전에는 위와 같이 entropy를 정의 하였다. 컴퓨터 과학 측면에서는 entropy를 “한 메세지에 들어갈 수 있는 정보량의 비트 수”로 정의 한다. 또한 후술 할 설명에 의하면 entropy는 최적의 정보 전송을 위해 필요한 질문 개수에 대한 기댓값을 의미한다. 조금씩 그 정의에서 차이를 보이긴 하는데, 종합해보면 AI 분야에서의 entropy는 어떤 정보의.. 2023. 11. 23.
머신러닝 프로세스 다변량 데이터 다변량 데이터에서 보통 X값은 원인, Y값은 결과로 볼 수 있으며 경우에 따라서 그 이름은 아래와 같이 다양하게 쓰인다. X(원인): 독립변수, 예측변수, 입력변수 Y(결과): 종속변수, 반응변수, 출력변수 예측 모델링 아래 그림과 같이 X1, X2와 Y가 포함된 데이터 테이블이 있다고 가정하자. 어떤 모델, 즉 함수는 X라는 input을 받아 Y라는 output을 내뱉는 형태를 띄게 된다. 데이터 테이블에 따르면 X1 = 0, X2 = 2를 넣었을 때 Y는 2가 나온다. 또한 X1 = 1, X2= 3을 넣으면 Y는 4가 나온다. 따라서 Y=X1+X2라는 함수를 만들 수 있고 이것이 예측 모델링 방법의 기초가 된다. X1 X2 Y 0 2 2 1 3 4 2 4 6 3 5 8 $Y = X_1 .. 2023. 8. 1.