분류 전체보기
-
MSE, KNN, 비모수알고리즘,다변량 데이터 2023. 4. 27. 18:39
MSE MSE (Mean Squared Error)는 평균 제곱 오차라고 불리며, 회귀 분석에서 모델의 예측값과 실제값 간의 차이를 평가하는 데 사용되는 지표이다. MSE는 예측 오차의 크기를 측정하기 위해 오차의 제곱을 평균한 값입니다. MSE는 실제값과 예측값 간의 차이를 제곱하여 모두 더한 후, 데이터 포인트의 수로 나눈 값으로 표현된다. 이 MSE의 값은 오차의 제곱이므로 항상 양수이며, 0에 가까울수록 예측 모델이 실제값과 가깝게 예측한 것을 의미하기 때문에 회귀 모델에서 가장 작은 MSE모델을 예측값의 정확도가 높다고 볼 수 있다. Error 가 작아지는 방향으로 학습하는 것이 핵심 ! 실제 Training set 의 데이터와 test set 를 통해서 학습시킨다. 이 둘 사이의 관계는 다음과..
-
다변량 데이터 분석 - population , sample, complexity model , Types of Machine Learing다변량 데이터 2023. 4. 27. 18:07
Learning theory 데이터란 ? 관측된 값 들의 집합이라 부른다. 전체 population (모집단) 에서 구한 일부를 sample 이라 부른다. 즉, 관측된 값들의 집합이다. 여기서 관측된 모든 데이터는 모집단에서 추출된 랜덤 값이다. 데이터를 수집할 경우 속성은 비슷하지만 값이 다른 샘플을 수집한다. 과거에 발생했거나 현재 발생중이며 향후 발생할 모든 데이터 샘플이 포함된다. X 와 Y 의 관계 input X 를 통해서 Y를 해석하는데에 초점을 두고 분석한다. X와 Y의 관계를 파악하는 것이 데이터 분석의 핵심 Model Complexity 모델은 함수를 통해서 표현된다. 차수가 높을수록 더 복잡한 식이 나타남. 따라서 곡선 함수는 더 유연하지만, 선형은 더 해석하기 쉽다. 다양한 방법의 절..