sample
-
다변량 데이터 분석 - population , sample, complexity model , Types of Machine Learing다변량 데이터 2023. 4. 27. 18:07
Learning theory 데이터란 ? 관측된 값 들의 집합이라 부른다. 전체 population (모집단) 에서 구한 일부를 sample 이라 부른다. 즉, 관측된 값들의 집합이다. 여기서 관측된 모든 데이터는 모집단에서 추출된 랜덤 값이다. 데이터를 수집할 경우 속성은 비슷하지만 값이 다른 샘플을 수집한다. 과거에 발생했거나 현재 발생중이며 향후 발생할 모든 데이터 샘플이 포함된다. X 와 Y 의 관계 input X 를 통해서 Y를 해석하는데에 초점을 두고 분석한다. X와 Y의 관계를 파악하는 것이 데이터 분석의 핵심 Model Complexity 모델은 함수를 통해서 표현된다. 차수가 높을수록 더 복잡한 식이 나타남. 따라서 곡선 함수는 더 유연하지만, 선형은 더 해석하기 쉽다. 다양한 방법의 절..