"최대의 시청률을 얻으려면 어떤 프로그램을 어떤 시간대에 방송해야 하는가?와 같은 최적화 메커니즘을 찾아가는 방법이다"
데이터의 표준용어 설정, 명명규칙 수립, 메타 데이터 구축, 데이터 사전 구축
가. 데이터 이해에서 데이터 준비 단계로 갈 수 있다. 나. 모델링 단계에서 학습용/테스트용 데이터를 사용해 과소 적합을 확인한다. 다. 비즈니스 이해, 데이터 이해 간 피드백이 가능하다. 라. 평가에서 적합하면 바로 프로젝트 투입이 가능하다.
도입 단계 - ( ) 단계 - 확산 단계 - 최적화 단계
전사적으로 구축된 데이터웨어 하우스로부터 특정 주제, 부서 중심으로 구축된 소규모 단일 주제의 데이터웨어 하우스로 재무, 생산, 운영과 같이 특정 조직의 특정 업무 분야에 초점을 두고 있다.
장바구니 / item 1 A,B,C 2 A,C 3 B,C 4 A,B 5 A,C,D
지도 학습에서 신경망을 학습 시키는 방법으로, 출력층에서 제시한 값에 대해, 실제 원하는 값으로 학습하는 방법으로 사용되고, 동일 입력층에 대해 원하는 값이 출력되도록 개개의 weight를 조정하는 방법으로 사용되는 알고리즘이다.
가) 초기 군집의 중심으로 k개의 객체를 임의로 선택한다. 나) 각 자료를 가장 가까운 군집 중심에 할당한다. 다) 각 군집 내의 자료들의 평균을 계산하여 군집의 중심을 갱신한다. 라) 군집 중심의 변화가 거의 없을 때까지 나)와 다)를 반복한다.
( ) 두 군집 사이의 거리를 군집에서 하나씩 관측 값을 뽑았을 때 나타날 수 있는 거리의 최솟값을 측정하는 계측정 군집의 거리 기반 측정 방법이다. 사슬 모양으로 생길 수 있으며 고립된 군집을 찾는데 중점을 두는 방식이다.
여러 개의 붓스트랩 자료를 생성하고 각 붓스트랩 자료에 예측 모형을 만든 후 결합하여 최종 예측 모형을 만드는 방법이다.