가) A마트는 500원, B마트는 400원에 볼펜을 판매한다. 나) B마트의 다른 상품도 A 마트보다 저렴할 것이다 다) B마트는 볼펜 가격이 싸다. 라) 상대적으로 저렴한 B마트에서 볼펜을 사야겠다
이것은 어떤 변인들 간에 주목할 만한 상관관계가 있는지를 찾아내는 방법으로, 상관 관계가 높은 상품을 함께 진열하거나 시스템 로그 데이터를 분석해 침입자나 유해 행위자 색출이 가능하며, 우유 구매자가 기저귀를 더 많이 구매하는지 등을 분석할 때 사용한다.
데이터의 표준용어 설정, 명명규칙 수립, 메타 데이터 구축, 데이터 사전 구축
상향식 접근법은 기업에서 보유하고 있는 다양한 원천 데이터로부터의 (A)를 통하여 (B)를 얻을 수 있다. 상향식은 디자인 사고 중 (C)에 해당한다.
사용자 요구사항이나 데이터를 정확히 규정하기 어렵고 데이터 소스도 명확히 파악하기 어려운 상황에서 사용, 일단 분석을 시도해보고 그 결과를 확인해 가면서 반복적으로 개선해 나가는 방법을 취한다.
여러 모델이 순차적인 학습을 하며, 이전 모델의 결과에 따라 다음 모델 표본 추출에서 분류가 잘못된 데이터에 가중치(weight)를 부여하여 표본을 추출한다.
-잔차와 독립변수의 값이 관련되어 있지 않아야 한다. - 독립성 -잔차들끼리 상관이 없어야 한다. - 비상관성 - ( )이 정규분포를 이뤄야 한다. - 정상성