본문 바로가기

머신러닝2

누구나 쉽게 시작하는 R 머신러닝 데이터 분석 / 연관분석 연관 분석 (지지도) support(X) = count(x) / N 전체 데이터베이스 중에서 아이템 집합(x)를 포함하는 거래 건수 즉 해당 규칙이 얼마나 나타났는지가 support이다. (신뢰도) confidence(X -> Y) = support(X,Y) / support(X) 신뢰도는 예측 능력이나 정확도의 측정치다. X와 Y를 모두 포함하는 아이템 집합의 지지도를 X만 포함하는 아이템 집합의 지지도로 나눈 값으로 정의된다. 규칙을 신뢰할 수 있는 정도를 나타낸다. 1. 데이터 불러오기 https://github.com/stedy/Machine-Learning-with-R-datasets Download ZIP을 클릭하고 데이터를 다운로드 받습니다. 압축을 풀고 파일을 R 작업 경로로 가져갑니다. .. 2018. 1. 19.
누구나 쉽게 시작하는 R을 활용한 기계학습 , 머신러닝 / KNN 알고리즘 R을 활용한 기계학습 , 머신러닝 / KNN 알고리즘 안녕하세요 이번 글은 R을 활용해서 데이터에 KNN 알고리즘을 적용하는 방법을 다루고 있습니다. KNN 알고리즘 분류를 위한 대표적인 알고리즘. 가장 단순한 머신러닝 알고리즘 중 하나지만, 광범위하게 사용 됩니다. 장점 단점 단순하고 효율적이다 기저 데이터 분포에 대한 가정을 하지 않는다 훈련 단계가 빠르다 모델을 생성하지 않아 특징과 클래스 간의 관계를 이해하는 능력이 제약된다 적절한 k의 선택이 필요하다 분류 단계가 느리다 명목 특징 및 누락 데이터를 위한 추가 처리가 필요하다 KNN 알고리즘의 특징 레이블이 없는 데이터를 분류합니다. 글자 k는 사용자가 정의하는 최근접 이웃의 개수를 의미합니다. KNN알고리즘의 데이터 분석 순서 1. k를 지정한.. 2017. 12. 13.