본문 바로가기

캐글 메달리스트가 알려주는 캐글 노하우

(2)
캐글 메달리스트가 알려주는 캐글 노하우 2장 - 대회유형 : Featured - 제출방식 : Code Copetition - 주최 : Kaggle - 문제유형 : 이진 분류 - 데이터 타입 : 정형(Tabular) - 평가지표 : AUC 1. 평가지표 AUC란? AUC(Area Under the ROC Curve)는 분류 모델의 성능을 평가하는 데 사용되는 지표 중 하나입니다. ROC(Receiver Operating Characteristic) 곡선은 이진 분류 모델의 성능을 시각화하는 데 사용되며, ROC 곡선 아래의 면적을 AUC라고 합니다. AUC는 모델이 정확하게 분류하는 능력을 나타내며, 보통 0에서 1 사이의 값을 가집니다. AUC가 1에 가까울수록 모델이 완벽하게 분류하는 것을 나타내며, 0.5에 가까울수록 모델의 성능이 랜덤 수준에..
캐글 메달리스트가 알려주는 캐글 노하우 [1장] 리뷰 / Kaggle 1. Kaggle's 핵심 : 컴페티션 - 캐글의 컴페티션은 말그대로 데이터를 가지고 이뤄지는 대회이다. 캐글 홈 화면의 가운데에 자리잡고 있는 것이 competion이며 현재 진행중인 대회의 수를 볼 수 있다. 캐글의 컴페티션의 유형은 5가지이다. 1. Featured : 가장 일반적인 컴페티션으로 캐글에서 열리는 대부분의 대회가 해당유형이다. 다양한 도메인의 데이터가 활용된 컴페티션이 있으며 실제 현장에서 해결해야 하는 문제를 다루는 경우가 많다. 큰 특징은 상금이 크다는 점이다. 2. Research : 두번째로 많이 볼 수 있는 유형으로 주최하는 곳이 대게 연구 목적으로 만들어진 단체가 많다. Featured에 비해서 실험적이고 도메인이 생소한 경우가 많다. 3. Analytics : 다른 대회는..