원자력 발전소 상태 판단 알고리즘 공모전 도전 5일차!(마지막날) 포스팅 썸네일 이미지

경진대회, 공모전/DACON 원자력발전소 상태 판단 알고리즘 경진대회

원자력 발전소 상태 판단 알고리즘 공모전 도전 5일차!(마지막날)

[산업] 원자력발전소 상태 판단 대회 출처 : DACON - Data Science Competition dacon.io 먼저 lightGBM 모델을 사용하였습니다. from lightgbm import LGBMClassifier, plot_importance lgb2 = LGBMClassifier(n_estimators=2, learning_rate=0.001, max_depth=7,min_child_samples=48, random_state=4321) lgb2.fit(X_train, y_train, verbose=2) 결과는! 이번에는 GridSearchCV를 활용하여 RandomForest의 최적의 파라미터를 찾아보았습니다. 머신러닝 bagging 앙상블 랜덤 포레스트(random forest)란..

2020.02.12 게시됨

제공 데이터 이해하고 학습데이터/테스트 데이터 load 해보기! 포스팅 썸네일 이미지

경진대회, 공모전/DACON 원자력발전소 상태 판단 알고리즘 경진대회

제공 데이터 이해하고 학습데이터/테스트 데이터 load 해보기!

라벨링은 어떻게 해야할까? train.zip : 각각의 csv파일은 feature에 대한 내용만 저장되어있음. train_label.csv : 각각의 csv파일에 대한 label 값은 train_label.csv에 저장되어있음. 참가자가 직접 라벨링을 해주어야함. train_label.csv파일 내에 각각의 csv파일별로 부여가되는 라벨에 대한 정보가 저장되어있습니다. 즉 만약 1번 csv파일의 라벨값이 29번이라면 29번을 target column에 추가를 해주면 됩니다. 하지만 train_label.csv 내에 있는 라벨 정보는 각각의 파일별 상태 B에 대한 정보를 나타냅니다. 모든 데이터는 상태 A에서 시작하기 때문에 상태 A부분을 반영해주어야합니다. 상태 A에서 발전소가 운영을 시작하다가 중간에 ..

2020.01.23 게시됨