python 카테고리 나누기 / pydeck을 이용하여 스테이션별 이용량 파악하기 포스팅 썸네일 이미지

경진대회, 공모전/COMPAS 고양시 공공자전거 스테이션 최적 위치 선정

python 카테고리 나누기 / pydeck을 이용하여 스테이션별 이용량 파악하기

3. 맴버십 비맴버십으로 나눠보기 #MEMB_DIV 회원 구분(비회원은 99이며 나머지는 정회원) riding_data.MEMB_DIV.value_counts() #비회원인 99는 MEMB_NO가 0으로 뜬다. riding_membership = riding_data[["MEMB_DIV", "MEMB_NO", "Difference"]] riding_membership #회원들을 1로 바꾸고 비회원은 99로 냅둔다. riding_membership.loc[riding_membership["MEMB_DIV"] != 99, "MEMB_DIV"] = 1 riding_membership["membership"] = riding_membership.MEMB_DIV.replace({1:"membership", 99:..

2020.09.11 게시됨

python boxplot을 통해 데이터 빈도 알아보기/  고양시 운영이력 데이터 살펴보기 포스팅 썸네일 이미지

경진대회, 공모전/COMPAS 고양시 공공자전거 스테이션 최적 위치 선정

python boxplot을 통해 데이터 빈도 알아보기/ 고양시 운영이력 데이터 살펴보기

1. 운영이력에서 필요없는 데이터 삭제하기 riding_data = pd.read_csv("01.운영이력.csv") riding_data.head() print(jy) riding_data.shape riding_data.RTN_PROCESS.value_counts() riding_data = riding_data.loc[~riding_data.RTN_PROCESS.isin(["1.0", "3.0", "5.0"]), :] riding_data.shape riding_data.LEAS_DATE.dtype 2. 반납시간 - 대여시간 빼기 데이터프레임 시간 object to datetime 으로 만들고 "분"으로 만들기 riding_data["LEAS_DATE"] = pd.to_datetime(r..

2020.09.11 게시됨

[COMPAS 고양시] 데이터 시각화 해보기 ( feat. python, folium ) 포스팅 썸네일 이미지

경진대회, 공모전/COMPAS 고양시 공공자전거 스테이션 최적 위치 선정

[COMPAS 고양시] 데이터 시각화 해보기 ( feat. python, folium )

사용 라이브러리 - pandas, folium, geopandas, geojson, json 시각화에 사용한 데이터 02.자전거스테이션.csv column 명 Station_ID STATION_NAME 거치대 수량 위도 경도 내용 스테이션 고유번호 스테이션 이름 자전거 최대 수용량 위도 경도 09.행정경계(읍면동).geojson EMD_CD EMD_KOR_MM 읍면동 코드 읍면동 이름 자전거 대여소(스테이션) 시각화를 통하여 스테이션의 대략적인 분포 확인하기 import pandas as pd import folium from folium.plugins import MarkerCluster, MiniMap import geopandas as gpd import geojson import json 먼저 필..

2020.08.01 게시됨

원자력 발전소 상태 판단 알고리즘 공모전 도전 5일차!(마지막날) 포스팅 썸네일 이미지

경진대회, 공모전/DACON 원자력발전소 상태 판단 알고리즘 경진대회

원자력 발전소 상태 판단 알고리즘 공모전 도전 5일차!(마지막날)

[산업] 원자력발전소 상태 판단 대회 출처 : DACON - Data Science Competition dacon.io 먼저 lightGBM 모델을 사용하였습니다. from lightgbm import LGBMClassifier, plot_importance lgb2 = LGBMClassifier(n_estimators=2, learning_rate=0.001, max_depth=7,min_child_samples=48, random_state=4321) lgb2.fit(X_train, y_train, verbose=2) 결과는! 이번에는 GridSearchCV를 활용하여 RandomForest의 최적의 파라미터를 찾아보았습니다. 머신러닝 bagging 앙상블 랜덤 포레스트(random forest)란..

2020.02.12 게시됨