알맹이방
[201030] 데이터 시각화 - colab 본문
from matplotlib import pyplot as plt
from google.colab import drive
drive.mount('/content/drive',force_remount=True)
infection = '/content/drive/Shared drives/[재학생멘토단]데이터분석_프로젝트_스터디/데이터 가공 [DEAD LINE 10 30]/김수영/감염원1.xlsx'
data = pd.read_excel(infection)
col=data.loc[:,['개수']]
label=data.loc[:,['감염원1']]
plt.figure()
plt.pie([col.loc[0],col.loc[1],col.loc[2],col.loc[3],col.loc[4]], labels= ['human','visitor birds','etc','farm',''],startangle=90)
plt.title('source of infection')
plt.show()
from matplotlib import pyplot as plt
from google.colab import drive
drive.mount('/content/drive',force_remount=True)
route = '/content/drive/Shared drives/[재학생멘토단]데이터분석_프로젝트_스터디/데이터 가공 [DEAD LINE 10 30]/김수영/이동경로.xlsx'
data = pd.read_excel(route)
col=data.loc[:,['개수']]
label=data.loc[:,['이동경로']]
plt.figure()
plt.pie([col.loc[0],col.loc[1],col.loc[2],col.loc[3],col.loc[4],col.loc[5],col.loc[6],col.loc[7],col.loc[8],col.loc[9],col.loc[10]], labels= ['human','car','moving livestock','Wild birds','Nearby','Barn breakage','visitor birds','','','',''],startangle=90)
plt.title('route of infection')
plt.show()
데이터 분석
source of infection 그래프를 보면 human과 visitor birds 의 비율이 압도적으로 높다. 여기서 한 가지 재밌는 점은 source of infection의 human 비율과 route of infection의 human+car의 비율이 거의 동일하다는 것이다. car도 human에 의해서 route가 유발된 것이므로 human이라고 생각한다면 데이터 분석이 성공적이었음을 알 수 있다.
route of infection 그래프는, source of infection 그래프보다 더 다양하게 세분화 해서 컬럼을 나눠보았다. 이 데이터를 가공하는 데 있어서 궁금한 점은, wild birds와 visitor birds가 따로 구분되어있는 것이었다. visitor birds도 wild birds의 한 범주 아닌가? wild birds와 visitor birds, moving livestock 요인은 barn breakage에 의해서 유입이 된 것으로 예상된다.
결론 도출
데이터 분석을 통해 철새의 인플루엔자 감염의 감염원은 human, visitor birds가 압도적인 것을 알 수 있었고, 이동경로는 다양했지만 절반이 넘는 경로가 human, car인 것을 알 수 있었다. 인플루엔자 철이 돌 때마다 뉴스에서 농가가 도로를 지나는 차에게 소독을 뿌리는 장면이 떠올랐다. 그 소독 작업으로 인플루엔자 감염의 절반을 넘게 차지하는 이동경로인 (human+car)를 차단해보자는 의미였던 것이다.
따라서,
1. 농가를 출입하는 사람과 차를 소독한다.
2. barn 을 수리보수하여 moving livestock, wild birds, visitor birds들의 유입을 차단한다. 혹은 padding 스타일의 이중 방식으로 울타리를 하나 더 만들어 다른 가축들 간의 거리유지도 하나의 방법이 될 것이다.
'프로젝트 > [2020] 토이데이터' 카테고리의 다른 글
[201029] 토이데이터 전처리 작업 - ms access (0) | 2020.10.30 |
---|