1. Threshold 간단하게 표현 하자.
많은 데이터 중에서 특정 값 이상인 데이터 수를 확인 하기 위해서는 다음과 같이 interact 라이브러리를 활용하여
threshold bar로 표현 할 수 있다.
from ipywidgets import interact @interact def show_nrows(distance_threshold=(0, 200)): return len(data.loc[data.trip_distance > distance_threshold]) |
위 그림과 같이 69보다 큰 데이터가 11개 존재하는 것을 interact 라이브러리로 표현 할 수 있다.
2. Anaconda Package 설치 하기
conda install [package name] -q -y |
[실행결과]
C:\Users\crattack>conda install seaborn -q -y Using Anaconda Cloud api site https://api.anaconda.org Fetching package metadata: .... Solving package specifications: ......... Package plan for installation in environment C:\Anaconda2: The following packages will be downloaded: package | build ---------------------------|----------------- conda-env-2.6.0 | 0 498 B python-2.7.12 | 0 23.5 MB ruamel_yaml-0.11.14 | py27_0 212 KB conda-4.2.12 | py27_0 454 KB seaborn-0.7.1 | py27_0 272 KB ------------------------------------------------------------ Total: 24.4 MB The following NEW packages will be INSTALLED: ruamel_yaml: 0.11.14-py27_0 seaborn: 0.7.1-py27_0 The following packages will be UPDATED: conda: 4.0.5-py27_0 --> 4.2.12-py27_0 conda-env: 2.4.5-py27_0 --> 2.6.0-0 python: 2.7.11-4 --> 2.7.12-0 |
'프로그래밍 > Data Science' 카테고리의 다른 글
[Hadoop] Connect...... (0) | 2016.11.04 |
---|---|
[Data Science] Pandas - 로딩, 저장, 형식 (0) | 2016.06.23 |
[Data Science] 정규 표현식 (Regular Expressions) (0) | 2016.06.23 |
[Data Science] 특정 값 추출 하기 & 추출 한 테이블 파일로 저장 (0) | 2016.05.12 |
[Data Science] 새너티 테스트(Sanity Check) & 중복 데이터 카운트 (0) | 2016.05.06 |