[[ 특정 값 추출 ]]
UserInfo 테이블의 "106.187.44.5"에 해당 하는 유저를 추출하여 ExtratorIP 테이블에 저장합니다.
DataFrame()를 통하여 테이블을 정리합니다.
ExtractionIP = UserInfo[UserInfo.client_ip == 127.0.0.1']
[[출력]]
|
[[ 특정 컬럼 추출 ]]
groupby 객체를 활용하여 원하는 내용을 추출 할 수 있습니다.
다양한 컬럼이 존재 할때 "ip, id, status1, status2, data"를 추출하고 싶다면 다음을 코드를 활용합니다.
extraction_info = ExtractionIP.groupby(['ip', 'id', 'status1', 'status2', 'status3', 'data']) extraction_info.mean() |
[[ 특정 컬럼 / 테이블 파일로 저장]
추출한 컬럼 및 테이블을 저장하기 위해서는 Numpy 패키지를 활용하면 됩니다.
(※ 파일은 raw file로 저장됩니다.)
import numpy as np
np.save('Extraction_raw_data', extraction_info) |
'프로그래밍 > Data Science' 카테고리의 다른 글
[Data Science] Pandas - 로딩, 저장, 형식 (0) | 2016.06.23 |
---|---|
[Data Science] 정규 표현식 (Regular Expressions) (0) | 2016.06.23 |
[Data Science] 새너티 테스트(Sanity Check) & 중복 데이터 카운트 (0) | 2016.05.06 |
[Data Science] Column 사용하기 & 여러 파일 읽기 (0) | 2016.05.02 |
[Data Science] CSV Format Parssing & Merge (0) | 2016.04.28 |