반응형

[[ 특정 값 추출 ]]

 

UserInfo 테이블의 "106.187.44.5"에 해당 하는 유저를 추출하여 ExtratorIP 테이블에 저장합니다.

DataFrame()를 통하여 테이블을 정리합니다.

 

ExtractionIP = UserInfo[UserInfo.client_ip == 127.0.0.1']
ExtractionIP = DataFrame(ExtractorIP)
ExtractionIP.Info()

 

[[출력]]

<class 'pandas.core.frame.DataFrame'> Int64Index: 15 entries, 13250 to 95289 Data columns (total 20 columns): date 15 non-null object ip 15 non-null object id 15 non-null object status1 15 non-null object status2 15 non-null int64 status3 15 non-null object

............

 

ExtractionIP

 

 

[[ 특정 컬럼 추출 ]]

 

groupby 객체를 활용하여 원하는 내용을 추출 할 수 있습니다.

다양한 컬럼이 존재 할때 "ip, id, status1, status2, data"를 추출하고 싶다면 다음을 코드를 활용합니다.

 

extraction_info = ExtractionIP.groupby(['ip', 'id', 'status1', 'status2', 'status3', 'data'])

extraction_info.mean()

 

 

 

[[ 특정 컬럼 / 테이블 파일로 저장]

 

추출한 컬럼 및 테이블을 저장하기 위해서는 Numpy 패키지를 활용하면 됩니다.

(※ 파일은 raw file로 저장됩니다.)

 

import numpy as np

 

np.save('Extraction_raw_data', extraction_info)

 

반응형

+ Recent posts