본문 바로가기

Machine, Deep Learning/Machine, Deep Learning 실습

Pandas 데이터 추출 및 추가

반응형
SMALL

DataFrame에서 원하는 데이터를 추출하기 위해 loc(), iloc() 기능을 사용할 수 있습니다.

  • loc() : 명시적인 인덱스를 참조하는 인덱싱 / 슬라이싱
  • iloc() : 정수 인덱스 인덱승 / 슬라이싱. 단 iloc의 경우 리스트와 같이 마지막 인덱스는 포함되지 않습니다.

loc, iloc 함수에 Index 값을 입력하여 원하는 데이터 인덱스를 추출/ 추가할 수 있습니다.

Pandas 데이터 삭제

drop() 기능을 이용하여 DataFrame의 Index 및 Column을 삭제할 수 있습니다.

  • drop() : index, column 삭제

drop() 함수에 Index 값을 입력하여 원하는 데이터 인덱스를 삭제할 수 있습니다.

import pandas as pd

a = pd.Series([20, 15, 30, 25, 35], name='age')
b = pd.Series([68.5, 60.3, 53.4, 74.1, 80.7], name='weight')
c = pd.Series([180, 165, 155, 178, 185], name='height')
human = pd.DataFrame([a, b, c])

def main():
	# loc(), iloc() 함수를 이용하여 특정 행, 열 추출
    print(human.loc[], '\n') # label을 입력
    print(human.iloc[], '\n') # index 값을 입력
    
    # loc(), iloc() 함수를 이용하여 데이터의 특정 범위 추출
    print(human.loc['weight'],'\n')
    print(human.iloc[1],'\n')
    
    sex = ['F', 'M', 'F', 'M', 'F']
    # 새로운 데이터 추가하기
    human.loc['sex'] = sex
    print(human, '\n')
    
    # 원하는 행/열 데이터 삭제하기
    tmp = human.drop(['age'])
    print(tmp, '\n')
    
if __name__ == "__main__":
	main()
0    20.0
1    15.0
2    30.0
3    25.0
4    35.0
Name: age, dtype: float64 

0    20.0
1    15.0
2    30.0
3    25.0
4    35.0
Name: age, dtype: float64 

0    68.5
1    60.3
2    53.4
3    74.1
4    80.7
Name: weight, dtype: float64 

0    68.5
1    60.3
2    53.4
3    74.1
4    80.7
Name: weight, dtype: float64 

           0     1     2     3     4
age       20    15    30    25    35
weight  68.5  60.3  53.4  74.1  80.7
height   180   165   155   178   185
sex        F     M     F     M     F 

           0     1     2     3     4
weight  68.5  60.3  53.4  74.1  80.7
height   180   165   155   178   185
sex        F     M     F     M     F 
반응형
LIST

'Machine, Deep Learning > Machine, Deep Learning 실습' 카테고리의 다른 글

Loss Function  (0) 2019.06.24
기울기와 절편  (0) 2019.06.24
Pandas 선언  (0) 2019.06.24
Numpy 함수로 행렬연산 다루기  (0) 2019.06.24
Numpy 배열의 통계적 정보 나타내기  (0) 2019.06.24