[Pandas] DataFrame 데이터 조회 (1) loc본 포스팅은 데이터프레임에서 사용하기 유용한 loc에관한 기본적인 내용에 관하여 다룹니다.
평소에 pandas라이브러리로 데이터프레임을 이리저리 다루다 보면 항상 마주치는 에러중에 loc, iloc등을 사용을 권장하는 경고 메시지를 자주 보았었다. 하지만, 매번 공부한다는게 다른거 보기 바빠서 제대로 공부를 못했었고, 가끔 필요할 때 마다 구글링을 하여 사용법을 찾아보았기 때문에 시간 소모를 발생시켰었던 적이 많았다.이를 대체할 문법들은 pandas에 있지만, 해당 메소드들은 기존의 길었던 코드들을 간략하게 만들어주며, SQL에서처럼 python에서 데이터를 다룰 수 있게 해주는 유용성을 가진다. 그래서, 이를 블로그로 포스팅하며 배워보고자 한다. 메소드들을 사용하기에 앞서 예제에서 사용할 데이터를 가져온다. 해당 데이터들은 KOSIS국가통계포털에서 찾을 수 있었던 2020년 6월 행정구역별 인구수이다.
pandas.DataFrame.loc
1) Select Rows</b>
하지만,
특정 행을 여러개 가져오고 싶을 경우 가져오고 싶은 index name들을
특정행을 제외하여 가져오고 싶은 경우 다음과 같이
물론, list에서 처럼 인덱싱을 이용해 연속으로 행을 조회할 수 있다.
2) Select Columns</b>
열을 조회한다고 해서 행을 조회하는 것이랑 크게 다르지 않다. 단순히 특정 열을 하나 조회하고 싶은 경우는 다음과 같다.
특정 열을 다중으로 조회하는 경우도 앞전과 크게 다르지 않다.
특정 열을 제외하고 가져오는 것도 마찬가지이다. 단지
연속 컬럼을 가져오는 것도 다를바 없다!
3) Select Rows & Cols 특정 행과 열을 동시에 조회하는 것은 위의 두 가지를 짬뽕시킬 뿐이다.
4) 조건을 만족하는 행/열 조회 특정 index_name하나와 특정 column_name을 하나씩 loc에 입력해줄 경우 이에 속한 값을 출력하게 된다.
또한, 특정 조건을 만족하는 값을 가진 데이터프레임만을 부분 출력도 가능하다.
또한 은근 유용할 것 같은 케이스도 있다.
292 rows × 3 columns 이처럼
다음에는 References
|