IT/멋쟁이사자처럼 AI SCHOOL

멋쟁이사자처럼 AI SCHOOL 8일차 필기 - 파이썬을 활용한 데이터 수집 & 웹 스크레이핑 + 파이썬 기반 텍스트 데이터 분석 (4) - numpy, pandas 기초

카멜필름 2022. 3. 29. 23:19

 

오늘 웹스크래핑부터 정말 많은 내용을 다뤄

한 번에 올리는 것보다 내용별로 끊어서 올리는 것이 더 나은 것 같아 게시물을 분리하였다!

 

나는 왜 낮잠이 많을까.....

잠 깨려고 중간에 커피 마시면 심장이 미친듯이 두근거리고 불안에 시달린다. 그냥 이유 없이 불안해짐 ㅠㅠ

네 샷이라 그런가

한 샷만 먹든지 아니면 커피를 아예 마시지를 말아야겠다.

 

 

 


NUMPY

 

[]안에서 행 열 구분

sample_matrix[:, 2]
#=>행 전체 다나와라!!!
#=>근데 열은 0,1,2열중에 2열만!! 나와라!!!

 

 

np.arange

v2 = np.arange(1, 10, 2)
v2
#1부터 9까지 2씩 띄워서 만들어라~~

arnage의 기능은 0부터 숫자 순서대로 채워서 배열 만들어주는 것임

 

 

reshape

v1 = np.arange(1, 5).reshape(2, 2)
v1
#1부터 4까지 배열 만들고 그걸 2X2 형태로 다시 바꿔라

 

사칙연산

multiply: 같은 위치에 있는 값들끼리만 곱해줌

dot: 행렬곱

 


PANDAS

 

at

df.at[0, 'amount']
#하나의 셀 값을 불러올 때 쓰는 애at

loc과 iloc의 차이

 

iloc
=integer location의 약어
데이터 프레임의 행이나 칼럼의 순서를 나타내는 정수로 특정 값을 추출해오는 방법

loc: 칼럼명을 직접 적거나 특정 조건식을 써줌으로써 사람이 읽기 좋은 방법으로 데이터에 접근
iloc: 컴퓨터가 읽기 좋은 방법으로 (숫자로) 데이터가 있는 위치 (순서)에 접근

한 마디로
loc: 사람 중심
iloc: 컴퓨터 중심


복습하면서 내가 헷갈렸던 것들 위주로 정리했다.

다음엔 헷갈릴 일이 없기를!!