Computer Language/Python

파이썬 값 한 번에 여러 개 받기 2023.01.02
동일 인물 확인 및 이미지 얼굴 추출 (face_recognition) / 파이썬 2022.12.25
face_recognition 라이브러리 설치(dlib 설치/ 파이썬) 2022.12.24
아나콘다 albumentations 설치 에러 2022.09.27 1
구글 코랩 (google colab) 자동완성, 독스트링(docstring) 설정하기 2022.08.23
판다스(Pandas) 행과 열 가지고 놀기 2022.06.29
판다스(Pandas) - 기본 개념 2022.06.28
Numpy(넘파이) 속성 및 함수 훑어보기 2022.06.20
파이썬 html 정보 가져오기 크롤링(Web Crawling) 2022.06.02
웹 크롤링(Web Crawling) 에러 , 304 에러 2022.06.01

파이썬 값 한 번에 여러 개 받기

2023. 1. 2. 10:49

파이썬에서 변수에 원하는 값을 넣으려면 input을 이용해서 받을 수 있습니다.

1.하나씩 입력받기

2.한 번에 여러 개 입력하기

3.반복문을 이용해 동적변수에 값 받기

1. 하나씩 입력 받기

소스코드

a = int(input('a값 입력 '))
b = int(input('b값 입력 '))

print(f'a = {a}, b = {b}')

결과

2. 한 번에 여러 개 입력 받기

소스코드

c, d =map(int, input('c,d 입력하세요 ').split())

print(f'c = {c}, d = {d}')

결과

3. 반복문을 이용해 동적변수에 값 받기

소스코드

for i in range(5):
    globals()['aa_{}'.format(i+1)]= input(f'{i+1}번째 값 입력바람') #globals , locals 

print(aa_1)
print(aa_2)
print(aa_3)
print(aa_4)
print(aa_5)

결과

'Computer Language > Python' 카테고리의 다른 글

동일 인물 확인 및 이미지 얼굴 추출 (face_recognition) / 파이썬 (0)	2022.12.25
face_recognition 라이브러리 설치(dlib 설치/ 파이썬) (0)	2022.12.24
아나콘다 albumentations 설치 에러 (1)	2022.09.27
구글 코랩 (google colab) 자동완성, 독스트링(docstring) 설정하기 (0)	2022.08.23
판다스(Pandas) 행과 열 가지고 놀기 (0)	2022.06.29

동일 인물 확인 및 이미지 얼굴 추출 (face_recognition) / 파이썬

2022. 12. 25. 08:47

face_recognition 라이브러리를 통해 이미지의 얼굴을 찾고 동일인물인지 확인 할 수 있다.

face_recognition 설치

https://korbear.tistory.com/83

face_recognition 라이브러리 설치(dlib 설치/ 파이썬)

사진에 얼굴만 추출하고 싶은데 찾아보니 face_recognition 라는 라이브러리가 있어서 사용해보려 합니다. 일단 간단히 pip install face_recognition 커맨드창에 쳐보니 역시나 간단히 설치되지 않는다. 설

korbear.tistory.com

1. 동일인물 확인

1 - 1. 이미지 샘플

1 - 2. 소스코드

import face_recognition

picture_of_me = face_recognition.load_image_file("01.jpg")
my_face_encoding = face_recognition.face_encodings(picture_of_me)[0] 


unknown_picture = face_recognition.load_image_file("02.jpg")
unknown_face_encoding = face_recognition.face_encodings(unknown_picture)[0] 

results = face_recognition.compare_faces([my_face_encoding], unknown_face_encoding) #동일 인물 인지 비교

if results[0] == True:
    print("동일 인물 입니다.")
else:
    print("동일 인물이 아닙니다")

1 - 3. 결과

03.jpg로 비교시 '동일 인물이 아닙니다' 라고 찍힙니다.

2. 이미지 얼굴 부분 추출

2 - 1. 소스코드

from PIL import Image
import face_recognition
cnt = 0
image = face_recognition.load_image_file('04.jpg')
face = face_recognition.face_locations(image)

for face in face:
    top, right, bottom, left = face
    cnt = cnt+1
    face_image = image[top:bottom, left:right]
    cut_image = Image.fromarray(face_image)
    cut_image.show()
    cut_image.save(f'save/{cnt}.jpg')

2 - 1. 결과

'Computer Language > Python' 카테고리의 다른 글

파이썬 값 한 번에 여러 개 받기 (0)	2023.01.02
face_recognition 라이브러리 설치(dlib 설치/ 파이썬) (0)	2022.12.24
아나콘다 albumentations 설치 에러 (1)	2022.09.27
구글 코랩 (google colab) 자동완성, 독스트링(docstring) 설정하기 (0)	2022.08.23
판다스(Pandas) 행과 열 가지고 놀기 (0)	2022.06.29

face_recognition 라이브러리 설치(dlib 설치/ 파이썬)

2022. 12. 24. 08:31

사진에 얼굴만 추출하고 싶은데 찾아보니 face_recognition 라는 라이브러리가 있어서 사용해보려 합니다.

일단 간단히 pip install face_recognition 커맨드창에 쳐보니 역시나 간단히 설치되지 않는다.

설치환경

- 윈도우10

dlib가 없단다..

pip install dlib 역시 간단히 설치되지 않는다

dlib는 c++로 개발된 라이브러리 라서 cmake, visual studio가 필요하다.

1. cmaker 설치

https://cmake.org/download/

Download | CMake

Current development distribution Each night binaries are created as part of the testing process. Other than passing all of the tests in CMake, this version of CMake should not be expected to work in a production environment. It is being produced so that us

cmake.org

간단하게 설치파일로 설치했다

시스템 경로 추가 해주고

명령프롬프트(cmd)에서 cmake쳐보면 사용방법에 대해 나오면 설치가 완료된 것이다.

2. visual studio c++ 설치

https://visualstudio.microsoft.com/ko/visual-cpp-build-tools/

Microsoft C++ Build Tools - Visual Studio

Microsoft C++ Build Tools는 Visual Studio 없이 스크립트 가능한 독립 실행형 설치 관리자를 통해 MSVC 도구 집합을 제공합니다. 명령줄에서 Windows를 대상으로 하는 C++ 라이브러리 및 애플리케이션을 빌드

visualstudio.microsoft.com

visual studio 설치완료 후

3. pip install dlib

커맨드 창에 pip install dlib

시간이 생각보다 좀 걸린다.

추가 dlib 다운받아서 설치하기

dlib 공식 홈페이지

http://dlib.net/

dlib C++ Library

Dlib is a modern C++ toolkit containing machine learning algorithms and tools for creating complex software in C++ to solve real world problems. It is used in both industry and academia in a wide range of domains including robotics, embedded devices, mobil

dlib.net

왼쪽 하단에 Download dlib 클릭해서 C:\에 압축을 풀어준다

압축푼 경로에서 python setup.py install 해도 된다.

4. pip install face_recognition

잘 설치가 된다.

요약

1. cmake 설치

2. visual studio 설치

3. pip install dlib

4. pip install face_recognition

5. import face_recognition

face_recognition

'Computer Language > Python' 카테고리의 다른 글

파이썬 값 한 번에 여러 개 받기 (0)	2023.01.02
동일 인물 확인 및 이미지 얼굴 추출 (face_recognition) / 파이썬 (0)	2022.12.25
아나콘다 albumentations 설치 에러 (1)	2022.09.27
구글 코랩 (google colab) 자동완성, 독스트링(docstring) 설정하기 (0)	2022.08.23
판다스(Pandas) 행과 열 가지고 놀기 (0)	2022.06.29

아나콘다 albumentations 설치 에러

2022. 9. 27. 21:40

ERROR: Could not install packages due to an OSError: [WinError 5] 액세스가 거부되었습니다: 'C:\\Users\\user\\anaconda3\\Lib\\site-packages\\cv2\\cv2.pyd'
Consider using the `--user` option or check the permissions.

아나콘다 주피터에서 !pip install albumentations 으로 실행시 에러가 보인다.

아나콘다 프롬프트에서 python -m pip install --user albumentations 실행시 잘 설치 된다.

'Computer Language > Python' 카테고리의 다른 글

동일 인물 확인 및 이미지 얼굴 추출 (face_recognition) / 파이썬 (0)	2022.12.25
face_recognition 라이브러리 설치(dlib 설치/ 파이썬) (0)	2022.12.24
구글 코랩 (google colab) 자동완성, 독스트링(docstring) 설정하기 (0)	2022.08.23
판다스(Pandas) 행과 열 가지고 놀기 (0)	2022.06.29
판다스(Pandas) - 기본 개념 (0)	2022.06.28

구글 코랩 (google colab) 자동완성, 독스트링(docstring) 설정하기

2022. 8. 23. 14:17

주피터 노트북을 사용하다 코랩 사용 중 TAB 눌러도 자동완성 기능이 안 먹을 때 코랩에서 간단히 설정만 해주면 주피터노트북과 동일하게 사용할 수 있다.

요약)

설정 -> 편집기 -> 코드 완성 제안을 자동으로 표시 체크 해제

'Computer Language > Python' 카테고리의 다른 글

face_recognition 라이브러리 설치(dlib 설치/ 파이썬) (0)	2022.12.24
아나콘다 albumentations 설치 에러 (1)	2022.09.27
판다스(Pandas) 행과 열 가지고 놀기 (0)	2022.06.29
판다스(Pandas) - 기본 개념 (0)	2022.06.28
Numpy(넘파이) 속성 및 함수 훑어보기 (0)	2022.06.20

판다스(Pandas) 행과 열 가지고 놀기

2022. 6. 29. 12:44

Dataframe : 행과 열 조회

DataFrame.loc[[행이름1, 행이름2, ... ]]
DataFrame.iloc[[행인덱스1, 행인덱스2 ... ]]

df = pd.DataFrame( np.arange(1,26).reshape(5,5), 
                   index=[ 'row'+str(i) for i in range(1,6)], 
                   columns=[ 'col'+str(i) for i in range(1,6) ])

print(type(df), df.shape, df.size)
df

출력
<class 'pandas.core.frame.DataFrame'> (5, 5) 25

	col1	col2	col3	col4	col5
row1	1	2	3	4	5
row2	6	7	8	9	10
row3	11	12	13	14	15
row4	16	17	18	19	20
row5	21	22	23	24	25

원하는 행 출력

print(df.loc[['row1', 'row3', 'row5']]) #iloc로 출력 방법 df.iloc[[0, 2, 4]]

출력

col1 col2 col3 col4 col5

row1 1 2 3 4 5

row3 11 12 13 14 15

row5 21 22 23 24 25

원하는 행 범위 출력

print(df.iloc[2:5]) # loc로 출력 방법 df.loc['row2':'row4']

출력

col1 col2 col3 col4 col5

row2 6 7 8 9 10

row3 11 12 13 14 15

row4 16 17 18 19 20

원하는 열 출력

df.loc[:, ['col1','col3','col5']] #iloc로 출력 방법 df.iloc[:, [0,2,4]]

출력

col1 col3 col5

row1 1 3 5

row2 6 8 10

row3 11 13 15

row4 16 18 20

row5 21 23 25

원하는 열 범위출력

df.iloc[:, 1:4] # loc로 출력 방법 df.loc[:, 'col2':'col4']

출력

col2 col3 col4

row1 2 3 4

row2 7 8 9

row3 12 13 14

row4 17 18 19

row5 22 23 24

DataFrame 행,열 추가, 삭제

loc를 통해 없는 행 이름으로 추가할 수 있다.
iloc를 통해서는 추가할 수 없다.

행 추가

df.loc['row6'] = [26,27,28,29,30]
df

	col1	col2	col3	col4	col5
row1	1	2	3	4	5
row2	6	7	8	9	10
row3	11	12	13	14	15
row4	16	17	18	19	20
row5	21	22	23	24	25
row6	26	27	28	29	30

행 삭제

df = df.drop('row6')
df

	col1	col2	col3	col4	col5
row1	1	2	3	4	5
row2	6	7	8	9	10
row3	11	12	13	14	15
row4	16	17	18	19	20
row5	21	22	23	24	25

열 추가

df['col6'] = [26,27,28,29,30]
df

	col1	col2	col3	col4	col5	col6
row1	1	2	3	4	5	26
row2	6	7	8	9	10	27
row3	11	12	13	14	15	28
row4	16	17	18	19	20	29
row5	21	22	23	24	25	30

열 삭제

df.drop(columns=['col6'],inplace=True) #inplace True로 줄시 바로적용
df

	col1	col2	col3	col4	col5
row1	1	2	3	4	5
row2	6	7	8	9	10
row3	11	12	13	14	15
row4	16	17	18	19	20
row5	21	22	23	24	25

del df['col5']
df

	col1	col2	col3	col4
row1	1	2	3	4
row2	6	7	8	9
row3	11	12	13	14
row4	16	17	18	19
row5	21	22	23	24

'Computer Language > Python' 카테고리의 다른 글

아나콘다 albumentations 설치 에러 (1)	2022.09.27
구글 코랩 (google colab) 자동완성, 독스트링(docstring) 설정하기 (0)	2022.08.23
판다스(Pandas) - 기본 개념 (0)	2022.06.28
Numpy(넘파이) 속성 및 함수 훑어보기 (0)	2022.06.20
파이썬 html 정보 가져오기 크롤링(Web Crawling) (0)	2022.06.02

판다스(Pandas) - 기본 개념

2022. 6. 28. 09:43

판다스(Pandas) 란?

데이터 처리와 분석을 위한 파이썬 라이브러리
파이썬의 엑셀이라고 보면된다.
대표적으로 Series 와 DataFrame 클래스가 있다.
http://pandas.pydata.org

Series(시리즈)

Numpy는 데이터형이 하나만 지정될수 있지만 pandas는 혼합형이다.
리스트와 달리 인덱스 이름을 부여할 수 있다.
1차원 데이터만 다룸.

s1 = pd.Series(np.arange(20,25),index=['1번','2번','3번','4번','5번'])
s1

출력
1번 20
2번 21
3번 22
4번 23
5번 24
dtype: int32

s1.index, type(s1.index), list(s1.index) ,s1['3번']

출력
(Index(['1번', '2번', '3번', '4번', '5번'], dtype='object'),
pandas.core.indexes.base.Index,
['1번', '2번', '3번', '4번', '5번'],
22)

데이타프레임이란?

데이타를 표의 형태로 처리하는 자료구조이다.

s1 = ({'name':'홍길동','age':'24','gender':'male','mobile':'010-1234-4421'})
s2 = ({'name':'가길동','age':'42','gender':'female','mobile':'010-1122-3215'})
s3 = ({'name':'나길동','age':'51','gender':'male','mobile':'010-4321-2351'})
df =  pd.DataFrame([s1,s2,s3])
df

출력

name age gender mobile

0 홍길동 24 male 010-1234-4421

1 가길동 42 female 010-1122-3215

2 나길동 51 male 010-4321-2351

df = pd.DataFrame( np.arange(1,26).reshape(5,5), 
                   index=[ 'row'+str(i) for i in range(1,6)], 
                   columns=[ 'col'+str(i) for i in range(1,6) ])
df

출력

col1 col2 col3 col4 col5

row1 1 2 3 4 5

row2 6 7 8 9 10

row3 11 12 13 14 15

row4 16 17 18 19 20

row5 21 22 23 24 25

데이터프레임 속성

DataFrame변수.columns
DataFrame변수.index
DataFrame변수.values
dtype, shape, size

df = pd.DataFrame( np.arange(1,26).reshape(5,5), 
                   index=[ 'row'+str(i) for i in range(1,6)], 
                   columns=[ 'col'+str(i) for i in range(1,6) ])

print(type(df), df.shape, df.size)
print(df.index , df.columns)
df.values

출력

<class 'pandas.core.frame.DataFrame'> (5, 5) 25
Index(['row1', 'row2', 'row3', 'row4', 'row5'], dtype='object') Index(['col1', 'col2', 'col3', 'col4', 'col5'], dtype='object')
array([[ 1, 2, 3, 4, 5],
[ 6, 7, 8, 9, 10],
[11, 12, 13, 14, 15],
[16, 17, 18, 19, 20],
[21, 22, 23, 24, 25]])

'Computer Language > Python' 카테고리의 다른 글

구글 코랩 (google colab) 자동완성, 독스트링(docstring) 설정하기 (0)	2022.08.23
판다스(Pandas) 행과 열 가지고 놀기 (0)	2022.06.29
Numpy(넘파이) 속성 및 함수 훑어보기 (0)	2022.06.20
파이썬 html 정보 가져오기 크롤링(Web Crawling) (0)	2022.06.02
웹 크롤링(Web Crawling) 에러 , 304 에러 (0)	2022.06.01

Numpy(넘파이) 속성 및 함수 훑어보기

2022. 6. 20. 09:24

http://www.numpy.org

NumPy

Powerful N-dimensional arrays Fast and versatile, the NumPy vectorization, indexing, and broadcasting concepts are the de-facto standards of array computing today. Numerical computing tools NumPy offers comprehensive mathematical functions, random number g

numpy.org

파이썬 라이브러리중 하나
수학 및 통계, 과학 연산을 위한 파이썬 패키지

In [1]:

import numpy as np  #모듈 추가
np.__version__       #버전확인

Out[1]:

'1.21.5'

Numpy¶

파이썬 라이브러리중 하나
수학 및 통계, 과학 연산을 위한 파이썬 패키지
행열연산 가능

In [2]:

import numpy as np

버전 확인¶

In [4]:

np.__version__

Out[4]:

'1.21.5'

넘파이 배열만들기¶

-리스트 넘파이 배열화

In [5]:

m_list = [1, 2, 3, 4, 5]
type(m_list), m_list

Out[5]:

(list, [1, 2, 3, 4, 5])

In [6]:

arr = np.array(m_list)
type(arr), arr

Out[6]:

(numpy.ndarray, array([1, 2, 3, 4, 5]))

넘파이와 리스트 차이¶

- 리스트는 데이터형이 다중인 경우 -> 데이터형이 그대로 유지된다.

- 넘파이인 경우는 하나의 데이터형만 유지할 수 있다.
- 문자가 포함되어있는경우 문자형식이 우선으로 선택되며
- 실수와 정수만 있는경우 실수형식으로 선택된다.

-리스트는 데이터형 혼합가능

In [7]:

mylist = [0, 1, 3.5, 100, -6.7,'가나다']
mylist

Out[7]:

[0, 1, 3.5, 100, -6.7, '가나다']

In [8]:

arr = np.array([0, 1, 2, 3, 4, 5])
arr ,arr.dtype

Out[8]:

(array([0, 1, 2, 3, 4, 5]), dtype('int32'))

In [9]:

arr = np.array([0, 1, 2.5, -3, 4, 5.5])
arr , arr.dtype

Out[9]:

(array([ 0. ,  1. ,  2.5, -3. ,  4. ,  5.5]), dtype('float64'))

In [10]:

arr = np.array([0, 1, 2.5, -3, 4, 5.5, '가나다'])
arr

Out[10]:

array(['0', '1', '2.5', '-3', '4', '5.5', '가나다'], dtype='<U32')

In [11]:

arr = np.array([0, 1, 2.5, -3, 4, 5.5],dtype=int)
arr ,arr.dtype

Out[11]:

(array([ 0,  1,  2, -3,  4,  5]), dtype('int32'))

넘파이 초기화 함수¶

np.zeros([x, y]) : 0으로 구성된 2차원 numpy 배열
np.ones([x, y]) : 1로 구성된 2차원numpy 배열

In [12]:

arr = np.zeros(5)
arr1 = np.zeros([5,5])

arr, arr1

Out[12]:

(array([0., 0., 0., 0., 0.]),
 array([[0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.]]))

In [13]:

arr = np.ones([2,3],type(int))
arr

Out[13]:

array([[1, 1, 1],
       [1, 1, 1]], dtype=object)

np.full([x, y], 초기값) : 모든 요소를 지정한 값으로 지정하는 2차원 numpy 배열

In [14]:

arr = np.full(5,3)
arr1 = np.full([5,5],10)
print(arr)
print('='*30)
print(arr1)

[3 3 3 3 3]
==============================
[[10 10 10 10 10]
 [10 10 10 10 10]
 [10 10 10 10 10]
 [10 10 10 10 10]
 [10 10 10 10 10]]

np.eye(갯수) : 대각선의 원소가 모두 1이고 나머지 원소는 모두 0으로 정사각형인 2차원 Numpy 배열 : 행과 열의 갯수가 같다
np.tri(갯수) : 대각선을 기준으로 삼각형 형태의 1로 지정되는 정사각형 2차원 Numpy 배열

In [15]:

np.eye(4, dtype=int)

Out[15]:

array([[1, 0, 0, 0],
       [0, 1, 0, 0],
       [0, 0, 1, 0],
       [0, 0, 0, 1]])

In [16]:

np.tri(3, dtype=int)

Out[16]:

array([[1, 0, 0],
       [1, 1, 0],
       [1, 1, 1]])

넘파이 배열의 속성¶

shape : 배열의 크기 확인
ndim : 배열의 차원 확인하기
size : 배열의 전체 크기 확인하기

In [17]:

arr = np.full([3,3],5)
print(arr)
print(f'shape : {arr.shape} \ndim : {arr.ndim} \nsize : {arr.size} \nlen : {len(arr)}')

[[5 5 5]
 [5 5 5]
 [5 5 5]]
shape : (3, 3) 
dim : 2 
size : 9 
len : 3

-np.linspace(start,end,n) : 범위내에서 n개를 균등간격으로 생성

In [18]:

np.linspace(10, 100, 5, dtype=int)

Out[18]:

array([ 10,  32,  55,  77, 100])

-np.arange(start,end,step) : Numpy배열. end-1 까지만 생성

In [19]:

np.arange(10,20,2)

Out[19]:

array([10, 12, 14, 16, 18])

Numpy 배열의 크기 변경¶

.resize(X,Y, refcheck=False) 배열 크기 변경
.reshape(X,Y) 행열 재정의
.T는 Transpose. 행과 열이 서로 변경된다.
.swapaxes(축1,축2)

In [20]:

arr =np.array([[1,2,3],[4,5,6]])
arr

Out[20]:

array([[1, 2, 3],
       [4, 5, 6]])

-.resize(X,Y, refcheck=False) 사이즈 조절

In [21]:

arr.resize(2,2,refcheck=False)
arr

Out[21]:

array([[1, 2],
       [3, 4]])

In [22]:

arr.resize(4, 2 , refcheck=False)
arr

Out[22]:

array([[1, 2],
       [3, 4],
       [0, 0],
       [0, 0]])

-.reshape(X,Y) 행열 재정의

reshape, resize 의 차이¶

resize 빈공간이거나 초과하는 공간은 날리거나 0으로 채우지만
reshape 값 내의 행열을 재정의 한다.

In [23]:

arr = arr.reshape(2,4)
arr

Out[23]:

array([[1, 2, 3, 4],
       [0, 0, 0, 0]])

-.T는 Transpose. 행과 열이 변경된다.

In [24]:

arr= arr.T
print(arr)
arr = arr.T
print(arr)

[[1 0]
 [2 0]
 [3 0]
 [4 0]]
[[1 2 3 4]
 [0 0 0 0]]

-.swapaxes(축1,축2)

In [25]:

print(arr.swapaxes(0,1))
print(arr.swapaxes(1,1))

[[1 0]
 [2 0]
 [3 0]
 [4 0]]
[[1 2 3 4]
 [0 0 0 0]]

Numpy 배열의 값 삽입하기¶

np.insert(배열명, 인덱스, 값) : 1차원 배열의 인덱스에 해당하는 값 삽입
np.insert(배열명, 인덱스, 값, axis=0/1) : 2차원 배열의 인덱스에 해당하는 값 삽입
축(axis)를 지정하지 않으면 1차원 배열로 반환

In [26]:

arr = np.arange(8).reshape(4,2)
arr

Out[26]:

array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7]])

In [27]:

# axis 값이 없으면 1차원으로 변환된후 값이 추가 된다.
np.insert(arr, 0 , [100, 200])

Out[27]:

array([100, 200,   0,   1,   2,   3,   4,   5,   6,   7])

In [28]:

np.insert(arr, 0 , [300, 500], axis=0)

Out[28]:

array([[300, 500],
       [  0,   1],
       [  2,   3],
       [  4,   5],
       [  6,   7]])

In [29]:

np.insert(arr, 0 , [-1, -2, -3, -4], axis=1)

Out[29]:

array([[-1,  0,  1],
       [-2,  2,  3],
       [-3,  4,  5],
       [-4,  6,  7]])

Numpy 배열의 값 삭제하기¶

np.delete(배열명, 인덱스) : 1차원 배열에서 특정 인덱스에 해당하는 값 삭제
np.delete(배열명, 인덱스, axis=0/1) : 2차원 배열에서 인덱스에 해당하는 값 삭제.
축(axis)를 지정하지 않으면 1차원 배열로 반환
삭제할 방향을 axis로 지정

In [30]:

arr = np.arange(1,21).reshape(4, 5)
arr 

Out[30]:

array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10],
       [11, 12, 13, 14, 15],
       [16, 17, 18, 19, 20]])

In [31]:

# 2차원에서 축을 지정하지 않는다면? (axis)
# 1차원으로 변경된 후 해당 인덱스가 삭제 
np.delete(arr, 0)

Out[31]:

array([ 2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17, 18,
       19, 20])

In [32]:

np.delete(arr, 0, axis=0)

Out[32]:

array([[ 6,  7,  8,  9, 10],
       [11, 12, 13, 14, 15],
       [16, 17, 18, 19, 20]])

In [33]:

np.delete(arr, 0, axis=1)

Out[33]:

array([[ 2,  3,  4,  5],
       [ 7,  8,  9, 10],
       [12, 13, 14, 15],
       [17, 18, 19, 20]])

'Computer Language > Python' 카테고리의 다른 글

판다스(Pandas) 행과 열 가지고 놀기 (0)	2022.06.29
판다스(Pandas) - 기본 개념 (0)	2022.06.28
파이썬 html 정보 가져오기 크롤링(Web Crawling) (0)	2022.06.02
웹 크롤링(Web Crawling) 에러 , 304 에러 (0)	2022.06.01
파이썬[python] 큰따옴표(쌍따옴표) , 따옴표 활용 및 출력 (0)	2022.03.22

파이썬 html 정보 가져오기 크롤링(Web Crawling)

2022. 6. 2. 15:34

웹 정보를 정적으로 간단하게 BeautifulSoup를 통해 정보를 긁어 올 수 있다.

yes24의 홈페이지에서 베스트셀러 1~10위를 가져오는 방식으로 예를 보여 드리겠습니다.

http://www.yes24.com/Main/default.aspx

YES24

YES24는 대한민국 1위 인터넷 온라인서점입니다. 국내 최대의 도서정보를 보유하고 있으며 음반, DVD, 공연까지 다양한 문화콘텐츠 및 서비스를 제공합니다.

www.yes24.com

우측 빨간 상자안에 순위와 제목을 가져오도록 하겠습니다.

requests로 원하는 웹의 소스코드를 받아온다.

res.text를 출력해보면 잘 넘어온 걸 볼 수 있다.

만약 Response가 304로 넘어올 경우

304 응답 코드 해결 참고하면 된다.

웹에서 관리자 모드를 통해 베스트셀러 부분 소스 트리를 볼 수 있다.

soup.select를 통해 li태그에. tp02 클래스를 긁어 오면 li 태그 안에 strong 태그 부분에

순위와 제목이 포함되어 있는 걸 알 수 있다.

len을 통해 li. tp02 태그의 개수를 확인하니 10개가 맞다.

select를 통해 순위, 제목을 긁어오고 있다.

book리스트 안에 리스트로 순위와 책을 저장하고 잘 들어갔는지 출력을 찍어 보니 잘된다.

pandas를 이용해 데이터 프레임으로 깔끔하게 출력할 수 있다.

마지막으로 데이터를 csv파일 및 엑셀로 뽑아낼 수도 있다.

'Computer Language > Python' 카테고리의 다른 글

판다스(Pandas) - 기본 개념 (0)	2022.06.28
Numpy(넘파이) 속성 및 함수 훑어보기 (0)	2022.06.20
웹 크롤링(Web Crawling) 에러 , 304 에러 (0)	2022.06.01
파이썬[python] 큰따옴표(쌍따옴표) , 따옴표 활용 및 출력 (0)	2022.03.22
파이썬[Python] 아나콘다 설치하기 (0)	2022.03.18

웹 크롤링(Web Crawling) 에러 , 304 에러

2022. 6. 1. 22:37

헤더 정보에 유저 정보를 넘김으로 해결할 수 있다.

웹 크롤링 중 소스가 안 가져와 확인해보니

304 응답이 올 시 헤더에 유저 에이전트 정보 값을 넘겨줌으로써 해결한다.

UserAgentString.com - Chrome version 101.0.4951.64

UserAgentString.com - unknown version

www.useragentstring.com

유저 정보를 알 수 있는 사이트다.

url='사이트 주소'
user_agent_info = '유저 정보'
headers = {'User-Agent' : user_agent_info}
res = requests.get(url, headers = headers)
res.text

'Computer Language > Python' 카테고리의 다른 글

Numpy(넘파이) 속성 및 함수 훑어보기 (0)	2022.06.20
파이썬 html 정보 가져오기 크롤링(Web Crawling) (0)	2022.06.02
파이썬[python] 큰따옴표(쌍따옴표) , 따옴표 활용 및 출력 (0)	2022.03.22
파이썬[Python] 아나콘다 설치하기 (0)	2022.03.18
파이썬[Python] 대문자, 소문자 알파벳 리스트 (0)	2022.03.08

PREV 이전 1 2 NEXT 다음

	name	age	gender	mobile
0	홍길동	24	male	010-1234-4421
1	가길동	42	female	010-1122-3215
2	나길동	51	male	010-4321-2351

Computer Language/Python

1. 하나씩 입력 받기

2. 한 번에 여러 개 입력 받기

3. 반복문을 이용해 동적변수에 값 받기

'Computer Language > Python' 카테고리의 다른 글

1. 동일인물 확인

1 - 1. 이미지 샘플

1 - 2. 소스코드

1 - 3. 결과

2. 이미지 얼굴 부분 추출

2 - 1. 소스코드

2 - 1. 결과

'Computer Language > Python' 카테고리의 다른 글

'Computer Language > Python' 카테고리의 다른 글

'Computer Language > Python' 카테고리의 다른 글

'Computer Language > Python' 카테고리의 다른 글

Dataframe : 행과 열 조회

원하는 행 출력

원하는 행 범위 출력

원하는 열 출력

원하는 열 범위출력

DataFrame 행,열 추가, 삭제

'Computer Language > Python' 카테고리의 다른 글

판다스(Pandas) 란?

Series(시리즈)

데이타프레임이란?

데이터프레임 속성

'Computer Language > Python' 카테고리의 다른 글

Numpy¶

버전 확인¶

넘파이 배열만들기¶

넘파이와 리스트 차이¶

넘파이 초기화 함수¶

넘파이 배열의 속성¶

Numpy 배열의 크기 변경¶

reshape, resize 의 차이¶

Numpy 배열의 값 삽입하기¶

Numpy 배열의 값 삭제하기¶

'Computer Language > Python' 카테고리의 다른 글

'Computer Language > Python' 카테고리의 다른 글

'Computer Language > Python' 카테고리의 다른 글

티스토리툴바