[크롤링(Crawling) – 3] 수집한 기사 정리하기 (Pandas, Dataframe)

0

이전에 설명드린 [파이썬(python) 크롤링(Crawling) – 2] 업무 효율 극대화! 인터넷 기사 추출 자료에서 나온 결과를 정리하려 합니다.

데이터를 정리하는 방법으로 이용할 툴은 pandas입니다.

우선, 정보를 살펴보면

[‘추미애 현수막 찢은 한국당… “검찰 인사는 폭거, 본회의 불참”‘,
‘김연철 “남북 철도·도로 연결 정밀조사 준비”’,
‘‘호르무즈 파병’ 신중 모드…다른 이슈 연계 가능성은?’,
‘‘추미애 방지’ 공약낸 한국당…‘인사 추천권은 장관 아닌 총장에게’’,
‘추미애 “인사의견 내라 지시…윤석열 총장이 거역”‘,
‘방산주 급등락에 개미투자자만 또 눈물’,
… 등등]

리스트에 들어있습니다. 위 리스트를 보기 쉽게 가로(row)/세로(column)로 정리해 보겠습니다.

필요한 코드는 DataFrame을 이용합니다.

#판다스 불러오기, pandas를 pd로 요약하기
import pandas as pd

#판다스의 데이터프레임에 리스트 저장하기
df = pd.DataFrame(data = main_news, columns = ["메인기사"])

#출력
df
[크롤링(Crawling) – 3] 수집한 기사 정리하기 (Pandas, Dataframe)

결과는 다음과 같이 깔끔하게 나타납니다.

또한 다음 코드를 이용하면 엑셀 파일로도 저장됩니다.

#엑셀파일로 저장하기
df.to_excel("main_news.xlsx")

회신을 남겨주세요

귀하의 의견을 입력하십시오!
여기에 이름을 입력하십시오.