Dev metacog/DevCaJournal3 word cloud 개발일지 ㅇ 핵심 기능 : 데이터 읽기, 데이터 클렌징(replace함수), WordCloud(wordcloud 패키지), masked word cloud # 파일 쓰기 # # f = open("test.txt", "w", encoding="utf-8") # f.write("안녕, 스파르타!\n") # for i in [1,2,3,4,5]: # f.write(f'{i} 번째 좋아요\n') # # f.close() # 파일 읽기 # with open("test.txt", "r", encoding="utf-8") as f: # lines = f.readlines() # for line in lines: # print(line) # # # 파일 읽기 # text = '' # with open("test.txt", "r.. 2021. 9. 16. web crawl 개발일지 ㅇ 핵심 기능 : openpyxl, append, 웹브라우저의 검사 기능과 엘리먼트 파악 - thumbnail = article.select_one('a > img')['src'] from bs4 import BeautifulSoup from selenium import webdriver driver = webdriver.Chrome('chromedriver') from openpyxl import Workbook wb = Workbook() ws1 = wb.active ws1.title = "articles" ws1.append(["제목", "링크", "신문사", "썸네일"]) url = "https://search.naver.com/search.naver?&where=news&query=추석" dri.. 2021. 9. 15. img crawl 개발일지 개발 흐름 - 필요한 패키지 import : dload(그림저장), BeautifulSoup(웹읽기), webdriver(브라우저기동), time(sleep동작) 핵심 스킬 - 브라우저의 '검사' 기능 이용 copy>selector 사용 반복부 찾기 : thumnails = soup.select('#imgList > div > a > img') - 저장할 폴더를 포맷팅 기능으로 적용 : dload.save(img, f'imgs_homework/{i}.jpg') - 구글 webdriver : https://chromedriver.storage.googleapis.com/index.html?path=93.0.4577.63/ import dload from bs4 import BeautifulSoup from.. 2021. 9. 14. 이전 1 다음