Code Snippets/파이썬 (3) 썸네일형 리스트형 [파이썬] 리스트에서 중복 값을 제거하는 2가지 방법 데이터 전처리 중 가장 자주 나오는 유형이 '중복된 값 제거'이다. 리스트에서 중복 값을 제거하는 2가지 방법이 있는데, 보통 이 중 첫번째 방법만 안다. 방법 1 : Set으로 전환한 후, 다시 리스트로 바꾸기 파이썬 자료형 중 Set을 이용한 방법이다. 중복 자료를 허용하지 않는 집합 자료형(Set)의 특징을 이용한 것이다. ## 방법 1) set으로 바꾼 후 다시 list로 변환 duplicate_list = ['안','녕','하','세','요','세','요'] cleaned_list = list(set(duplicate_list)) 하지만 집합 자료형은 중복 자료도 허용하지 않고, 자료 순서도 고려하지 않는다. 그래서 리스트의 원래 순서가 유지되지 않는 경우가 많다. 방법 2: dict.fromk.. [파이썬-Pyautogui] 사용자가 직접 마우스 위치 설정하기 Pyautogui를 이용하여 마우스 클릭 매크로를 만들다 보면 한가지 어려운 점이 발생한다. 이 매크로를 사용하는 사용자마다 컴퓨터 모니터나 해상도가 달라서, 어떤 버튼이 위치한 x좌표와 y좌표를 고정시키기가 어렵다. 그래서 그 버튼의 위치를 opencv를 연동한 screenshot 기능으로도 찾을 수 있지만, 실제로 사용해보니 정확도가 많이 낮다. 그보다는 사용자가 직접 매크로를 사용하기 전, 특정 버튼의 위치를 저장할 수 있도록 하는 함수를 만들어 보는게 좋을 것 같다는 생각에서 아래와 같이 만들어 보았다. import pyautogui import time def save_locations(): message = "마우스 초기 설정을 시작합니다. 우측 상단의 카메라에 마우스를 위치합니다 (5초 후 .. [파이썬-셀레니움] 셀레니움 속도 향상을 위한 5가지 팁 셀레니움으로 크롤링을 하다 보면 보다 빠르게 크롤링을 하고 싶을 때가 있다. 이 경우 아래 5가지 팁을 활용하면 속도를 향상시킬 수 있다. 1. 드라이버를 Headless로 만들기 셀레니움을 그냥 작동시키면 브라우져가 새로운 창에서 열리는 것을 볼 수 있다. 이 창이 없는 상태로 셀레니움이 돌아가는 것을 'Headless'라고 하는데, 이렇게 설정하면 속도를 향상시킬 수 있다. from selenium.webdriver.chrome.options import Options chrome_options = Options() # headless 설정 chrome_options.headless = True 2. Pageload Strategy 설정 변경 셀레니움 드라이버의 설정에서 Pageload strateg.. 이전 1 다음