robots.txt 크롤링 가능 범위를 작성한 파일이다. 현재 블로그의 url 주소는 https://denev6.tistory.com/이고 https://denev6.tistory.com/robots.txt에 해당 내용이 정리되어 있다. User-agent: * Disallow: /owner Disallow: /manage Disallow: /admin Disallow: /oldadmin Disallow: /search Disallow: /m/search Disallow: /m/admin Disallow: /like Allow: / ... User-agent: *는 모든 유저를 뜻하고, Disallow에 제시된 URL을 제외하고 모든 범위를 허용(Allow)하겠다는 의미이다. Requests import..
Linear / Polynomial Regression을 Python을 이용하여 구현해 봅니다. x = [2, 3, 6, 7, 8, 10, 14, 15, 16, 17] y = [2, 4, 4, 9, 10, 6, 10, 13, 18, 14] 위와 같은 2차원 데이터가 있다면 x 값이 7일 때, y 값은 9인 것을 알 수 있다. 만약 x가 13일 때, y 값이 무엇일지 예측하는 방법으로 Regression을 사용할 수 있다. 아이디어 (SLE) 자세한 수학적 설명보다는 전체적인 흐름을 중심으로 설명합니다. Linear Linear Regression : 선형 회귀 선형 회귀는 주어진 데이터들이 직선 형태의 패턴을 가지고 있을 것이라고 가정한다. 그리고 1차 함수 중 데이터와의 거리(에러)가 가장 가까운(작은..
시퀀스(sequence)는 데이터를 순서대로 나열한 형태로 파이썬에서는 문자열, 튜플, 리스트, 바이트 배열, 바이트가 있다. 시퀀스 타입 멤버십 연산: in 키워드를 통해 내부에 있는 데이터를 확인할 수 있다. 0 in [0, 1] >>> True 크기: 크기를 가지며, len() 함수를 사용할 수 있다. len([0, 1, 2]) >>> True 슬라이싱: [시작:끝:스텝]을 통한 슬라이싱을 사용할 수 있다. a = [0, 1, 2] a[0:2] >>> [0, 1] 반복성(iterability): 반복문에 활용할 수 있다. for i in [0, 1, 2]: pass 문자열 문자열(str)은 "" 또는 ''로 표현되며 불변형이다. type("abc") >>> f-string은 변수를 문자열 내부에서 ..