전체 글
-
-
-
크롤링(Crawling)
Web Programming 2023. 2. 17. 16:37인터넷에 데이터가 방대해지면서 우리는 그걸 활용할 필요성이 높아졌습니다. 그런 정보들을 우리가 분석하기 쉽고 활용하기 쉽게 끔 데이터를 수집하는 행위를 크롤링(Crawling) 이라고 하고 크롤링하는 프로그램을 크롤러(Crawler) 라고 합니다. 원하는 데이터를 추출하는 스크래핑(Scraping)과 개념이 혼동되기도 하는데요. 사실 크롤링의 정확한 정의는 다양한 웹사이트의 페이지를 브라우징하는 작업을 말합니다. 그런데 사실상 정보를 수집하기 위해선 브라우징만 하지 않죠. 페이지 안에 있는 데이터를 추출해서 가공하는게 대부분 최종 목표입니다. 결국 크롤링 => 스크래핑의 과정으로 넘어가는 거죠. 그래서 이 두 개념이 혼용되는 것 같습니다. 해외에서는 주로 스크래핑이라고 쓰는 걸로 알고 있습니다. ..
-
CI , DI 차이와 문제점
Web Programming 2023. 2. 17. 16:36간략하게 말하면 CI 는 개인별로 고유하게 부여하기 때문에 유일하고 DI 는 인증업체별로 부여하기 때문에 업체별로는 고유하나 각각 다르다. CI는 Connecting Information의 약자로 우리말로 '연계정보'라 부른다 본인 확인기관 등에서 개인별로 고유하게 부여하는 개인 식별정보로 어느 업체에서 발급해도 유일하게 발급되므로 이 값이 같으면 동일인으로 판단할 수 있다. 주민등록번호 수집이 금지되면서 인터넷 서비스업체에서는 휴대폰본인인증, 공인인증, 신용카드 인증을 통해 CI를 제공받고 있으며 주민등록번호를 대신해 고객을 구별하는 데이터로 사용하고 있다. ※ CI 값 CI는 88byte로 영어 대소문자와 특수문자의 조합으로 표현 ※ DI DI는 Duplication Information의 약..
-
크로스 사이트 스크립팅 XSS
Web Programming 2023. 2. 17. 16:34와 같이 작성 쿠키를 빼낼 때 사용할 수 있는 스크립트(쿠키에는 세션정보가 포함되어 있음) 만약 해커가 일반 게시판 글쓰기 상태에서 위와 같은 스크립트 코드를 작성해 놓으면 document.cookie 로 쿠키 정보를 얻어내고 얻어낸 정보를 document.location 위치(외부사이트)에 전달 할 수 있게 된다. src 를 이용하여 외부의 자바스크립트를 페이지 내에 삽입 시킬 수 있음 -> 외부 해커사이트 올려둔 악성 스크립트 파일을 실행 할 수가 있게 됨. XSS 공격이란 클라이언트 쪽의 웹브라우저를 공격하는 기법으로 와 같은 입력 값이 그대로 웹페이지에 표시되게 되면 위험하다. 위의 방법으로 해커가 쿠키 정보(세션정보가 포함)를 얻게 되면 사용자로 접속 할 수 있게 되며 특히 관리자 계..