CAPTCHA(Completely Automated Public Turing test to
tell Computers and Humans Apart, 완전 자동화된
사람과 컴퓨터 판별, 캡차)는 HIP(Human Interaction
Proof) 기술의 일종입니다
이 기술이 나오게된 계기는 1999년 11월, Slashdot
(http://www.slashdot.org/ )에서 어떤 학교에서
컴퓨터 공학을 전공하는 것이 가장 좋은지를 묻는
온라인 투표를 실시했는데 대부분의 온라인
투표처럼 한 사용자가 여러번 투표하는 것을 막기
위해 투표자의 아이피 주소가 기록해서 확인했다고
하는데요
카네기 멜론 대학의 한 학생이 카네기 멜론 대학에
중복 투표할 수 있는 프로그램을 만들어 카네기
멜론 댓글의 순위가 급속도로 상승했고, 다음날
매사추세츠 공과대학 학생들도 다중 투표 프로그램
을 만들어 투표하기 시작했다고 합니다
결국 투표는 봇들의 투표경쟁이 되어 매사추세츠
공과대학이 21156표, 카네기 멜론 대학이 21032표로
투표를 마감했고 나머지 학교들은 1000표도 넘지 못했
었다고 하죠
이러한 투표결과는 신뢰성이 떨어져 의미가 없었고
때문에 믿을 수 있는 투표결과를 위해, 사람만이 투표할
수 있도록 온라인 선거 과정에 CAPTCHA를 사용하도록
CAPTCHA가 만들어진 계기가 되기도 했다고 합니다
한국 홈페이지에서는 많이 볼수가 없는데...
이 캡챠라는건... 뭔가 오픈된 게시판 같은데 글을 쓰는
경우 주로 필요한데요
한국 홈페이지들은 회원가입(주민등록번호도 수집하고...)
해야 로그인이 되고 그후에야... 가능하고...
주민등록번호가 없는 외국인은 꽤나 가입이 어렵죠
요즘은 많이 달라졌다지만....
그래도 이메일 주소만 있으면 가입가능한 해외 사이트와는
좀 차이가 많이 있습니다
캡챠의 종류도 텍스트 CAPTCHA,덧셈을 요구하는 수학 CAPTCHA
오디오 CAPTCHA,이미지 CAPTCHA,슬라이드 CAPTCHA,
드래그 앤드 드롭을 활용한 CAPTCHA,사람의 얼굴과 이름을 매치
시키는 소셜 CAPTCHA, 커서가 이동한 경로를 확인하는 동작
CAPTCHA(motion CAPTCHA) 등도 있다고 합니다
캡챠를 뚫기위해서 프로그램을 개발하는 쪽에서는
언캡챠(unCaptcha)도 꾸준히 하고 있다고 하는데요
개발하면 뚫리고 막고 하는 과정을 꾸준히 하고 있다고
하네요
뭐... 구글이 지원하는 reCAPTCHA 경우는...
컴퓨터의 인공지능 발전을 위해서 사람의 힘을
이용하는 예인데요
reCAPTCHA는 두 개의 암호코드를 제시하는데
하나는 컴퓨터가 이미 답을 알고 있는 단어이지만
다른 하나는 서적을 텍스트화 하는 도중 OCR이
인식하지 못한 단어를 제시합니다
사용자가 두 단어를 모두 입력하면 컴퓨터는 이미
답을 아는 단어로 대상이 사람인지를 확인하고
대상이 사람이라고 판정된 경우 나머지 단어 또한
정답으로 판단하면서 ...
이렇게 인식하지 못한 한 단어를 여러 번 반복해서
테스트한 뒤 높은 비율로 입력된 단어를 선택해
책을 텍스트화하는 데에 적용하게 된다고 합니다
이렇게 고서적이나 전자문서화 되지못한 서적을
전자문서로 만드는거죠
그러면서... 인공지능도 키우고... ...
그런데...
의외로...
캡챠를 우회하기 위해서....
사람을 쓰는 경우도 있다고 하네요
원래 캡챠가 컴퓨터인지 사람인지를 구분하기
위한 목적인데... 진짜 사람이라면... 구분에 의미가
없는데요
이렇게 저렴한 노동력을 이용해서 우회해서 사용한다고
하는군요
스팸메일을 보내는게 여전히 돈이 되기때문일까요?
뭐... 전에 4차 산업혁명의 인형눈붙이기라면서
인공지능을 훈련시키기 위해서 하나 하나 지도학습
시키는데 꽤나 인력이 많이 들어간다라고...
이야기를 한적이 있었는데.. 캡챠 우회를 위한
부분도 인력으로 ... 해결한다니...
재미있는 사실이네요