CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) – rodzaj techniki stosowanej jako zabezpieczenie na stronach www, celem której jest dopuszczenie do przesłania danych tylko wypełnionych przez człowieka. (wikipedia)

Program ten ma kilka zastosowań:
•    Zapobiega reklamom w komentarzach na blogach. Każdy kto prowadzi bloga zaznajomił się już z fałszywymi komentarzami umieszczanymi głównie w celu podniesienia rangi w wyszukiwarkach np.: „sprawdź tutaj” „kliknij” lub z bezpośrednio umieszczanymi anchorami np.: „obecnie kurtki zimowe są bardzo drogie”. Dzięki zastosowaniu CAPTCHA tylko ludzie mogą umieszczać komentarze, natomiast procent nieuzasadnionych reklam umieszczanych przez automaty jest o wiele mniejszy.
•    Chroni portale przed zakładaniem profili (kont) przez automaty
•    Chroni fora przed spamem w komentarzach, który również ma na celu podniesienie rangi w wyszukiwaniach
•    Zapobiega przed automatycznymi zapytaniami w usłudze whois

Jak to działa
Program  rozpoznaje człowieka poprzez stawianie zadań i oczekując ich rozwiązania.
Najczęściej stosowanym zabezpieczeniem jest odczytywanie treści z obrazka (zazwyczaj losowo dobranych znaków bądź krótkiego wyrazu). Obrazek ten jest możliwy do odczytania przez człowieka, jednakże odczytanie go przez komputer jest, przynajmniej w założeniu, bardzo trudne.

Odmianą graficznego CAPTCHA jest system Asirra[1], w którym należy spośród zdjęć różnych zwierząt wybrać np. kota.
Inną metodą implementacji zabezpieczenia CAPTCHA jest podawanie zadania tekstowego, np. „Oblicz ile to jest dwa plus dwa”, „Podaj rok bitwy pod Grunwaldem”, „Podaj wzór chemiczny wody”.

Istnieje wiele innych implementacji i odmian CAPTCHA, w tym rozwiązania dźwiękowe (system odczytuje zadanie) oraz inne mieszane z wyżej wymienionych – np. połączenie graficznych i tekstowych. System może zadać pytanie dźwiękowe „podaj jakiego koloru jest czapka na podanym zdjęciu”. Istnieją także systemy wykorzystujące sekwencje wideo (NuCAPTCHA[2]).
Jak każdy program CAPTCHA ma zarówno zwolenników, jak i przeciwników. Przeciwnicy uważają, iż CAPTCHA jest utrudnieniem dla niewidomych internautów oraz tych, którzy mają wyłączone wyświetlanie obrazków bądź też korzystają z przeglądarek tekstowych.
Typowym błędem technicznym CAPTCHA jest taka konstrukcja obrazów, że są one bardzo trudne do rozwiązania, a niekiedy nie do odczytania przez ludzi. Natomiast zapytania tekstowe niejednokrotnie zmuszają nas do poszukiwania odpowiedzi w Internecie.
Jako ciekawostkę można dodać że korzystając z CAPHTA, użytkownicy Internetu przekształcają na postać cyfrową 1,5 miliona książek rocznie. W jaki sposób?
Luis von Ahn wpadł na pomysł aby zabezpieczenie podawało użytkownikowi dwa słów z tym zastrzeżeniem że jedno z nich na pewno jest rozpoznawane natomiast drugie oprogramowanie OCR nie może rozpoznać.
Użytkownik nie wie jednak które ze słów jest znane zabezpieczeniu a które nie. W ten sposób wpisuje obydwa słowa poprawnie.  Następnie można założyć iż wpisując jedno słowo poprawnie drugie także jest poprawne. Porównując dane  od wielu użytkowników, system wybiera  w pełni poprawną interpretację nieznanego słowa. I to wszystko za darmo.

Jak to obejść?
Programy do rozpoznawania treści obrazków CAPTCHA są coraz doskonalsze. W efekcie same obrazki będą musiały być coraz bardziej skomplikowane, a my będziemy mieli coraz większe problemy z ich odczytaniem.
Inni spamerzy obchodzą to zabezpieczenie przy pomocy… ludzi. Celują w tym właściciele serwisów XXX. Gdy w takim serwisie rejestruje się kolejny napaleniec, podsuwa mu się CAPTCHA, kod rzekomo wymagany do rejestracji. Z tym, że obrazek został pobrany ze stron Yahoo. Klient wpisuje kod z obrazka, a skrypt na stronie wykorzysta ten kod do założenia kolejnego spamerskiego konta na Yahoo.
Istnieją także doniesienia, że do rozwiązywania zadań CAPTCHA zatrudniane są osoby z biednych rejonów Azji i Rosji. Poniżej przykładowe stawki.

Przyszłość CAPTCHA
Rozwiązaniem problemu coraz trudniejszych obrazków jest CAPTCHA głosowe, ale ten pomysł również skazany jest na niepowodzenie, ponieważ co z osobami, które nie mają karty dźwiękowej lub po prostu wyłączyły dźwięk?
Dobrym rozwiązaniem są testy matematyczne. Coraz częściej można spotkać zapytanie: ile jest 2 dodać 6 i muszę przyznać że jest to jedyna forma CAPTCHA, przy której nie wpatruję się w monitor z odległości kilku centymetrów.
CAPTCHA – wygoda właścicieli serwisów internetowych.
Tak naprawdę, stosowanie obrazków CAPTCHA w serwisach to przenoszenie ciężaru walki ze spamem na użytkownika.  Z jakiej racji to my mamy chronić potencjalną stronę poprzez przepisywanie znaczków, odpowiadanie na pytania, czy rozwiązywanie zadań.
Każde wpisanie kodu to min 5 sekund, a jak wiemy – czas to pieniądz. Sumując każdą sekundę  jaką straciliśmy na przepisanie słowa bądź rozpoznanie obrazka, daje nam już godziny, a nawet dni.
Oby nie doszło do sytuacji, gdy przy próbie otwierania jakiejkolwiek strony będziemy musieli niestety stracić trochę czasu na rozpoznanie CAPTCHA.
Miejmy nadzieję, że programy do rozpoznawania treści obrazków CAPTCHA będą coraz doskonalsze.

 

Karol Bocheński

Źródła:

http://www.webaudit.pl/blog/2006/captcha-nie-uzywaj/

http://pl.wikipedia.org/wiki/CAPTCHA

http://www.ntii.pl/?s=ciekawostki-z-branzy-IT;captcha-przeklenstwo-czy-dobrodziejstwo,2

http://www.captcha.net/