Archiwum

Posty oznaczone ‘reCAPTCHA’

Kody CAPTCHA – co to jest i skąd się wzięło

W związku z wprowadzeniem CAPTCHA do usługi bezpłatnego dostępu do Internetu Aero2 wiele osób zadaje sobie pytanie, skąd wzięły się te nielubiane kody, do czego służą i dlaczego się tak dziwnie nazywają. Postanowiłem przejrzeć historię tego rozwiązania, wyjaśnić kwestię zastosowań oraz przyjrzeć się rozwiązaniu stosowanemu przez Aero2, czyli systemowi reCAPTCHA firmy Google, który ma wiele ciekawych cech.

Wszystko jednak zaczęło się od… pewnego telegramu wysłanego jeszcze w XIX wieku.

Zapraszam do lektury.

Czytaj dalej…

Kategorie:Wiadomości

Aero2 może zauważalnie obciążyć serwery reCAPTCHA

Logo reCAPTCHAOkazuje się, że przy maksymalnym potencjalnym ruchu w sieci Aero2 może być jednym z największych jednostkowych „klientów” systemu reCAPTCHA na świecie. Na swojej stronie w często zadawanych pytaniach reCAPTCHA mówi, że dziennie obsługuje nawet 100 milionów kodów.

Policzmy, ile kodów dziennie może wygenerować usługa bezpłatnego dostępu do Internetu.

Przy maksymalnym obciążeniu 60 tysięcy adresów IP (to maksymalna liczba jednocześnie podłączonych użytkowników) przy kodach  wyświetlanych co godzinę w sumie system zgłosiłby się do serwerów Google 60000*24 czyli około 1,5 mln razy. Oczywiście to przy założeniu, że wszystkie kody zostałyby rozwiązane poprawnie za pierwszym razem. Ponieważ spora grupa osób ma z tym problemy wydaje mi się, że czasem liczba błędnych odpowiedzi może być większa. Przy średnio 1 nieudanej próbie dochodzimy do 3 milionów kapci na dobę i więcej, w zależności od liczby prób.

Oczywiście w praktyce maksymalna liczba może być osiągana tylko w godzinach szczytu, więc faktyczna liczba wyświetlanych kodów jest znacząco mniejsza. Dodatkowo ciągle kody nie są wyświetlane co godzinę mimo obietnic operatora.

Teraz ciekawostka z FAQ usługi reCAPTCHA: Google żąda powiadomienia przy planowanym przekroczeniu 1 mln wyświetlanych (a nie prawidłowo rozwiązanych) kapci dziennie. Być może dlatego, że  1 milion kodów dziennie stanowi 1% ruchu na ich serwerach.

Czytaj dalej…

Kategorie:Analiza
>