Home > Wiadomości > Kody CAPTCHA – co to jest i skąd się wzięło

Kody CAPTCHA – co to jest i skąd się wzięło

W związku z wprowadzeniem CAPTCHA do usługi bezpłatnego dostępu do Internetu Aero2 wiele osób zadaje sobie pytanie, skąd wzięły się te nielubiane kody, do czego służą i dlaczego się tak dziwnie nazywają. Postanowiłem przejrzeć historię tego rozwiązania, wyjaśnić kwestię zastosowań oraz przyjrzeć się rozwiązaniu stosowanemu przez Aero2, czyli systemowi reCAPTCHA firmy Google, który ma wiele ciekawych cech.

Wszystko jednak zaczęło się od… pewnego telegramu wysłanego jeszcze w XIX wieku.

Zapraszam do lektury.

SPAM – niechciane wiadomości

Od czasu wynalezienia usług masowej wysyłki wiadomości pojawiła się chęć ich wykorzystania jako nośnika reklamowego. Jeden z pierwszych przykładów niechcianych i niezamawianych wiadomości pochodzi jeszcze z drugiej połowy XIX wieku, gdy pewien dentysta z Londynu postanowił rozesłać… telegramy do deputowanych parlamentu z informacją, gdzie i w jakich godzinach przyjmuje. Sprawa została nagłośniona w prasie dając jeszcze większą, nieplanowaną darmową reklamę.

Pierwszy przykład bardziej nam znanego SPAMu w postaci wiadomości email został wysłany dopiero w 1978 roku i reklamował nowe komputery firmy DEC. Został rozesłany dokładnie do 393 użytkowników pewnej listy dyskusyjnej.

Sama nazwa SPAM ma także skomplikowaną historię. Z jednej strony jest to nazwa produktu, będącego odpowiednikiem naszej konserwy turystycznej, czyli po prostu mielonki. Z drugiej strony do popularnego języka wprowadził ją słynny zespół kabaretowo-rozrywkowy Monty Python w scence o mielonce. Jednak powiązanie tego z niezmawianymi wiadomościami to jak zwykle skomplikowany proces kulturowy, który spowodował skojarzenie powtarzanego w kółko słowa spam (w skeczu Pythonów) z powtarzającymi się wiadomościami publikowanymi w systemie USENET – wtedy z powodu błędu oprogramowania.

Po raz pierwszy spam stał się praktyką komercyjną w kwietniu 1994, gdy pewna firma prawnicza postanowiła zatrudnić programistę do masowego rozesłania wiadomości na grupy dyskusyjne na temat loterii zielonych kart uprawniających do pracy w USA. Już w roku 1998 pierwsze słowniki dołączyły słowo spam w znaczeniu niechcianych wiadomości.

Ocenia się, że w roku 2008 spam stanowił 92% wszystkich przesyłanych w Internecie wiadomości email. Jak to możliwe?

BOTy – automatyczne rozsyłanie

O ile pierwsze reklamy były wysyłane ręcznie, o tyle wraz ze zwiększaniem się zasięgu Internetu i liczby skrzynek pocztowych pojawiły się różne metody automatyzacji tego procesu, co było nie tylko tańsze, ale też znacznie szybsze. Z czasem, poza email i grupami dyskusyjnymi USENET (już dzisiaj w zasadzie zapomnianymi) pojawiły się fora dyskusyjne, komentarze pod artykułami, fanpage i inne miejsca, gdzie można umieścić reklamy. Liczba sposobów publikacji i prezentowanych treści stała się olbrzymia.

Właśnie w celu realizacji tych zadań reklamowych zaczęto tworzyć skrypty, programy i automaty, które wykonują tę ciężką, żmudną i nieciekawą pracę. Nazwa BOT pochodzi od słowa robot i wskazuje właśnie na taki automat, który wykonuje powtarzalne, stosunkowo proste zadania.

Początkowo były to po prostu programy, które po uruchomieniu na komputerze z dostępem do Internetu wykonywały rozsyłanie wiadomości do adresatów z dostarczonej bazy danych. Szybko jednak zaczęła się wojna między twórcami botów, a twórcami systemów obronnych: automatycznych i ręcznych filtrów antyspamowych. Ponieważ wykryć i zablokować pojedyncze źródło (jeden komputer podłączony do Internetu) jest bardzo łatwo, dzisiaj większość spamu jest wysyłania z… zawirusowanych komputerów zwykłych użytkowników. Mogą one być zaatakowane np. wyrafinowanymi trojanami. Te mogą wykonywać mnóstwo skomplikowanych czynności: od utrzymywania sieci komunikacji rozproszonej pomiędzy siecią botów (tzw. botnetem), przez rozsyłanie spamu, aż po wyświetlanie reklam użytkownikowi komputera i obroną przed wykryciem i wykasowaniem nawet przez dobre programy antywirusowe.

Jednym z elementów obrony przed spamem są systemy weryfikacji, czy przed komputerem siedzi człowiek.

CAPTCHA – sprawdźmy, czy jesteś człowiekiem

W 1996 roku niejaki Moni Naor zasugerował w jednej ze swoich prac naukowych, że może pojawić się potrzeba takiej weryfikacji przy dostępie do usług internetowych. Chodziło o tutaj przede wszystkim o strony internetowe. Zabezpieczenie to określił to znanym z historii komputerów pojęciem testu Turinga. Test ten miał w oryginale służyć do sprawdzania, czy komputery osiągnęły umiejętność posługiwania się językiem naturalnym i myślenia w sposób ludzki (w skrócie test na inteligencję maszyny) podczas zwykłej rozmowy, jednak tutaj działanie było odwrotne: to maszyny miały wykryć, czy na pewno mają do czynienia z człowiekiem.

W praktyce tego typu zabezpieczenie zastosowano po raz pierwszy w 1997 roku. Wtedy najsłynniejszą wyszukiwarką sieciową nie był Google, ale AltaVista (mało kto pamięta już czasy przed Google). Twórcy tego systemu zauważyli, że ktoś wrzuca do ich bazy adresów internetowych bardzo dużo odnośników w celu zakłócenia ich systemu oceny stron. Formularz dodawania stron był przeznaczony dla ludzi, a ktoś ewidentnie zaspamował ten system automatycznym skryptem. Pracownicy firmy wpadli na pomysł zmuszenia użytkowników do przepisania napisu z obrazka do specjalne pola, zanim jego zlecenie zostanie zaakceptowane. Obrazek był celowo nieco zniekształcony tak, aby dostępne wtedy narzędzia do rozpoznawania obrazów (tzw. OCRy) nie były w stanie ich odczytać.

Tak oto narodził się CAPTCHA. Nazwa ta powstała dopiero w 2000 roku i została użyta przez zespół naukowców z Carnegie Mellon University. Jest to skrót od Completely Automated Public Turing test to tell Computers and Humans Apart – w wolnym tłumaczeniu to całkowicie zautomatyzowany, publiczny test Turinga rozpoznający ludzi i komputery. W oryginalnym założeniu jest to dowolne zadanie, z którym człowiek poradzi sobie łatwo, jednak komputer będzie miał problem lub nie będzie mógł go wykonać wcale.

Najpowszechniejszym stosowanym dziś rodzajem testu CAPTCHA jest rysunek ze zniekształconymi na różne sposoby literami, z którego trzeba odczytać tekst i przepisać do okienka. Spotykamy się jednak z wieloma innymi testami. Może to być żądanie odpowiedzenia na pytanie zadane w języku naturalnym (np. podaj miesiąc następujący po kwietniu), wskazania obiektów o wybranej własności (wskaż koty na zdjęciach), wykonania zadania (przeciągnij piłkę do kosza). Wymyślono też szereg innych rodzajów testu CAPTCHA, jednak to właśnie kody ciągle są najczęściej wybierane przez administratorów systemów komputerowych ze względu na prostotę, niskie wymagania techniczne i znajomość wśród użytkowników.

Powszechność i krytyka

Kody (i inne testy) CAPTCHA stały się skrajnie powszechne i trudno dziś znaleźć stronę, która z nich nie korzysta. Nawet Forum jdtech.pl przy rejestracji jest chronione przez atakami spam-botów za pomocą kodu CAPTCHA i dodatkowego testu CAPTCHA w postaci słownego pytania. Bez ich zastosowania trudno byłoby utrzymać porządek w dyskusji i usuwać spam nawet posiadając dużą grupę moderatorów utrzymujących porządek. Dość wspomnieć, że jeden z ataków spamu na blog jdtech.pl w jego początkach spowodował publikację ponad 23 tysięcy komentarzy w ciągu kilku dni.

Na czym polegają główne problemy z CAPTCHA w znanej nam postaci?  Jest ich kilka.

  1. Po pierwsze po prostu zabiera to czas użytkownikowi, który chce wykonać prostą czynność, np. dodać komentarz. W 2012 zespół Carnegie Mellon oszacował, że jest to w sumie 150 tysięcy godzin, jakie spędzają użytkownicy rozwiązujący zagadki CAPTCHA każdego dnia. Przez to także zniechęca to osoby do interakcji w niektórych przypadkach.
  2. CAPTCHA to przede wszystkim test wizualny, a więc ogranicza dostęp dla osób z dysfunkcjami narządu wzroku. Co prawda najpowszechniejszy system reCAPTCHA ma podpowiedź dźwiękową, jednak jest on przeznaczony dla użytkowników korzystających na co dzień z języka angielskiego. Prawdopodobnie dlatego podpowiedź dźwiękowa nie jest nawet prezentowana w rozwiązaniu zastosowanym przez Aero2 przy ochronie bezpłatnego dostępu do Internetu.
  3. Czasem zadania i kody CAPTCHA są po prostu zbyt trudne, do odczytania przez zwykłych użytkowników. Ponieważ trwa nieustająca walka pomiędzy twórcami kodów CAPTCHA i systemami ich rozwiązywania, trudność kodów po prostu musi rosnąć. Na naszym podwórku mamy z tym także do czynienia w Aero2. W takim wypadku CAPTCHA nie tylko weryfikuje, ale po prostu odstrasza.
  4. Kody CAPTCHA wymagają stosowania graficznych interfejsów użytkownika, a często obsługi dodatkowych skryptów (javascript) i odpowiedniej wydajności komputerów (w przypadku bardziej złożonych testów animowanych i interaktywnych). To powoduje odcięcie od usług urządzeń, które nie spełniają tych wymogów.

A jest to tylko wybór najczęściej powtarzanych zarzutów wobec CAPTCHA.

reCAPTCHA – człowiek jako maszyna

I tu dochodzimy do głównego wroga ludzkości, jakim jest system reCAPTCHA – najszerzej stosowany w Internecie system CAPTCHA, który dziennie serwuje około 100 milionów rysunków na całym świecie. Na czym polega specyfika tego systemu i skąd wzięła się jego popularność?

O ile typowy test CAPTCHA wymaga od nas przepisania ciągu znaków i nic z tego więcej nie wynika, twórcy reCAPTCHA wpadli na pomysł, żeby tę wielką siłę roboczą (przypomnijmy: 150 tysięcy roboczo-godzin dziennie) wykorzystać do czegoś pożytecznego. Rozwiązywanie kodów to rozpoznawanie napisów. Może dałoby się wykorzystać więc to do… no właśnie… rozpoznawania tekstów i napisów?

Tak oto zrodził się pomysł, żeby przy okazji sprawdzania, czy przed komputerem siedzi człowiek poprosić go o rozpoznanie niewyraźnego napisu z zeskanowanej książki, którego nie udało się rozpoznać powszechnie stosowanym systemom OCR. Dlatego właśnie w reCAPTCHA pojawiają się dwa wyrazy, a nie jeden:

Przykład kodu CAPTCHA

Przykład kodu reCAPTCHA - lewy wyraz sprawdza, czy jesteśmy człowiekiem, a prawy - to fragment napisu do rozpoznania

Jeden z wyrazów to specjalnie spreparowany ciąg znaków, który sprawdza, czy z systemu korzysta człowiek, a drugi, zwykle wyraźniejszy, to właściwa praca, którą wykonujemy dla firmy reCAPTCHA a więc i dla Google. Oczywiście tego drugiego wyrazu reCAPTCHA nie weryfikuje, bo po prostu nie zna prawidłowej odpowiedzi. Mimo to jednak odpowiedzi przekazywane przez użytkowników są jeszcze weryfikowane na różne sposoby, zanim zostaną użyte w faktycznym tłumaczeniu.

W ten sposób pomagamy firmie w skanowaniu gazet (do 2012 odczytano w ten sposób 30 roczników The New York Times), trwa skanowanie książek w ramach projektu Google Books, a ostatnio także rozpoznawane są numery domów w ramach usługi Google Street View.

A dlaczego usługa jest tak popularna? Tutaj mamy do czynienia z kilkoma czynnikami.

  1. Usługa reCAPTCHA jest darmowa i w zasadzie nie ma ograniczeń co do liczby wyświetlanych kodów – w tej chwili chwali się około 100 milionami kodów prezentowanych każdego dnia.
  2. Usługa jest bardzo skuteczna: w przypadku pojawienia się skutecznego ataku, zespół obsługujący ją reaguje bardzo szybko odpowiednio modyfikując prezentowane kody, dzięki czemu zabezpieczone tą techniką usługi są cały czas dobrze chronione.
  3. Dzięki obsłudze na serwerach firmy Google jest bardzo niezawodna i działa szybko na całym świecie.
  4. W reCAPTCHA wbudowane są systemy automatycznej obrony, które utrudniają nadużycia usługi. Z tego typu zabezpieczeniami mamy do czynienia nawet w Aero2. Dodatkowo są one na tyle inteligentne i powiązane z innymi usługami firmy Google, że pozwalają sprawdzonym użytkownikom na ułatwienia.

Metody obchodzenia

Mimo wszystko każde zabezpieczenie można jakoś obejść – taniej, lub drożej, ale jednak. W przypadku reCAPTCHA i innych systemów tego typu stosuje się… żywych ludzi odczytujących kody, którym się za to płaci, a czasem nawet i to nie. Trzy przykłady:

  • W biedniejszych, ale skomputeryzowanych krajach (np. Indie, Pakistan) można znaleźć oferty pracy przy odczytywaniu kodów CAPTCHA.
  • Niektóre strony oferujące dostęp do plików oraz pornografii stosują kody CAPTCHA, ale nie są ich pierwszymi użytkownikami, a tylko realizują zadania rozwiązania kodów dla innych systemów automatycznych, które faktycznie potrzebują przedostać się przez to zabezpieczenie w celu realizacji swoich zadań (w tym także spamowania).
  • Powstają systemy wymiany kodów CAPTCHA, w których ludzie rozwiązują sobie kody na wzajem w zamian za punkty. Najpierw my siadamy i rozwiązujemy kody dla innych, a następnie za punkty możemy zakupić automatyczne rozwiązanie prezentowanych nam kodów przez innych użytkowników. Oryginalnie system był przeznaczony dla użytkowników serwisów udostępniania plików. Udało się to także zastosować to nawet w Aero2, jednak tutaj wymagane jest dodatkowe łącze internetowe do przesłania kodu i odebrania rozwiązania (sama konfiguracja jest także skomplikowana).

Jest to możliwe dzięki temu, że systemy CAPTCHA zwykle mają dość długą ważność kodu wyświetlonego użytkownikowi – niektóre systemy pozwalają na odstęp nawet kilkuminutowy między wyświetleniem kodu, a wprowadzeniem rozwiązania.

Kapeć w Aero2

Wracamy na nasze podwórko. Jak wiemy, od 1 kwietnia 2014 operator zastosował test CAPTCHA w usłudze bezpłatnego dostępu do Internetu. Co nie dziwi, wykorzystany został system reCAPTCHA ze względu na domowość, niezawodność i wydajność. Mimo zapowiedzi, kody nie pojawiają się co godzinę, a od miesiąca ciągle są prezentowane w losowych momentach.

Wprowadzanie kodu nie odbywa się bezpośrednio w formatce dostarczonej przez reCAPTCHA, a poprzez specjalną wydzieloną sieć wewnętrzną, która na czas wprowadzania kodu odcina nas od internetu pozostawiając dostęp jedynie do serwera weryfikacyjnego oraz serwerów Google serwujących kody. Przez to system nie jest w żaden sposób dostosowany dla osób niedowidzących – nie ma dostępu do podpowiedzi głosowej (która prawdopodobnie dla Polaków i tak byłaby nieprzydatna).

Dodatkowa procedura wymagająca rozłączenia ponownego połączenia po wpisaniu kodu jest celowym rozwiązaniem mającym na celu zniechęcenie korzystających z routerów do dzielenia łącza, gdyż nie ma innego istotnego uzasadnienia technicznego.

Ponieważ Aero2 zdecydowało się na zastosowanie darmowej usługi zewnętrznego dostawcy, nie dziwi to, że przyznaje się otwarcie do braku jakiejkolwiek kontroli nad formą prezentowanych kodów i nie może w zasadzie nic zrobić, gdy pojawią się trudniejsze kody (pierwszy raz miało to miejsce w połowie kwietnia, teraz takie kody są widoczne cały czas). Są co prawda metody przywrócenia czytelniejszych kodów, jednak zmuszanie użytkowników do wykonywania tego typu czynności jest niezbyt profesjonalnym rozwiązaniem zwłaszcza, że nawet łatwiejsze kody wzbudziły wątpliwości Urzędu Komunikacji Elektronicznej ze względu na swoją nieczytelność.

Kategorie:Wiadomości
  1. mały Solo Rz
    Maj 5th, 2014 at 12:21 | #1

    Dziś przez przypadek otworzyła mi się cała masa okienek w przeglądarce.
    Pomyślałem, że to ciekawy przyczynek do rozważań co by było gdyby.
    Oczywiście każde z tych rozważań należało by rozważyć ze wszystkich stron. Zapytać prawnika, napisać jakiś skrypt i przetestować jego działanie.

    1. Wystarczy kilkanaście osób, by przed rozwiązaniem captcha spróbować przez noc pobierać kolejne obrazki. Te kilkanaście osób pobrało by ponad milion odsłon od google.

    [Czy to kosztowne? Pewnie nie bardzo. Nie wiem ile kosztuje milion odsłon, ale google na pewno jakies pieniądze będzie chciało dostać]

    (zawsze można wstawić jakieś strony reklamowe i gemiusa. Nie można było by mieć pretensji do tych użytkowników. W końcu mogły by to być normalne reklamy z poprzedniego dnia)

    2. Czy wysłanie listu do Aero z powiadomieniem do UKomunikacji mogło by być uznane za spam?
    Powiedzmy wysłanie miliona takich listów? Jeśli Urząd i Aero nie odpowiadają zbyt szybko to chyba nie mogło by to być uznane za spam? Niecierpliwimy się.

    3. Ta akcja wymagała by skoordynowania minimum 200-700 osób. Większość osób loguje sie do aueo rano. Co powiedzie na DDoS na lokalne numeru 10.* w czasie rannej kawy?

    [potencjalnie było by to lekko uciążliwe]

    (zawirusowane komputery są problemem w internecie. trudno było by uznać za zła wole uruchomienie takich systemów. ale oczywiście niezwłocznie postaramy się naprawić nasz system by nie był przeszkoda dla aero )

    4. Jednak najmocniejszą restrykcją była by na pewno masowe zwiększenie ilości ściąganych danych. Wszystko zaczęło się od tego, że aero uznało sobie , że za dużo pobieramy. Dlatego proponuje pobierać dane (jakieś gry itp.) ile się da. Jeśli firma zobaczy że wprowadzając restrykcje niczego nie osiągnęła, może odpuści głupie kody captcha.

    • zefel
      Maj 5th, 2014 at 12:54 | #2

      nie przez przypadek – to kaleka implementacja kapcia przez wykluczonych umysłowo informatyków z AERO2.
      Opanowałem już metodę radzenia sobie z tym nieprzewidywalnym kapciem:
      Gdy internet przestaje działać to sprawdzam IP, gdy zaczyna się na 10…. to wiem że w powietrzu czai się kapeć. Otwieram więc nowe okno w Firefox zanim kapeć mi skasuje któryś z tabów w aktywnym oknie. Łaciaty kapeć pojawia się w pierwszym tabie nowego okna. Widzę też w tym samym oknie ze setkę nowych tabów, które olewam. Olewam również łaciatego kapcia, kolejne są już normalne i można trafić w pierwszym podejściu. Da się żyć z tymi sprawnymi inaczej. Pozdrawiam

  2. J.Piłsudski
    Maj 5th, 2014 at 05:56 | #3

    start akcji od dzisiaj tj. 5.05.2014 – niech każdy wysyła emailem
    tytuł np: STOP reCaptcha i wklejamy ściągnięty obrazek do wiadomości [nie wklejamy samego linku !] http://i.imgur.com/3Z9Jn2g.jpg
    na adres
    uke@uke.gov.pl
    i
    biuro@aero2.pl

    • Patryk
      Maj 5th, 2014 at 10:09 | #4

      Tylko na dobrą sprawę w ten sposób usprawiedliwimy tą reCaptchę. UKE/Aero może powiedzieć, że aero jest wykorzystywane do spamowania i dlatego właśnie takie zabezpieczenie jest konieczne. Nie tędy droga.

      • Piter
        Maj 5th, 2014 at 11:07 | #5

        Piłsudski/Krysia ogarnij sie!

        • T.Kościuszko
          Maj 5th, 2014 at 14:11 | #6

          miesięczne prośby o deeskalację konfliktu ,nie przyniosłu rezultatu
          ,więc kosy na sztorc i bić moskala !

    • Average Joe
      Maj 5th, 2014 at 19:57 | #7

      Patrz:
      [jdtech.pl/2014/05/kody-captcha-co-to-jest-i-skad-sie-wzielo.html#IDComment825781638],
      [jdtech.pl/2014/05/kody-captcha-co-to-jest-i-skad-sie-wzielo.html#IDComment825942835],
      - bo nie mam ochoty SPAM'ować tymi samymi komentarzami po kilka razy pod tym samym artykułem, tak jak to robią niektórzy.

      TL;DR: Pomysł infantylny i nieskuteczny.

  3. Average Joe
    Maj 5th, 2014 at 02:41 | #8

    [i.imgur.com/x8Ov57t.png]->[jdtech.pl/2014/05/z-powodu-aero2-uzytkownicy-negatywnie-nastawieni-do-plusa.html]->["404"] – czyli było i się zmyło. To z obawy przed seryjnym samobójcą?:)
    Zapewne o tę sytuację chodziło: [pcworld.pl/news/395853].
    Swoją drogą, Plus chyba ratuje się ofertą dorzucenia do abonamentu konsoli PS3 lub PS4: [pcworld.pl/news/396042]. Chyba liczą na to, że ludzie będą podpinali je do LTE Plusa i przesrywali transfer na aktualizacje, DLC i inne ciężkie pierdoły.
    P.S.: Komentarz odnosi się pewnie do: [forum.cdrinfo.pl/f113/p-88503-post1282150].

    • Maj 5th, 2014 at 07:37 | #9

      Być może trafiłeś na publikację testową – dzisiaj w południe dokończę (literówki, źródła i takie drobiazgi) i publikacja pójdzie.

  4. Average Joe
    Maj 4th, 2014 at 05:48 | #10

    Świadczenie usługi ReCAPTCHA opłaca się Google'owi tylko wtedy, gdy ludzie poprawnie odczytują – a co najmniej starają się odczytać – im słowo nierozpoznane przez OCR. Jeśli ludzie się wnerwią i będą w miejsce słowa nierozpoznanego wpisywać coś zupełnie innego, to Google w miejsce korzyści z ich pracy zaczna ponosić koszty eksploatacji serwerów ReCAPTCHA, pobieranej przez nie energii, itd.

    Wiele wskazuje na to, że Aero2 regularnie przekracza limit 1mln kodów dziennie, stanowiąc ponad 1% obciążenia serwerów ReCAPTCHA. Jeśli co najmniej połowę użytkowników BDI udałoby się nakłonić do konsekwentnego wpisywania jakiegoś umówionego* tekstu w miejsce słowa nierozpoznanego, to Google bardzo szybko zauważy, że dzień w dzień mają gwarantowany stały blok bezużytecznych rozwiązań kodów stanowiący ponad 0.5% wszystkich kodów ReCAPTCHA wyświetlanych dziennie przez ich serwery. Równie szybko stwierdzą, że ten blok bezużytecznych rozwiązań zawdzięczają jednemu klientowi – spółce Aero2. A wtedy – tak jak Aero2 ostatnio straszyło użytkowników BDI blokowaniem kart SIM – Google zacznie straszyć Aero2 zerwaniem tej niekorzystnej dla Google'a współpracy.

    *np. "Aero2" – niech w siedzibie Google'a wyrośnie ładny słupek na wykresie

    • Maj 4th, 2014 at 09:02 | #11

      Wiesz, i tak decyzja co o rozpoznania danego słowa nie jest podejmowana na podstawie jednej informacji, jednak poza tym masz rację.

      • Average Joe
        Maj 4th, 2014 at 16:22 | #12

        Rozumiem, że ostateczne rozpoznanie danego słowa odbywa się na podstawie statystyki z dziesiątek/setek rozwiązań kodów (a w przypadku, kiedy ta statystyka stawia na pierwszym miejscu rozpoznanie będące słowem wulgarnym/kontrowersyjnym/nieuzasadnionym w danym kontekście, może być ono dodatkowo weryfikowane przez pracowników Google'a). Nie należy się spodziewać niewyjaśnionych podmian losowych słów w zdigitalizowanych tekstach sprzed XXI wieku na "Aero2".

        Chodzi o to, by większa część rozwiązań przychodzących od Aero2 była dla Google'a bezużyteczna – brak korzyści z rozpoznawanych słów i tylko koszty obciążenia serwerów. To sprawi, że świadczenie darmowej usługi ReCAPTCHA dla Aero2 przestanie się Google'owi opłacać. Wtedy albo Aero2 zacznie płacić Google'owi, albo Google zrezygnuje ze współpracy z Aero2.

        • negri
          Maj 4th, 2014 at 17:16 | #13

          Całkowicie się zgadzam i oddolnie od dawna prowadzę taką politykę i taką praktykę. Polecam też znajomym. Tylko chcąc się spodziewać szybszej reakcji gogli propaguję wpisywanie słów fucking i fuck, aby było to łatwo zrozumiałe i obsceniczne dla gogli – liczę na szybszy efekt, bo inaczej pisałabym po polsku. Tak więc ja od około 3 tygodni wpisuję WIELOKROTNIE swojskie fuck wciskając SPRAWDŹ. :-P

          • Maj 4th, 2014 at 17:53 | #14

            Błędne rozpoznania i taksą ignorowane i nie wchodzą w statystykę. Jak prawidłowo rozwiążesz standardowego kapcia i podasz zamiast słowa OCR np. f… lub aero2, to wtedy zauważą. Poza tym na pewno w logach mają pochodzenie OCR.

          • negri
            Maj 5th, 2014 at 12:49 | #15

            To właśnie napisałam. Widzę, że jak się tylko trochę w skrócie napisze to czytanie ze zrozumieniem u ciebie kuleje, Jakub.

          • Maj 5th, 2014 at 14:26 | #16

            Wczoraj napisałem ponad 500 wpisów – mogłem się zakręcić :)

        • Maj 4th, 2014 at 17:52 | #17

          Algorytm reCAPTCHA opiera się i tak na zwykłych programach OCR poza wysyłaniem do użytkowników, więc weryfikacja jest wielotorowa. Wątpliwe kawałki zostają potem do sprawdzenia przez człowieka podobnie, jak cały tekst. Biorąc pod uwagę, że wszystkie teksty z Aero2 przyjdą błędne, to i tak stanowić to może najwyżej kilka procent odpowiedzi w całym systemie i raczej nie wpłynie na jego niezawodność.

          • Average Joe
            Maj 4th, 2014 at 19:23 | #18

            Tyle, że to nie ma na celu – ani zauważalnych szans – wpłynąć na niezawodność całego systemu ReCAPTCHA. Cyfryzacja książek i innych tekstów drukowanych to szlachetny cel i nie mam żalu o to, że ReCAPTCHA w tym pomaga. Żal jest o to, że Aero2 wygodnie zaprzęga system ReCAPTCHA do utrudniania nam dostępu do BDI.

            Akcja ta ma na celu sprawić, by współpraca z Aero2 była dla Google'a nieopłacalna, a więc przynosiła więcej strat (obciążenie serwerów, zwiększone zapotrzebowanie na weryfikację rozpoznań przez pracowników, pogorszenie wizerunku firmy), niż korzyści (poprawne rozpoznania nieOCR'owalnych słów). Google nie będzie dopłacać do usługi świadczonej Aero2 za darmo, tylko zażąda od Aero2 opłat za dalsze marnowanie zasobów systemów ReCAPTCHA. Jeśli Aero2 nie zechce płacić Google'owi za przyjemność uprzykrzania nam życia, to Google zerwie współpracę i Aero2 będzie musiało wykombinować inny sposób na niewywiązywanie się z umowy o świadczenie BDI.

            Być może wtedy wreszcie uda się zainteresować tą sytuacją instytucje będące w znacznie mniej zażyłych relacjach z Aero2 i spółką, niż obecnie Urząd Komunikacji Elektronicznej. Może Ministerstwo Administracji i Cyfryzacji? Na pewno niezbędne będzie zaangażowanie telewizji (np. TVP, TVN) by sprawa za szybko nie ucichła i by tak wartościowa inicjatywa jak BDI nie traciła na popularności…

    • damiaszek
      Maj 4th, 2014 at 10:05 | #19

      Dlatego też googiel teraz dla aero2 przedstawia kody w postaci krowy i dopiero po odświeżeniu w klasycznej postaci. Do tej pory działania części użytkowników przynosiły pewne efekty na lini aero2 – google, czyli kody serwisowe i niejakie miotanie się aero2 które nawet posuwa się do straszenia użytkowników. Pomysł nie jest zły, ale wymaga mobilizacji użytkowników aero2.

    • uncle Tom
      Maj 4th, 2014 at 12:05 | #20

      Average Joe? Nie maskuj się gupi Jasiu – to co proponujesz pachnie na mile polactwem, czyli tym z czego znani są twoi rodacy całemu światu: "Niech mi się nawet chałupa spali byle zrobić u sąsiada zwarcie". Takich przyjemniaczków wynoszą na kopach z każdej międzynarodowej imprezy, co polskie półgłówki odbierają jako dyskryminację i piszą pozwy do ONZ, UE, i Matki Boskiej.

      • kjhg
        Maj 4th, 2014 at 17:17 | #21

        ukrainiec Tom z Kanady?

        • uncle Tom
          Maj 5th, 2014 at 04:36 | #22

          Pudło – murzynek Bambo z Niasa

    • Patryk
      Maj 5th, 2014 at 10:11 | #23

      Kiedyś była podobna akcja na jednym forum (4chan jeśli dobrze pamiętam) i coś to zmieniło. Tylko nie jestem teraz pewien, czy sytuacja użytkowników w wyniku wpisywania ciągle jednej frazy się poprawiła ;)

      • Maj 5th, 2014 at 10:56 | #24

        4chan/kara i inne wynalazki do fajne do ataków spontanicznych, ale obawiam się co do faktycznej skuteczności innej, niż ataki DDoS itd. Nadużywanie reCAPTCHA nic nie zmienia. Według mnie warto najpierw wyczerpać metody prawne i interwencyjne. Koordynacja tutaj jest potrzebna, ale ja po prostu nie mam wystarczającej wiedzy, żeby wskazać jedną, skuteczną metodę. Na razie nabijamy statystyki skarg do UKE i powoli rozchodzi się to na kolejne urzędy (UOKiK, MAiC itd., a może powoli także na inne spółki Plus/CP. Obawiam się o ograniczoną skalę, jednak nie można tego pomijać.

  5. Krystyna z gazowni
    Maj 3rd, 2014 at 22:53 | #25

    start akcji od poniedziałku 5.05.2014 – niech każdy wysyła emailem
    tytuł: STOP reCaptcha i wklejamy obrazek do wiadomości http://i.imgur.com/3Z9Jn2g.jpg
    na adres
    uke@uke.gov.pl
    biuro@aero2.pl

    • Average Joe
      Maj 4th, 2014 at 04:49 | #26

      W niecały kwadrans od rozpoczęcia tej akcji działy IT w UKE i Aero2 zastosują reguły antySPAM'owe kierujące wiadomości z tematem "STOP reCaptcha" i grafiką [i.imgur.com/3Z9Jn2g.jpg] w treści do SPAM'u/Kosza. Reszta dnia zapewne przeminie im bez większych atrakcji.

      • Krystyna z gazowni
        Maj 4th, 2014 at 06:41 | #27

        to przykryj się kołdrą po czubek nosa i nic nie rób
        a urzędasy będą myśleli że wszystko jest ok ,bo nikt nie reaguje
        twoje myślenie jest jak tych ukraińców co czekają na mannę z nieba

        a ci z głową na karku zmienią nazwę obrazka np. na datę swoich urodzin
        a tytuł wiadomości dowolnie zmodyfikują i wszycho

        • Piter
          Maj 4th, 2014 at 12:43 | #28

          Krystyno z gazowni ogarnij sie.myślisz,że Ilu użytkowników aero odwiedza tą stronę.nikt o tej twojej akcji nie wie.Obstawiam,że UKE/Aero dostaną kilkanaście maili,które nic nie wniosą.Umowa została tak sformuowana( na co UKE się zgodziło-pewnie to oni pisali tą umowę) i działają w granicach prawa.możemy im naskoczyć,zresztą to nie jest komuna,że musisz mieć te aero bo innych opcji nie ma.Aero to prywaciarz i może robić co chce o ile nie przekracza to prawa i postanowien umowy.Też mi captcha się nie podoba.Jedyny sensowny protest to wrzucenie karty sim do pieca.Amen.A ja ogłaszam akcję ZNICZ

          • damiaszek
            Maj 4th, 2014 at 12:50 | #29

            Nie wrzucenie karty do pieca, tylko odesłanie. I nie chodzi tylko o zwrot jakieś tam kasy, tylko o dołożenie im pracy. Centrum obsługi już zbudowali, więc niech trochę popracują.

          • Piter
            Maj 4th, 2014 at 14:45 | #30

            Mam nowy pomysł – Wysyłajmy na adres aero nasze brudne skarpety zdjęte wieczorem w paczce.To by mogło wypalić(poważnie pisze).Jest jeszcze druga opcja z majtkami ale to by musiały robić tylko kobiety z okresem hehehe

          • Piotr, Eugeniusz
            Maj 7th, 2014 at 05:24 | #31

            ale ty Piter jak masz hemeroidy to tez okres bedziesz mial i stringi mozesz swoje im podeslac :)

        • Average Joe
          Maj 4th, 2014 at 15:48 | #32

          Jedyną reakcją na tego typu akcję SPAM'ową będzie odfiltrowanie takich wiadomości, żeby nie przeszkadzały w piciu kawki. Większa ich część pewnie nawet nie dotrze do skrzynek tych "niezwykle poruszonych zaistniałą sytuacją" urzędników/pracowników.

          A filtry antySPAM'owe będą rozszerzali/uogólniali, żeby łapały wszystkie podobne wiadomości, np. wiadomości, w których ta grafika (rozpoznawana po hash'u pliku) jest ładowana z innego adresu, siedzi w załączniku, itd.

    • Piotr, Eugeniusz
      Maj 7th, 2014 at 05:22 | #33

      krycha ty gazujesz kogos tam :) czy gazujesz wino marki „koziol„ / :)

  6. Maciej
    Maj 3rd, 2014 at 21:48 | #34

    Kody CAPTCHA wzięły się z d**y Aero2!

  7. nikt
    Maj 3rd, 2014 at 18:46 | #35

    Mnie zastanawia jak to jest z tą „koniecznością” wpisywania obydwu wyrazów, o której wspomina UKE? Czy rzeczywiście zwiększa to szansę na otrzymanie prostszej wersji kodu? Czy ten temat nie jest już dogłębnie zbadany? Przecież Googlowy reCAPTCHA jest stosowany od dawna w wielu serwisach, więc dziwi mnie że rozwiązanie właściwie wszystkich problemów z reCAPTCHA stosowanym przez Aero2 musimy poznawać metodą prób i błędów.

    • Maj 3rd, 2014 at 19:09 | #36

      W żadnym znanym mi serwisie kody nie były stosowane na taką skalę (miliony wpisań dziennie z pojedynczego adresu IP z punktu widzenia serwerów google). Więc niestety jesteśmy skazani na takie eksperymenty.

      • nikt
        Maj 3rd, 2014 at 19:57 | #37

        Masz rację że z tą ilością zapytań to sytuacja może być wyjątkowa. Jednak wydaje mi się że nie ma różnicy między działaniem w dużo mniejszej skali np. 100 zapytań z pojedynczego adresu. Z drugiej strony to wręcz śmieszne, że przy obecnym poziomie rozwiązań „inteligentnych” serwerów, ich monitoringu i adaptacji, taki wielki klient jak Aero2 nie może porozumieć się z taką firmą jak Google. A przecież nie chodzi tu o jakąś wielką politykę firmy tylko o drobny szczegół techniczny jak wyjątkowo duża liczba połączeń z jednego adresu. Ta sytuacja powinna być niemal automatycznie zaobserwowana i zweryfikowana przez Google. Z drugiej strony jak osoby implementujące to rozwiązanie w Aero2 mogły nie zdawać sobie sprawy jakie mogą być tego konsekwencje?

        • Maj 3rd, 2014 at 19:59 | #38

          Tu masz dwie kwestie – duża liczba z jednego (lub kilku) IP powoduje, że wszystkie te połączenia są traktowane w zasadzie jako jedna osoba. Po drugie, z pewnością liczba błędów jest spora, co powoduje, że Google oznacza to źródło jako zagrożenie błędnymi odpowiedziami. I oczywiście pewnych rzeczy Aero2 nie przewidziało, nie wspominając o tym, że przyznało się otwarcie do braku kontroli nad tym rozwiązaniem co jest (dla mnie) wręcz kuriozalne.

          • nikt
            Maj 3rd, 2014 at 20:47 | #39

            No właśnie Aero2 najprawdopodobniej, z wiadomych względów, zbytnio nie zależy. Z drugiej strony ciekawe jak sytuacja wygląda od strony Google. Z pewnością mają jakieś raporty na temat nietypowych sytuacji, a ta prawdopodobnie do takich należy. Brak automatycznej bądź „recznej regulacji” i dostosowania algorytmów od strony Googla, dowodzi że nadal wszelkie systemy są niedoskonałe, a pełna automatyka może w wielu sytuacjach zawodzić i wtedy nie można liczyć na rozwiązanie problemu.

            Swoją drogą byłoby bardzo ciekawe, nie tylko ze względu na naszą sprawę, gdyby udało Ci się czegoś o tym dowiedzieć od Googla. Myślę że obecna sytuacja również niekorzystnie wpływa na ich wizerunek, więc może zechcieliby Ci odpowiedzieć.

    • Marian
      Maj 4th, 2014 at 19:20 | #40

      Ja dostaję tylko te łaciate krowy. Więc dla własnego komfortu przepisuję obydwa wyrazy dokładnie. Bo tylko sam Bóg wie który wyraz jest istotny. Czy ten dłuższy (a czasem obydwa są jednakowej długości) czy jest inne kryterium. Na początku kwietnia nie było tego problemu bo wiadomo było że ten powykręcany wyraz to jest faktyczna zagadka do rozwiązania. Teraz mam w Firefoxie stonę z kapciem powiększoną do maksimum więc łatwiej grać w tego toto-lotka. Przed chwilą udało mi się po raz pierwszy od prima-aprilisowego wprowadzenia tej złośliwości wygrać z kapciem od pierwszego strzału

      • nikt
        Maj 4th, 2014 at 21:12 | #41

        Ja miałem na myśli tą łatwiejszą wersję, z jednym wyrazem powykręcanym. W Twoim wypadku współczuję. Ja zawsze po przeładowaniu uzyskuję prostą wersję. Raz miałem przypadek, myślę że po aktualizacji Chrome, kiedy miałem same „zaplamione” kody, wtedy po kilku przeładowaniach udało mi się trafić chyba za trzecim razem.

        • Marian
          Maj 4th, 2014 at 21:49 | #42

          Bo w tym sęk że ja nie używam konta google i przeglądarki chrome. I nie będę instalował tych szpiegujących aplikacji tylko po to by mieć łatwiejsze kody. Taka to polityka. Jak kumasz się z google to masz łatwiejsze kody jak nie – uprzykrzają życie. To się nazywa demokracja i wolność wyboru (w amerykańskim wydaniu)

          • nikt
            Maj 4th, 2014 at 22:14 | #43

            Ja jednak wolę wygodę :) mimo wszystko pod niektórymi względami Chrome jest dla mnie bezkonkurencyjne. A jeśli chodzi o wolność to najważniejsze że mogę w każdej chwili zrezygnować z usług Googla (tak przynajmniej mi się wydaję :) ). Jeśli bardzo cenisz sobie prywatność to możesz założyć konto tylko do wyświetlania strony Aero2, na fikcyjne dane. Na pewno więcej prywatności stracisz na najróżniejszych skryptach na wielu stronach, nawet przy próbach ich blokowania. A tak z ciekawości jakiej używasz wyszukiwarki?

            PS. Przy połączeniu mobilnym więcej informacji niż Google może o mnie zebrać Onavo od którego używam VPN.

          • Marian
            Maj 4th, 2014 at 23:15 | #44

            Z kontem google to jeszcze najmniejszy problem. Już tyle lipnych kont zakładałem że jedno więcej jedno mniej to żadna różnica. Ale od pięciu lat używam Firefoxa i to w wersji 10 i jestem do niego przyzwyczajony oraz znam jego zakamarki dokładnie. Jak to się mówi przyzwyczajenie jest drugą naturą. Kiedyś z ciekawości zainstalowałem Operę. Nie przypadła mi do gustu. Zbyt krzykliwa i kolorowa. Wychodzę z założenia że narzędzie ma być jak najprostsze, bez jakichś udziwnień graficznych ale skuteczne. Firefokx jest z wyglądu skromniutki ale robi wszystko do dziś bez zająknięcia. Dlatego jest nadal w wersji 10 chociaż już są aktualizacje (ale i tak niczego nie wnoszące) do wersji 28. I dla mnie to jest wygodą. Używam wyszukiwarki AVG lub Google. Z kodami Captcha pomału się już oswoiłem i w zasadzie zaczynam z tego drwić bo i tak je przechodzę. Co nie znaczy że nie będę z nimi nadal walczył na wszystkich frontach. Bo to niepotrzebne, chamskie utrudnienie ze strony aero2

          • Maj 5th, 2014 at 07:32 | #45

            Korzystanie ze starych przeglądarek nie jest najzdrowszym pomysłem. Chodzi o dziury bezpieczeństwa. A AVG to opakowana wyszukiwarka Google z tym, że na reklamach zarabia częściowo AVG.

          • Marian
            Maj 5th, 2014 at 13:08 | #46

            Czasem stare lepsze od nowego. Raz pokusiłem się o aktualizację Firefoxa i skończyło się klęską. Przestał działać i trzeba było reinstalować. O bezpieczeństwo się jakoś nie martwię bo z komputera korzystam wyłącznie ja dla celów czysto użytkowych. Nie nosi mnie gdzieś po podejrzanych stronach. Mam Windows XP profesional. Od zainstalowania (5 lat) nie było jeszcze żadnego problemu. A od początku miał wyłączone aktualizacje. Obecnie przy starcie PC ładuje się w 12 sekund. Więc po co ulepszać coś co działa wyśmienicie? Wystarczy minimum ostrożności i rozsądku gdy się jest w sieci.

  8. Araraquara
    Maj 3rd, 2014 at 18:20 | #47

    Jakubie, już niedługo pięciolecie bloga (29 maja). Czekają nas jakieś niespodzianki z tej okazji? :D

    • Maj 3rd, 2014 at 19:07 | #48

      Z okazji otrzymania Nokii N900? :) FIlm taki sobie mi wyszedł, choć jako pierwszy w historii to i tak nieźle. Blog powstawał kilka miesięcy, a to był tylko pierwszy artykuł jaki został opublikowany i pozostał w archiwum. Większość pierwszych wpisów jest tak na prawdę do usunięcia…

  9. Lucyfer :o)
    Maj 3rd, 2014 at 17:11 | #49

    to diabelskie nasienie jest z czeluści piekielnych !

  10. alef
    Maj 3rd, 2014 at 17:02 | #50

    Biedny Turing – zszedł pod strzechy! A tam wykluczeni wieszają psy na jego osiągnięciach

  11. Marian
    Maj 4th, 2014 at 19:41 | #51

    To wcale nie jest jeszcze tragedia. Bywa o niebo gorzej! Człowiek jest święcie przekonany że wpisał prawidłowo a jednak nie. Najwięcej jest pułapek przy literze l (małe el) bo to podobne do dużego I. To samo z m (bo może to być podwójne n). Także r sprawia problem bo podobne do n. Teraz przewijam kody na takie gdzie najwięcej jest h, y, c, v bo jest większe prawdopodobieństwo trafienia. Tak , tak! My nie przepisujemy tych kodów jak normalni ludzie tylko staramy się trafić w cel który jest niewyraźny i rozmazany.

  12. andi
    Maj 5th, 2014 at 12:57 | #52

    Zrób sobie konto na google, po 1 krowie dalej jest łatwiutko.

  13. Piotr, Eugeniusz
    Maj 7th, 2014 at 05:16 | #53

    laciate hhaaaa kapcie sa pocerowane i ciezko odczytac te cody z aero-sreo :)

  14. Marian
    Maj 4th, 2014 at 21:59 | #54

    Człowieku szkoda czasu! Jak chcesz to ja ci już w tej chwili mogę wysłać odpowiedzi jakie dostaniesz. Kropka w kropkę. Oni tam po prostu na każdą reklamację wysyłają przygotowany szablon odpowiedzi! I wcale nie jest to odpowiedź na Twoje konkretne zarzuty tylko ogólniki. Lepiej już atakować Rzecznika Praw Obywatelskich bo to co wyprawia aero2 to traktowanie nas nie jak równych obywateli tylko jakichś natrętów człekopodobnych

  15. skarga na aero
    Maj 5th, 2014 at 00:24 | #55

    pisz skargi przez ePUAP bo wtedy to jest oficjalna skarga, a mail to mail z botem co rozsyla ta sama propagande $olorza ;p

  16. A tak walczą inni…
    Maj 5th, 2014 at 01:04 | #56

    napisz 15 a 1 w trybie informacji publicznej do UKE – zadaj pytania szczegółowe na każde musi być udzielona odpowiedz zobacz co zawiera art 12 i następne tej ustawy. Zobacz jak inni korzystają z tej ustawy http://opor.org.pl/dziaalno-stranicza-wobec-uke/4…

  17. Marian
    Maj 4th, 2014 at 23:28 | #57

    Ja od jutra się trochę też przyłożę i będę pisał skargę do RPO nie na aero2 ale na UKE. Bo aero2 to spółka handlowa która szuka rozwiązań jakby tu zrobić żeby wyszło taniej. Ale UKE to już organ państwowy który ma nadzorować działania aero2 i chronić konsumenta. Tymczasem UKE jest w tej chwili szczekaczką. Ujada jak pies ale nie na temat i jawnie stoi murem za aero2 a przeciw konsumentom. Nie po to ta instytucja została stworzona by rzucać kłody pod nogi obywatelom.

  18. rejent
    Maj 5th, 2014 at 03:06 | #58

    Racja. Ja się wezmę za skargę na RPO gdyby nie zareagował lub zrobił unik. Ale do kogo? Do Ban-Ki-Muna? On też pewnie siedzi w kieszeni Solorza – ten spisek ma zasięg ogólnoświatowy.

  19. Marian
    Maj 6th, 2014 at 23:49 | #59

    A to skur….syny! A jak już mozolnie na tym formularzu napiszesz o co Ci chodzi (a to trochę trwa by wyłożyć swoje zastrzeżenia) i klikniesz "wyślij" to się okaże że akurat jest już kapeć i twoja robota poszła na marne. Kolejne utrudnienie UKE. Poza tym w formularz nie wkleisz załączników ze znienawidzonymi kapciami! Taka odpowiedź to kolejny powód by teraz składać skargi nie do UKE ale na UKE. To obywatel ma prawo decydować w jakiej formie składa skargę a nie urzędas!

  20. Piotr, Eugeniusz
    Maj 7th, 2014 at 05:18 | #60

    ja jak zauwaze ze sa laty szmaty po 1 razie nie wejdzie klikam puste az do skutku jak wyjdzie czytelniejszy kapec i wtedy wpisuje

Strony komentarza
1 2 3568
  1. Brak jeszcze trackbacków
Musisz być zalogowany aby dodać komentarz.
>