reCAPTCHA to darmowa usługa, która pomaga cyfryzacji mediów drukowanych, takich jak książki lub czasopisma . ReCAPTCHA System został opracowany w Carnegie Mellon University w Stanach Zjednoczonych , która wykorzystuje jako podstawę CAPTCHA systemu. reCAPTCHA obecnie asystuje przy digitalizacji archiwów New York Times . Dwadzieścia lat Archives of New York Times zostały już zdigitalizowane, a pozostałe 110 lat, aby być zdigitalizowane za pomocą reCAPTCHA 2010.

System wskazuje, który wyświetla 30 milionów OCR obrazów codziennie (od grudnia 2007) oraz system reCAPTCHA jest używany przez witryn takich jak Twitter , Facebook lub Ticketmaster .

Aktywność systemu zwyczaj

Zeskanowany tekst poddawany jest analizie dwóch OCR programów – jeśli programy nie zgadzają, to słowo jest niejasny przekształcony w CAPTCHA. To słowo jest wówczas wyświetlany w celu sprawdzenia słowo jest już znany. System jest skonfigurowany tak, że jeśli dana osoba pisze słowo kontrolne w porządku, wieloznaczne słowo jest wówczas również prawidłowe. Identyfikacja Program OCR jest oceniana przez wartość 0,5 pkt, a każda ludzka interpretacja jest wart jeden punkt. Gdy wartość słowa identyfikacji osiągnie 2,5 punktów, to słowo jest uważane za prawidłowo zidentyfikowane.

Leave a Reply

Your email address will not be published. Required fields are marked *