Apa itu Captcha ?
contoh captcha
Gambar huruf kacau balau itu disebut CAPTCHA (Completely Automated Public Turing Test to Tell Computers and Humans Apart). Ini adalah salah satu penerapan metode Turing Test yang digagas oleh Alan Turing di tahun 1950. Gunanya untuk memastikan bahwa pengisi formulir adalah benar-benar seorang manusia. Program komputer akan mengalami kesulitan dalam mengartikan huruf-huruf yang bengkok-bengkok atau bertumpuk sementara manusia masih dengan (agak) mudah membacanya.
Sebelum ada CAPTCHA, spammer/hacker dapat membuat program untuk secara otomatis mengisi formulir seperti pendaftaran email gratis, sehingga ia akan memperoleh ribuan alamat email dengan mudah untuk kemudian disalah-gunakan.
Atau untuk mengubah hasil sebuah polling online, seseorang bisa saja membuat program sederhana untuk mengisi polling tersebut dengan jawaban yang sama sebanyak ribuan atau bahkan jutaan kali. Akibatnya polling itu tentu saja menjadi tidak valid.
Untuk mencegah program seperti itu, kini semua formulir akan menampilkan CAPTCHA berupa gambar huruf-huruf bengkok atau saling menyambung yang sukar dibaca oleh program atau komputer, namun (relatif) mudah dibaca manusia. Jika isian dari pengisi formulir sesuai dengan gambar yang ditampilkan, maka kemungkinan besar pengisi formulir adalah seorang manusia, bukan program komputer.
CAPTCHA biasanya dibuat secara otomatis secara acak setiap kali ada orang yang masuk halaman formulir di web, sehingga hampir tidak ada dua CAPTCHA yang serupa. Ini membuat jumlah kombinasi yang mungkin muncul sangat-sangat banyak, sehingga hampir tidak mungkin untuk membuat program yang mampu mengingat dan menjawab CAPTCHA yang akan muncul.
Selain CAPTCHA visual yang sering kita jumpai, ada juga versi audio bagi penyandang cacat mata, dengan prinsip yang kurang lebih sama.
Saat ini ada inisiatif untuk memanfaatkan CAPTCHA untuk tujuan positif. Untuk menyelamatkan arsip-arsip penting didunia, di banyak negara kini ada pihak yang bertanggung jawab untuk mengubah format arsip yang sudah ada (buku, dokumen tercetak) ke format digital (file komputer). Dua kendala utama yang muncul adalah banyaknya jumlah arsip yang tersimpan selama ratusan tahun, serta kualitas cetakan yang buruk sehingga hasil scan-nya sukar dikenali oleh komputer. Dengan gabungan kedua kendala itu, hampir tidak mungkin membayar tenaga manusia untuk membaca secara manual arsip yang gagal dibaca komputer.
Untuk mengatasinya kini muncul re-CAPTCHA, sebuah sistem yang bekerja sama dengan Google Books dan The Internet Archive, dimana hasil scan arsip yang gagal dibaca komputer dimunculkan sebagai CAPTCHA, lalu hasil isian itu dianggap sebagai teks yang hilang/tak terbaca. Agar yakin teks itu benar, biasanya tidak hanya satu jawaban yang dipakai, melainkan hingga sepuluh atau lebih jawaban yang sama.
Ini menjadi solusi win-win bagi semua pihak. Bagi pemilik web dengan formulir, ia mendapat CAPTCHA yang sudah tidak bisa dikenali oleh komputer super canggih yang dipakai untuk proses digitalisasi arsip, sehingga hacker juga kesulitan membuat program yang mampu membacanya. Dan bagi pihak pengubah format arsip, dengan begitu banyaknya formulir yang diisi diseluruh dunia tiap harinya, re-CAPTCHA dapat membantu digitalisasi arsip dengan cepat dan gratis.
Jadi saat mengisi formulir di website yang bekerja sama dengan re-CAPTCHA, Anda sudah turut membantu menyelamatkan arsip dunia bagi anak cucu kita semua.
Sayangnya setelah diimplementasikan sekian tahun, sistem CAPTCHA sudah mulai menunjukkan beberapa kelemahan. Perkembangan hardware dan software membuatnya tidak lagi terlalu sukar untuk dipecahkan oleh program. Apalagi kini muncul perusahaan-perusahaan di dunia ketiga yang bersedia memecahkan CAPTCHA dengan biaya yang sangat murah. DeCaptcher.com bersedia memecahkan CAPTCHA dengan hanya US$2 per 1000 CAPTCHA.
Untuk mengatasinya, saat ini beberapa pihak seperti Universitas Carnegie Mellon dan Penn State sedang mengembangkan CAPTCHA yang berbasis gambar, bukan lagi huruf.
LIHAT GAMBAR DIBAWAH INI UNTUK LEBIH MEMAHAMINYA
Ini menjadi solusi win-win bagi semua pihak. Bagi pemilik web dengan formulir, ia mendapat CAPTCHA yang sudah tidak bisa dikenali oleh komputer super canggih yang dipakai untuk proses digitalisasi arsip, sehingga hacker juga kesulitan membuat program yang mampu membacanya. Dan bagi pihak pengubah format arsip, dengan begitu banyaknya formulir yang diisi diseluruh dunia tiap harinya, re-CAPTCHA dapat membantu digitalisasi arsip dengan cepat dan gratis.
Jadi saat mengisi formulir di website yang bekerja sama dengan re-CAPTCHA, Anda sudah turut membantu menyelamatkan arsip dunia bagi anak cucu kita semua.
Penjelasan ReCaptcha menurut Google
- reCAPTCHA adalah sebuah fasilitas internet yang membantu untuk mendigitalkan buku-buku, surat kabar maupun siaran radio lawas..berupa 'teks tedistorsi' dimana kita harus mengetik teks tersebut untuk menjalankan perintah.
- Sebuah CAPTCHA adalah program yang dapat memberitahu apakah user adalah seorang 'manusia asli' atau 'script komputer yang sudah diprogram'.
- CAPTCHA digunakan banyak website untuk mencegah penyalahgunaan dari "bot" atau program otomatis yang biasanya ditulis untuk menghasilkan pesan-pesan spam pada internet.
- Tidak ada program komputer yang dapat membaca teks terdistorsi sebaik mata manusia, sehingga bot tidak akan dapat menavigasi situs yang dilindungi oleh CAPTCHA
Nah..dari situ diketahui bahwa salah satu fungsi reCAPTCHA adalah untuk mendigitalisasikan buku-buku pengetahuan bersejarah yang diterbitkan sebelum adanya komputer..
Bagaimana prosesnya digitalisasinya?
Penjelasan ada di bawah ini..
Mula-mula, buku yang ingin didigitalisasikan discan dulu menggunakan scanner..
Setelah discan, gambar yang dihasilkan diubah menjadi teks komputer menggunakan software Optical Character Recognition (OCR)..
masalahnya disini, hasil OCR belum
tentu perfect..masih ada sebagian kata yang belum bisa
diterjemahkan.. Naahh..saat inilah program reCAPTCHA dibutuhkan..reCAPTCHA membantu proses digitalisasi buku dengan mengirim kata-kata yang tidak dapat dibaca oleh komputer ke Web dalam bentuk CAPTCHA untuk diuraikan sendiri oleh manusia.
Lebih jelas lagi, setiap kata yang tidak bisa dibaca dengan benar oleh OCR akan ditempatkan pada gambar dan digunakan sebagai CAPTCHA. Hal ini dimungkinkan karena sebagian besar program OCR memberitahukan Anda bila kata tidak dapat dibaca dengan benar.
Caranya adalah dengan menggunakan 2 kata pada setiap captcha. Kata pertama adalah kata yang memang sudah terbaca pada OCR, sedangkan kata kedua adalah kata yang belum terbaca..
User kemudian diminta untuk mengetik kedua kata tersebut pada CAPTCHA. Jika mereka berhasil memecahkan kata pertama (yg sudah diketahui), maka sistem juga menganggap jawaban mereka adalah benar untuk kata kedua . Sistem kemudian memberikan gambar tersebut kepada orang lain untuk diselesaikan, dengan menambah jumlah kemungkinan bahwa kata kedua memang 'itu' jawabannya..dst..
Oleh karena itu, sebaiknya kita jangan sering-sering salah dalam menulis CAPTCHA..nanti proses digitalisasinya ga selesai-selesai lagi..
(sumber: kaskus.us)
Tidak ada komentar:
Posting Komentar