Video: Jawaban Interview : Sebutkan KELEMAHAN Anda ? (Desember 2024)
Untuk mendapatkan berita saya, saya sering memindai Google News, yang mengumpulkan artikel dari seluruh dunia berdasarkan apa yang "robot" tentukan sedang tren. Ini semua tentang apa yang sedang tren. Ini umumnya ketinggalan berita dan sama sekali mengabaikan komentar penting, seperti kolom saya. Alih-alih, tampaknya lebih memilih tautan mati - yang saya maksud adalah Wall Street Journal , yang mengharuskan berlangganan untuk membaca.
Hari ini adalah contohnya. Ada berita tentang CES tentang Dish Network yang melakukan penawaran untuk membeli Clearwire. Tetapi alih-alih menghubungkan ke salah satu cerita terkait dengan situs web yang gratis dan mudah dibaca, Google memutuskan bahwa berita utama harus berasal dari Wall Street Journal .
Di masa lalu, Google memiliki semacam kesepakatan yang memungkinkan pengguna untuk setidaknya membaca paragraf utama, atau bahkan seluruh artikel, sebelum diblokir oleh paywall. Kecuali Anda tahu trik bypass (dibahas di bawah), ini tidak berlaku lagi. Sekarang Anda lari ke paywall dan Anda selesai. Saya kira pelanggan yang sebenarnya bisa melewati ini, tetapi saya ingin tahu bagaimana Google bot dapat menemukannya untuk menemukan cerita di tempat pertama. Apakah Google membayar? Aku meragukan itu. Jadi pasti ada semacam pintu belakang untuk bot Google, kan?
Ini palsu dan merugikan pengguna Google. Google melewati semua kesulitan ini untuk mengalahkan orang yang mencoba permainan sistem tetapi itu memungkinkan Wall Street Journal menarik aksi ini? Ini pada dasarnya adalah langganan berbayar untuk Wall Street Journal . Itukah yang diinginkan Google? Apakah Google mendapat potongan?
Tidak sulit bagi Google untuk hanya memperbaiki gangguan ini. Butuh satu menit - lima puncak. Apakah itu terlalu banyak pekerjaan?
Jika sebuah perusahaan memiliki paywall yang dibangun ke dalam layanannya, Google seharusnya tidak mencari situs sama sekali. Bot harus tahu ada paywall dan hanya menghindari pencarian. Dan, ya, saya ingin penjelasan tentang bagaimana tepatnya bot dapat mencari situs yang diblokir oleh paywall. Itu adalah misteri.
Paywall harus persis sama dengan "robots.txt" yang memberi tahu bot perayap untuk pergi. Tetapi ada sesuatu yang mencurigakan tentang hubungan WSJ-Google . Cara termudah untuk membunuh semua bot adalah meta tag di file robots.txt, dengan demikian: .
WSJ malah secara khusus memblokir sub-direktori tertentu, tetapi tampaknya tidak semua. Dan yang lebih aneh lagi, jika Anda melakukan pencarian Google News untuk artikel yang sama persis, daripada hanya mengklik tautan di jadwal, Anda mendapatkan artikel melalui mekanisme lain.
Saya menantang pembaca yang lebih teknis di luar sana untuk mencari tahu apa yang terjadi dengan keduanya dengan memeriksa file robots.txt yang digunakan oleh WSJ . Dokumen publik tersedia di sini.
Apapun masalahnya, situs memiliki paywalls karena alasan keuangan. Jika mereka ingin bermain game dengan konten mereka itu satu hal, tetapi itu harus dilarang dari hasil pencarian dengan cara yang sama Google mencoba untuk menggagalkan orang yang mencoba game sistem. Google akan melarang blogger yang malang hanya dengan sedikit alasan untuk beberapa perilaku yang tidak jelas. Bagaimana kalau berurusan dengan situs yang lebih besar dengan cara yang sama?
Anda dapat Ikuti John C. Dvorak di Twitter @therealdvorak.
Lebih banyak John C. Dvorak:
Pergi keluar topik dengan John C. Dvorak.
LIHAT SEMUA FOTO DI GALERI