Laman web

VP Google Mayer Menjelaskan Enjin Carian yang Sempurna

The Big Click Problem - Marissa Mayer, VP of Google

The Big Click Problem - Marissa Mayer, VP of Google
Anonim

Tidak ada seorang pun yang bertanya kepadanya untuk menghuraikan matlamat yang begitu tinggi itu, jadi ketika IDG News Service baru-baru ini mempunyai peluang untuk mewawancarai Marissa Mayer, naib presiden Google Produk Cari & Pengalaman Pengguna, kami segera memintanya menjelaskan apa yang disebut Schmidt. Dia juga membincangkan tentang apa yang membuat Google terus mencari, bagaimana syarikat melihat teknologi semantik dan apa yang akan datang dalam usaha Universal Search untuk menggabungkan pautan kepada pelbagai jenis fail - artikel berita, imej, video, buku, peta - dalam senarai hasil tunggal.

Transkrip edited perbualan berikut:

[Bacaan lanjut: Perkhidmatan streaming TV terbaik]

IDG News Service: Apakah enjin carian yang sempurna? Sekiranya anda mempunyai tongkat sihir dan boleh menciptanya, apa yang akan kelihatan seperti itu? Apa yang akan dilakukannya?

Marissa Mayer: Ia akan menjadi mesin yang boleh menjawab soalan itu. Ia akan menjadi satu yang dapat memahami ucapan, soalan, frasa, entiti apa yang anda bercakap, konsep. Ia akan dapat mencari semua maklumat dunia, [mencari] idea dan konsep yang berbeza, dan bawa mereka kembali kepada anda dalam persembahan yang benar-benar bermaklumat dan koheren.

Terdapat banyak aspek penyelidikan yang diperlukan untuk masuk ke bangunan yang enjin carian itu. Anda perlu memahami ucapan. Anda perlu memahami imej. Anda memerlukan penterjemahan, supaya anda dapat mencari jawabannya tanpa mengira bahasa apa yang ditulis dalamnya. Anda memerlukan banyak kecerdasan buatan untuk dapat menganalisis maklumat yang relevan dan mensintesiskannya. Anda memerlukan antara muka pengguna yang hebat dan pengalaman pengguna untuk meletakkannya dalam konteks. Dan anda mungkin memerlukan keperibadian tertentu, jadi enjin carian berkaitan dengan orang itu, latar belakang mereka, apa yang sudah mereka ketahui, apa yang mereka cari minggu lalu.

IDGNS: Pada tahap antara muka pengguna, Google mendapat dikritik oleh para pesaingnya secara berterusan untuk apa yang mereka secara tidak sengaja menghina sebagai halaman hasil "10 biru pautan" Google. Mereka mengatakan bahawa Google adalah sekolah lama, bahawa paradigma pencariannya tidak cekap dan menyusahkan. Bagaimana anda bertindak balas dengan kritikan seperti itu?

Mayer: Saya akan menunjukkan kepada fakta bahawa Universal Search sebenarnya adalah titik aliran air dalam hal ini. Anda mendapat gambar rajah, gambar, blog, maklumat setempat, buku, berita, semua yang dijahit ke dalam enjin carian anda. Walaupun ramai pesaing kami masih sibuk membina enjin carian kecil yang menegak di mana anda perlu ingat bahawa mereka memilikinya, kami sibuk melakukan masalah sains komputer yang sangat sukar: Bagaimana anda menjahit semua medium berbeza ini bersama-sama dengan satu set koheren jawapan, dan bagaimana anda mensintesiskan semua itu? Kami melakukan semua itu kerana lebih baik untuk pengguna: Berikut adalah alat dan ia memberi saya apa yang saya mahu, tanpa mengira format apa yang masuk.

Kami mempunyai dua, tiga, lima perubahan setiap minggu yang dapat dilihat oleh pengguna akhir dalam antara muka pengguna. Kami tidak [mempublikasikan] perubahan kedudukan. Kami membuat perubahan pada algoritma ranking kami pada kadar dua hari. Menariknya, beberapa pesaing kami tidak membuat apa-apa perubahan kepada fungsi ranking mereka untuk beberapa waktu. Carian perlu berkembang: antara muka pengguna, fungsi ranking. Ia adalah proses membuat banyak perubahan kecil sepanjang masa dan sentiasa membuat sesuatu yang lebih baik.

IDGNS: Apakah status carian semantik di Google? Anda telah berkata pada masa lalu bahawa melalui "kuasa brute" - menganalisis sejumlah besar pertanyaan dan kandungan Web - enjin Google dapat memberikan hasil yang menjadikannya kelihatan seolah-olah ia memahami sesuatu secara semantik, ketika ia berfungsi dengan baik menggunakan pendekatan algoritma yang lain. Adakah itu pendekatan yang lebih baik?

Mayer: Kami percaya dalam membina sistem pintar yang mempelajari data secara automatik, [dan kemudian] menala dan menyempurnakannya. Apabila orang bercakap tentang carian semantik dan Web semantik, mereka biasanya bermaksud sesuatu yang sangat manual, dengan peta pelbagai persatuan antara kata-kata dan perkara-perkara seperti itu. Kami fikir anda boleh mencapai tahap pemahaman yang jauh lebih baik melalui data pemadanan corak, membina sistem berskala besar. Begitulah kerja otak. Itulah sebabnya anda mempunyai semua sambungan kabur ini, kerana otak sentiasa memproses banyak dan banyak data sepanjang masa.

IDGNS: Beberapa tahun yang lalu atau lebih, beberapa pakar meramalkan bahawa teknologi semantik akan merevolusi pencarian dan menutupi Google, tetapi itu tidak berlaku. Nampaknya usaha pencarian semantik telah memukul dinding, terutama sekali kerana enjin semantik sulit untuk diperkuat.

Mayer: Masalahnya ialah perubahan bahasa. Laman web berubah. Bagaimana orang menyatakan diri mereka berubah. Dan semua perkara itu penting dari segi cara carian semantik berlaku. Itulah sebabnya lebih baik untuk mempunyai pendekatan yang berdasarkan pembelajaran mesin dan perubahan itu, melintang dan merespon data. Itu pendekatan yang lebih teguh. Itu bukan untuk mengatakan bahawa carian semantik tidak mempunyai bahagian dalam pencarian. Ia hanya untuk kita, kita lebih suka memberi tumpuan kepada perkara yang boleh skala. Sekiranya kita boleh mendapatkan penyelesaian carian semantik yang boleh skala, kita akan sangat teruja dengannya. Untuk sekarang, apa yang kita lihat ialah banyak kaedah kami menghampakan kecerdasan carian semantik tetapi melakukannya melalui cara lain.

IDGNS: Universal Search diumumkan pada Mei 2007. Adakah ia dianggap selesai sekarang? Adakah ia sesuatu yang akan menjadi kerja yang sedang berjalan?

Mayer: Ia masih sangat hidup, bernafas. Kini kami mempunyai beberapa pasukan: Kami mempunyai pasukan sejagat [mencari] tempatan, sebuah pasukan [mencari] pasukan sejagat, produk [pasukan mencari] sejagat. Mereka semua melihat bagaimana kami boleh melakukan kedudukan pekerjaan yang lebih baik dan mencetuskan kandungan ini. Apabila kami melancarkannya, ia telah menunjukkan kira-kira satu dalam 25 pertanyaan. Hari ini, ia menunjukkan kira-kira 25 peratus daripada pertanyaan. Dan kami fikir mungkin terdapat masa apabila format [fail] bantu itu sebenarnya dapat membantu, dan kami tidak memicu mereka pada halaman hasil kami. Itulah sesuatu yang kita perlukan untuk terus berusaha.