Android

Google Researcher Sasaran Data Berstruktur Web

How to use Google Scholar to find journal articles | Essay Tips

How to use Google Scholar to find journal articles | Essay Tips
Anonim

"Terdapat banyak data berstruktur di Web dan kami tidak melakukan tugas yang baik untuk membentangkannya kepada pengguna kami, "kata Alon Halevy semasa ceramah di New England Database Day conference di Massachusetts Institute of Technology, Halevy merujuk sebahagiannya kepada apa yang disebut" sumber dalam web ", seperti pangkalan data yang duduk di belakang laman web yang didorong oleh bentuk seperti Cars.com atau Realtor.com. Google telah menghantar pertanyaan ke pelbagai bentuk untuk beberapa waktu, mengambil semula laman web yang dihasilkan dan memasukkannya ke dalam indeks cariannya jika maklumat itu kelihatan berguna.

[Bacaan lanjut: Perkhidmatan penayangan TV terbaik]

Tapi syarikat juga mahu menganalisis data yang terdapat dalam jadual berstruktur di banyak laman web, kata Halevy, sebagai contoh sebuah jadual di laman web yang menyenaraikan presiden Amerika Syarikat.

Dan ada reams dari tabel tersebut - Indeks Google muncul 14 bilion daripadanya, menurut Halevy. Beliau "menyadari dengan cepat bahawa lebih daripada 98 peratus daripada ini tidak begitu menarik," tetapi walaupun penapisan penting masih terdapat kira-kira 154 juta jadual yang bernilai pengindeksan, katanya.

Salah satu tujuan utama Google adalah untuk memberikan hasil yang menganjurkan "aspek "pertanyaan carian, terutamanya penerokaan seperti" perjalanan Vietnam, "yang bertentangan dengan pertanyaan untuk fakta tertentu seperti" penduduk Vietnam, "kata Halevy. Contohnya, permintaan akan memberikan maklumat mengenai keperluan visa, pakej cuaca dan pakej pelancongan.

Idea ini mempunyai gema perkhidmatan carian yang ditawarkan oleh Kosmix, tetapi Google ingin pergi lebih jauh, menurut Halevy. "Kosmix akan memberikan anda satu aspek," tetapi ia dilampirkan kepada sumber maklumat, "katanya.

Mencari" perjalanan Vietnam "di Kosmix memberikan set hasil yang teratur termasuk ulasan restoran dari New York Times, gambar dari Yahoo dan Flickr, maklumat membeli-belah dari Shopping.com dan hasil carian umum dari Google.

"Dalam kes kami, semua aspek mungkin hanya hasil carian web, tetapi kami menganjurkannya secara berbeza," kata Halevy.