Komponen

Selamat Datang di Web 3.0: Carian Semantik

Web 3.0 Innovative Semantic Interactions with Spotlets

Web 3.0 Innovative Semantic Interactions with Spotlets
Anonim

Walaupun pencarian kata kunci tetap menjadi kaedah yang paling popular, biasanya tidak tepat, dengan pengguna kadang-kadang mendapatkan sehingga 30,000 hits pada carian dan kemudian perlu menyaring senarai kata kunci yang berkaitan dengan longgar untuk mencari dokumen yang relevan.

"Ini di mana jenis baru yang dipanggil teknologi semantik datang ke dalam bingkai. algoritma ranking seperti PageRank Google untuk memprediksi perkaitan, carian semantik dips ke dalam makna dalam bahasa untuk menghasilkan hasil carian yang sangat relevan, "menurut laporan yang diterbitkan oleh penganalisis Ovum Mike Davis dan Madan Sheina.

Semanti yang terkenal pembekal web yang diketengahkan oleh penganalisis termasuk Sistem Pakar, Powerset, Yedda, Trovix dan Hakia. Menurut penulis, kesedaran carian semantik meningkat apabila Microsoft mengambil dua syarikat pencarian semantik Powerset dan Zoomix.

Dalam kes Pakar Sistem, aplikasinya, yang dipanggil Cogito, dirancang di sekitar prinsip pemahaman manusia untuk membolehkan kandungan difahami dengan cara yang dimaksudkan oleh penulis untuk menjadi.

"Carian Google untuk kata 'jaguar' akan menarik kandungan di sekeliling binatang dan kereta. Carian semantik akan melihat bukan sahaja pada kata kunci tetapi juga kata-kata lain di sekelilingnya seperti 'hutan 'atau' saloon 'untuk memisahkan kedua makna ini, "kata para penulis.

Analisis lebih mendalam

Selain pencarian semantik, terdapat bentuk lain, termasuk heuristik dan ontologi, linguistik dan penambangan teks, dan statistik. Walau bagaimanapun, Sistem Pakar mendakwa bahawa pendekatan ini berkurang, hanya menangani aspek analisis morfologi dan tatabahasa.

Enjin carian lain sering memukul tembok bata apabila ia melibatkan analisis mendalam. Sebagai contoh, apabila enjin gelintar yang didorong oleh heuristiknya melihat dua kata sifat dalam suatu kalimat yang biasanya membasuhnya dan menjatuhkan hukuman sebagai neutral kerana ia tidak memahami di mana dua kata sifat yang berasingan menunjuk.

Sebagai perbandingan, carian semantik kelihatan pada kedua logik kalimat - bagaimana perkataan dalam satu kalimat berkaitan dengan satu sama lain - dan analisis semantik - memahami konteks kata kunci.

Apabila suatu istilah tidak jelas, artinya ia boleh mempunyai beberapa makna, contohnya, kulit, analisis semantik diperlukan dengan kata lain yang membungkusnya untuk memberikan makna dan konteksnya yang benar.

Pangkalan data leksikal

Para jurutera di Pakar Sistem mengatakan Cogito boleh pergi lebih jauh kerana ia mempunyai rangkaian semantik - pangkalan data leksikal yang menyediakan perwakilan pengetahuan definisi perkataan dan hubungan mereka. Ia menumpukan kamus Webster ke dalam pangkalan data dalam memori - terdiri daripada 350,000 perkataan dan 2.8 juta hubungan.

"Rangkaian semantik pakar sistem juga memberi tumpuan kepada kata-kata yang sama. Ini berbeza dengan pendekatan ontologi yang paling membimbangkan diri dengan pembungkus makna dan konteks sekitar khusus kandungan, seperti istilah saintifik, dan melangkau kata-kata biasa yang terdiri daripada 90 peratus daripada semua kandungan, "kata pengarang Ovum.

Namun, carian semantik masih penuh dengan" banyak gembar-gembor teoretis tetapi bahan atau bukti nyata yang sedikit ia berfungsi lebih baik daripada teknologi carian semasa.

"Rangkaian semantik sukar untuk dibina dan tidak semuanya sama. Tidak semestinya teknologi semantik akan dapat memberikan ketepatan 100 peratus dalam analisis dan hasilnya. Selain itu masih ada tanda tanya mengenai isu prestasi yang melekit dengan carian semantik yang memakan lebih banyak pemprosesan pemprosesan. "