Windows

Hadoop mendapat lebih banyak carian dengan MapR, Cloudera melepaskan

What Is MapReduce? | What Is MapReduce In Hadoop? | Hadoop MapReduce Tutorial | Simplilearn

What Is MapReduce? | What Is MapReduce In Hadoop? | Hadoop MapReduce Tutorial | Simplilearn
Anonim

Para pengguna platform pemprosesan data Hadoop kini mempunyai dua lagi alat untuk membantu mereka menyusun maklumat gunung mereka.

Pengedaran M7 baru MapR mengeluarkan lapisan HV JVM untuk meningkatkan prestasi

Hadoop pengedar MapR telah mengintegrasikan Carian LucidWorks ke dalam pengedarannya sendiri. Sementara itu, Cloudera melancarkan enjin pertanyaan Impala SQL open source yang pertama untuk Hadoop.

[Bacaan lanjut: Perkhidmatan streaming TV terbaik]

"Menggunakan carian sebagai antara muka pengguna untuk data besar sangat menarik. Carian sangat sesuai untuk memanfaatkan banyak jenis maklumat, terutama maklumat yang tidak terstruktur, "kata Jack Norris, ketua pegawai pemasaran untuk MapR. "Kami melihat beberapa aplikasi yang sangat menarik dengan enjin carian di inti mereka, walaupun pengguna biasa tidak memikirkannya sebagai mesin carian."

LucidWorks Search adalah versi komersial sumber terbuka Apache Lucene / Solr penuh -text enjin carian. Dengan integrasi MapR baru, Carian LucidWorks boleh mencari sama ada data pada Sistem Fail Hadoop (HDFS) atau pada fail pada sistem fail lain.

LucidWorks Search menawarkan gambar dan cermin untuk ketersediaan yang tinggi, dan menghapuskan banyak kerja yang diperlukan untuk pasangkan Lucene / Solr dari awal. Ia juga menawarkan sokongan asli untuk lebih banyak sumber data, antara muka pengguna grafik dan rangka keselamatan.

Enjin carian boleh digunakan dalam aplikasi Web dinamik untuk mengambil gambar, pengiklanan, cadangan produk dan maklumat lain yang dapat digunakan dengan cepat. untuk mengisi laman web dengan cepat. "Ini bukan pengganti kos rendah untuk gudang data. Ini adalah mengenai memanfaatkan sumber data baru dan melakukan beberapa perkara yang mempunyai kesan dramatik terhadap perniagaan, "kata Norris.

MapR dan LucidWorks telah bekerjasama untuk memasangkan teknologi mereka sejak tahun 2011, ketika mereka membentuk perjanjian pemasaran bersama. Pada awal tahun ini, mereka mengeluarkan penyambung yang menjadikannya mudah untuk menggunakan Lucene / Solr dengan pengedaran MapR Hadoop.

LucidWords Search berfungsi dengan pengedaran M7 yang baru dikeluarkan M7, dalam bentuk beta. Selain menyokong LucidWorks Search, edisi M7 telah di-architected semula untuk menghapuskan compaction atau pemeriksaan konsistensi latar belakang, mempercepatkan prestasi.

Juga minggu ini, Cloudera mengeluarkan versi 1.0 dari Cloudera Impala, enjin carian yang mematuhi SQL sumber terbuka Hadoop. SQL adalah bahasa antara muka pangkalan data yang digunakan dalam sistem pengurusan pangkalan data relasi (RDMS) dan terkenal oleh pentadbir pangkalan data.

Impala direka untuk melaksanakan pertanyaan lebih cepat daripada Hadoop's Hive, kerana ia tidak menggunakan rangka kerja MapReduce, yang memerlukan hasil carian hendaklah ditulis ke cakera. Sebaliknya, pengguna boleh menanyakan data yang disimpan dalam HDFS dan HBase secara langsung. Pengguna boleh menanyakan data sama ada secara interaktif atau melalui proses batch.

Cloudera pertama kali mengeluarkan versi enjin ini Oktober lalu sebagai beta. Sejak itu, perisian itu telah diuji oleh syarikat-syarikat seperti 37signals dan Expedia.

Impala adalah komponen utama pakej tambahan Cloudera Enterprise RTQ (Real-Time Query) untuk platform Cloudera Hadoop. Impala boleh dimuat turun dengan percuma.

Dikemaskini 6 Mei untuk membetulkan maklumat mengenai teknologi Cloudera Impala.