Komponen

Aster Data Updates' garis depan 'Pangkalan Data Analitik

Big data, дополненная реальность и компьютерное зрение / Интервью с Data Scientist

Big data, дополненная реальность и компьютерное зрение / Интервью с Data Scientist
Anonim

mengeluarkan versi 3.0 dari pangkalan data analitik nCluster pada hari Selasa, membingkainya sebagai ideal untuk pergudangan data "frontline"

. "Secara tradisinya, kami memikirkan pergudangan data sebagai tugas di belakang pejabat," kata CEO Aster Mayank Bawa dalam blog siaran Selasa. "Gudang data boleh dimuatkan dalam tingkap beban berasingan; beban boleh berjalan lambat (kesan bersih ialah pengguna perniagaan akan mendapatkan laporan mereka lewat); beban, sandaran, dan skala dapat mengambil gudang data secara offline - yang OK sejak Tugas-tugas ini boleh dilakukan pada waktu bukan perniagaan (malam / hujung minggu). "

Tapi pelanggan Aster, yang termasuk aCerno, rangkaian penyampaian pengiklanan internet," bergantung pada analisis data untuk pendapatan mereka, "kata Bawa. Aster's nCluster 3.0 menyebarkan beban kerja ke atas sejumlah pelayan dan memudahkan untuk menambahkan mesin tambahan untuk lebih banyak kuasa. Perisian ini juga memisahkan pelbagai komponen beban kerja analisis data ke dalam kepingan diskret.

A "loader" tier memperkatakan pemuatan data dan eksport ke dan dari sumber luaran; lapisan "pekerja" menyimpan data pada cakera yang dilampirkan secara tempatan untuk pertanyaan; dan lapisan nod "ratu" melakukan perancangan dan pemprosesan permintaan pintar.

Sementara itu, para pengguna bekerja dengan cluster seolah-olah ia satu entiti tunggal.

Keupayaan untuk memilih skala segmen cluster bermakna pengguna dapat menambah sumber

Kepada keupayaan teras ini, pembebasan 3.0 menambah beberapa fungsi untuk "sentiasa-aktif", termasuk keupayaan untuk menambah kapasiti, mengembalikan data dan memulihkan data sementara

"Kami mahu membina sistem yang boleh mengendalikan 10x, 100x lebih banyak data berbanding sistem lain hari ini, tetapi ini juga banyak data untuk mana-mana pelayan komoditi tunggal, "kata CTO Tasso Argyros dalam catatan blog. "Jadi kami meletakkan banyak usaha R & D untuk menyeragamkan setiap fungsi sistem - tidak hanya menanyakan, tetapi juga memuatkan, mengeksport data, sandaran, dan naik taraf. Selain itu, kami membenarkan pengguna kami memilih berapa banyak yang mereka ingin parallelize semua fungsi ini, tanpa perlu meningkatkan keseluruhan sistem. "

Pembebasan ini juga termasuk sokongan untuk MapReduce, teknik pengaturcaraan yang asalnya dibangunkan oleh Google yang memudahkan para pemaju untuk menulis program untuk menganalisis set data yang besar. Petualangan Aster Greenplum juga baru-baru ini mengumumkan sokongan MapReduce.

Ciri-ciri tambahan termasuk keupayaan untuk memilih tahap mampatan data untuk jadual individu, alat peningkatan "satu klik"; dan ciri keselamatan yang lebih baik, seperti LDAP (Protokol Akses Direktori Ringan) untuk pengesahan dan keupayaan untuk menguruskan keistimewaan pengguna di peringkat kluster, pangkalan data dan jadual.

Banyak pelanggan awal Aster, yang juga termasuk MySpace, memfokus kepada Web, kata Curt Monash, presiden Monash Research.

"Sebahagian besar daripada pertumbuhan dan peluang dalam pergudangan data terletak pada berurusan dengan jenis data yang agak baru," katanya. "Terdapat gudang data yang besar berurusan dengan OLTP tradisional, data transaksional, tetapi Aster tidak semestinya pesaing utama dalam menganalisisnya. Tempat yang manis dalam menganalisis sejumlah besar data adalah data Web dan peristiwa rangkaian yang berkaitan."

Monash dikutip pentadbiran pemprosesan selari dan sokongan untuk MapReduce sebagai kekuatan utama Aster: "Aster adalah permulaan dengan produk yang relatif belum matang, tetapi mereka telah banyak memikirkan cara membuat pemprosesan selari mudah untuk dijalankan."

NCluster 3.0 berjalan pada pelayan x86 standard. Harga adalah berdasarkan kepada berapa data yang diuruskan. Syarikat itu sebelum ini berkata bahawa kos bermula pada AS $ 100,000.