Big data, дополненная реальность и компьютерное зрение / Интервью с Data Scientist
mengeluarkan versi 3.0 dari pangkalan data analitik nCluster pada hari Selasa, membingkainya sebagai ideal untuk pergudangan data "frontline"
. "Secara tradisinya, kami memikirkan pergudangan data sebagai tugas di belakang pejabat," kata CEO Aster Mayank Bawa dalam blog siaran Selasa. "Gudang data boleh dimuatkan dalam tingkap beban berasingan; beban boleh berjalan lambat (kesan bersih ialah pengguna perniagaan akan mendapatkan laporan mereka lewat); beban, sandaran, dan skala dapat mengambil gudang data secara offline - yang OK sejak Tugas-tugas ini boleh dilakukan pada waktu bukan perniagaan (malam / hujung minggu). "
Tapi pelanggan Aster, yang termasuk aCerno, rangkaian penyampaian pengiklanan internet," bergantung pada analisis data untuk pendapatan mereka, "kata Bawa. Aster's nCluster 3.0 menyebarkan beban kerja ke atas sejumlah pelayan dan memudahkan untuk menambahkan mesin tambahan untuk lebih banyak kuasa. Perisian ini juga memisahkan pelbagai komponen beban kerja analisis data ke dalam kepingan diskret.
A "loader" tier memperkatakan pemuatan data dan eksport ke dan dari sumber luaran; lapisan "pekerja" menyimpan data pada cakera yang dilampirkan secara tempatan untuk pertanyaan; dan lapisan nod "ratu" melakukan perancangan dan pemprosesan permintaan pintar.
Sementara itu, para pengguna bekerja dengan cluster seolah-olah ia satu entiti tunggal.
Keupayaan untuk memilih skala segmen cluster bermakna pengguna dapat menambah sumber
Kepada keupayaan teras ini, pembebasan 3.0 menambah beberapa fungsi untuk "sentiasa-aktif", termasuk keupayaan untuk menambah kapasiti, mengembalikan data dan memulihkan data sementara
"Kami mahu membina sistem yang boleh mengendalikan 10x, 100x lebih banyak data berbanding sistem lain hari ini, tetapi ini juga banyak data untuk mana-mana pelayan komoditi tunggal, "kata CTO Tasso Argyros dalam catatan blog. "Jadi kami meletakkan banyak usaha R & D untuk menyeragamkan setiap fungsi sistem - tidak hanya menanyakan, tetapi juga memuatkan, mengeksport data, sandaran, dan naik taraf. Selain itu, kami membenarkan pengguna kami memilih berapa banyak yang mereka ingin parallelize semua fungsi ini, tanpa perlu meningkatkan keseluruhan sistem. "
Pembebasan ini juga termasuk sokongan untuk MapReduce, teknik pengaturcaraan yang asalnya dibangunkan oleh Google yang memudahkan para pemaju untuk menulis program untuk menganalisis set data yang besar. Petualangan Aster Greenplum juga baru-baru ini mengumumkan sokongan MapReduce.
Ciri-ciri tambahan termasuk keupayaan untuk memilih tahap mampatan data untuk jadual individu, alat peningkatan "satu klik"; dan ciri keselamatan yang lebih baik, seperti LDAP (Protokol Akses Direktori Ringan) untuk pengesahan dan keupayaan untuk menguruskan keistimewaan pengguna di peringkat kluster, pangkalan data dan jadual.
Banyak pelanggan awal Aster, yang juga termasuk MySpace, memfokus kepada Web, kata Curt Monash, presiden Monash Research.
"Sebahagian besar daripada pertumbuhan dan peluang dalam pergudangan data terletak pada berurusan dengan jenis data yang agak baru," katanya. "Terdapat gudang data yang besar berurusan dengan OLTP tradisional, data transaksional, tetapi Aster tidak semestinya pesaing utama dalam menganalisisnya. Tempat yang manis dalam menganalisis sejumlah besar data adalah data Web dan peristiwa rangkaian yang berkaitan."
Monash dikutip pentadbiran pemprosesan selari dan sokongan untuk MapReduce sebagai kekuatan utama Aster: "Aster adalah permulaan dengan produk yang relatif belum matang, tetapi mereka telah banyak memikirkan cara membuat pemprosesan selari mudah untuk dijalankan."
NCluster 3.0 berjalan pada pelayan x86 standard. Harga adalah berdasarkan kepada berapa data yang diuruskan. Syarikat itu sebelum ini berkata bahawa kos bermula pada AS $ 100,000.
Garis Panduan Sumber Terbuka Sektor Awam Eropah Garis Panduan Spark
Garispanduan sumber awam sektor awam mencetuskan perdebatan undang-undang. menyokong perisian sumber terbuka apabila mereka mengadakan tender untuk kontrak awam? Ahli ekonomi dan pembuat dasar kelihatan berfikir demikian tetapi gergasi industri termasuk Microsoft berhujah bahawa ini akan menjadi diskriminasi dan sedang mempertimbangkan tindakan undang-undang untuk mencegah hal ini berlaku.
Aster Data Melancarkan Edisi Awan Pangkalan Data Analitik
Pangkalan data analisis Aster Data Systems kini tersedia untuk penggunaan di Amazon EC2 dan AppNexus
IBM Beli Pangkalan Data Keselamatan Pangkalan Data Guardium
IBM telah membeli penjaga keselamatan pangkalan data Guardium untuk jumlah yang tidak didedikasikan