World's faster supercomputer
Isi kandungan:
Seiring dengan perkembangan superkomputer yang lebih kuat, mereka juga akan menjadi semakin terdedah kepada kegagalan, berkat peningkatan jumlah komponen terbina dalam. Beberapa penyelidik pada persidangan SC12 minggu lalu di Salt Lake City, Utah, menawarkan penyelesaian yang mungkin untuk masalah yang semakin meningkat ini.
Sistem pengkomputeran prestasi tinggi (HPC) hari ini boleh mempunyai 100,000 nod atau lebih-dengan setiap nod dibina daripada berbilang komponen memori, pemproses, bas dan litar lain. Secara statistik, semua komponen ini akan gagal pada satu ketika, dan mereka menghentikan operasi apabila mereka berbuat demikian, kata David Fiala, seorang pelajar Ph.D di North Carolina State University, ketika bercakap di SC12.
Masalahnya tidak yang baru, tentu saja. Apabila 600-nod ASCI Makmal Kebangsaan Lawrence Livermore (Inisiatif Pengkomputeran Strategik Dipercepatkan) superkomputer putih pergi dalam talian pada tahun 2001, ia mempunyai masa min antara kegagalan (MTBF) hanya lima jam, terima kasih sebahagiannya daripada kegagalan komponen. Usaha penalaan yang lebih baik telah meningkatkan MTBF ASCI White hingga 55 jam, kata Fiala.
Tetapi ketika jumlah nod superkomputer tumbuh, begitu pula masalahnya. "Sesuatu yang perlu dilakukan mengenai perkara ini, ia akan menjadi lebih teruk lagi apabila kita beralih ke exascale," kata Fiala, merujuk kepada bagaimana superkomputer dalam dekad yang akan datang sepatutnya mempunyai sepuluh kali kuasa komputasi yang model hari ini.
Teknik hari ini untuk menangani kegagalan sistem mungkin tidak begitu baik, kata Fiala. Dia mengutip pemeriksaan, di mana program berjalan sementara dihentikan dan keadaannya disimpan ke cakera. Sekiranya program kemudiannya terhempas, sistem dapat memulakan semula tugas dari pos pemeriksaan terakhir.
NCSUDavid Fiala Masalah dengan checkpointing, menurut Fiala, adalah kerana bilangan node tumbuh, jumlah overhead sistem diperlukan untuk melakukan checkpointing juga tumbuh-dan berkembang pada kadar eksponen. Pada superkomputer 100,000-nod, sebagai contoh, hanya kira-kira 35 peratus daripada aktiviti itu akan terlibat dalam menjalankan kerja. Selebihnya akan diambil oleh checkpointing dan -juga operasi sistem pemulihan gagal, Fiala dianggarkan
Kerana semua perkakasan tambahan yang diperlukan untuk sistem exascale, yang boleh dibina dari sejuta atau lebih komponen, kebolehpercayaan sistem akan mempunyai
Saranan yang baik: cadangan data
Fiala yang dibentangkan teknologi yang dia dan rakan-rakan penyelidik maju yang dapat membantu meningkatkan kebolehpercayaan. Teknologi ini menangani masalah data rasuah yang diam, apabila sistem membuat ralat yang tidak dapat dikonfigurasi menulis data ke cakera.
Pada asasnya, pendekatan penyelidik terdiri daripada menjalankan beberapa salinan, atau "klon" dari suatu program, secara bersamaan dan kemudian membandingkan jawabannya. Perisian yang dipanggil RedMPI, dijalankan bersama dengan Interface Message Passing (MPI), sebuah perpustakaan untuk memecah aplikasi yang berjalan di beberapa pelayan supaya bahagian-bahagian yang berlainan dari program dapat dilaksanakan selari.
RedMPI memintas dan menyalin setiap MPI mesej bahawa aplikasi menghantar, dan menghantar salinan mesej ke klon (atau klon) program. Jika klon yang berbeza mengira jawapan yang berbeza, maka nombor boleh dikira semula dengan cepat, yang akan menjimatkan masa dan sumber daya dari menjalankan keseluruhan program sekali lagi.
"Melaksanakan redundansi tidak mahal. Ini mungkin tinggi dalam bilangan bilangan teras yang diperlukan, tetapi ia menghindarkan keperluan menulis semula dengan pemeriksaan semula, "kata Fiala. "Pilihannya, sememangnya, untuk mengalihkan semula pekerjaan sehingga anda fikir anda mempunyai jawapan yang betul."
Fiala mengesyorkan menjalankan dua salinan sandaran bagi setiap program, untuk reduksi tiga. Walaupun menjalankan pelbagai salinan sesuatu program pada awalnya akan mengambil lebih banyak sumber, dari semasa ke semasa ia mungkin lebih berkesan, disebabkan oleh hakikat bahawa program tidak perlu diulang semula untuk memeriksa jawapan. Juga, pemeriksaan mungkin tidak diperlukan apabila banyak salinan dijalankan, yang juga akan menjimatkan sumber sistem.
UCSCEthan Miller"Saya fikir idea melakukan redundansi sebenarnya merupakan idea yang hebat. [Untuk] perhitungan yang sangat besar, yang melibatkan beratus-ratus ribu nod, pastinya ada kemungkinan bahawa kesilapan akan merayap," kata Ethan Miller profesor sains komputer di University of California Santa Cruz, yang menghadiri persembahan itu. Tetapi beliau berkata pendekatan itu mungkin tidak sesuai memandangkan jumlah trafik rangkaian yang boleh dibuat seperti redundansi. Beliau mencadangkan untuk menjalankan semua aplikasi pada set nod yang sama, yang dapat meminimumkan lalu lintas internode.
Dalam persembahan lain, Ana Gainaru, seorang pelajar Ph.D dari University of Illinois di Urbana-Champaign, mempersembahkan teknik menganalisis log fail untuk meramalkan apabila kegagalan sistem akan berlaku.
Kerja ini menggabungkan analisis isyarat dengan perlombongan data. Analisis isyarat digunakan untuk mencirikan tingkah laku biasa, jadi apabila kegagalan berlaku, ia dapat dilihat dengan mudah. Perlombongan data mencari korelasi antara kegagalan yang dilaporkan berasingan. Penyelidik lain telah menunjukkan bahawa banyak kegagalan kadang-kadang berkorelasi antara satu sama lain, kerana kegagalan dengan satu teknologi boleh menjejaskan prestasi orang lain, menurut Gainaru. Sebagai contoh, apabila kad rangkaian gagal, ia akan segera mengejar proses sistem lain yang bergantung kepada komunikasi rangkaian.
Para penyelidik mendapati bahawa 70 peratus kegagalan berkorelasi menyediakan peluang untuk lebih daripada 10 saat. Dalam erti kata lain, apabila tanda pertama kegagalan telah dikesan, sistem mungkin mempunyai sehingga 10 saat untuk menyelamatkan karyanya, atau menggerakkan kerja ke nod lain, sebelum kegagalan yang lebih kritikal berlaku. "Ramalan kegagalan boleh digabungkan dengan teknik toleransi kesalahan lain," kata Gainaru.
Joab Jackson merangkumi perisian perusahaan dan berita teknologi umum untuk Perkhidmatan Berita IDG. Ikut Joab di Twitter di @Joab_Jackson. Alamat e-mel Joab ialah [email protected]
Yang paling besar, paling buruk, paling sejuk penyejat PC sepanjang masa
Lihat! Smorgasbord visual meraikan CPU dan penyejuk GPU yang direka untuk orang yang mempunyai lebih banyak ruang kes daripada akal sehat. Kami berharap anda sudah bersedia untuk banyak tembaga.
Chrome pertama jatuh di Pwn2Own - jatuh dalam lima minit pertama
Dalam masa 5 minit peraduan Pwn2Own bermula, Googles mendakwa menjadi
Berapa berat telefon pintar anda dengan berat?
Apakah berat badan? Bagaimana kita menentukan betapa beratnya sesuatu? Ternyata gram itu adalah unit jisim dan tidak ...