Microsoftの12月Azureの停止:何が問題になりましたか?

2012年末、Windows Azureは2日以上、Microsoftの米国南部地域のデータセンターを利用している一部のMicrosoftのパブリッククラウド顧客にとってはダウンしていました。

Windows Azureストレージアカウントのキューデータのジオレプリケーションセカンダリロケーションから顧客のストレージアカウントへの読み取り専用アクセス、ジオレプリケートストレージアカウントの顧客管理フェールオーバー。その個々のビジネスニーズ “は、記憶域アカウントのフェイルオーバーをトリガするプログラミングインターフェイスを介して提供されます。

1月16日、マイクロソフトの役員は、Windows Azureのブログで起こったことを忘れてしまった。

同社によれば、この停電は、米国南部地域の1つの「ストレージスタンプ」、または複数のストレージノードラックを持つクラスタ内にあったWindows Azureストレージアカウントの1.8%に影響を与えた。ボット氏は、サービス障害を顧客に警告するために設計されたヘルスダッシュボードは、ダウンしたクラスタに依存していたため、機能していなかったと指摘しました。

このイベントの驚異的な性質と期間のために、影響を受けるすべての顧客、影響を受ける毎月の請求期間のすべてのストレージ容量およびストレージ取引費用に対して100%サービスクレジットを提供しています」と、死後の著者であるMike Neil Windows Azureのブログサイトに投稿してください(このクレジットは積極的に適用されます)。

詳細なブログ記事は、12月のストレージ停止につながった3つの問題があることに気づいた。一部のノードでノード保護がオンになっていませんでした。この種の問題を検出する監視システムには障害があり、アラームやエスカレーションは発生しませんでした。さらに、新しいプライマリノードに移行すると、他のノードのフォーマットが正しくないという反応が発生しました。通常、ポストによれば、システムは3つの別々の障害ドメインに3つのデータコピーを分散しているので、Azureはスタンプ内の2ノードのデータの同時障害を生き残っているはずです。

しかし、再フォーマットされたノードはすべての障害ドメインに広がっており、場合によっては3つのデータすべてが利用できなくなってしまいました。

チームはプランA(データを元に戻す)とプランB(ジオ・リダンダント・ストレージとフェイルオーバー)を考え出しました。彼らはAと一緒に行くことに決めました。

Azureのチームは、顧客が耐久性の中から選択できるようにすることを約束しています。これを可能にするために、マイクロソフトはAzureにいくつかの新機能を追加しようと努めています。これらには

Windows Azureストレージアカウントのキューデータのジオレプリケーション

クラウド;クラウドコンピューティングは一度に1つのAPI、エンタープライズソフトウェア、甘いSUSE! HPはLinuxディストリビューションを曇らせる、クラウド、Twilioは新しいエンタープライズプランをより敏捷性を約束する、クラウド、Intel、Ericssonがパートナーシップを拡大してメディア業界に注力

セカンダリロケーションから顧客のストレージアカウントへの読み取り専用アクセス

ストレージアカウントのフェイルオーバーをトリガーするためのプログラミングインターフェイスを介して提供される、個々のビジネスニーズに基づいてデータの耐久性よりもサービスの可用性に優先順位を付けることができるようにすることで、ジオレプリケートストレージアカウントの顧客管理フェールオーバーを実現します。

12月下旬の停止の影響を受けたAzureの最も声高な顧客の1つは、Windowsの診断ベンダーSolutoでした。

1月初旬、同社はユーザーに「予期しないダウンタイムの62時間」と同社のサービスに到達できないという謝罪状を送った。

そのメモ(Shaun Jenningsのおかげで見たコピー)では、Solutoの関係者は、アマゾンがAmazon Webサービス上でAzureを使うことに決めたと指摘した。より成熟したプラットフォームです。

「BizSpark OneプログラムにMicrosoftが加わることで、多くの助けが得られました。私たちは高い価格設定と最高レベルのサポートを得ています。関係者は、この決定は功を奏すると述べた。

ストレージ停止とそれに続くAjaxのコンテンツ配信ネットワークの問題が発生しているにもかかわらず、SolutoはAzureに訴えている、とチーフプロダクトオフィサー、Roee Adlerは述べています。

「おそらくAmazonで重要な要素に冗長性を追加することになるだろうが、今のところAzureは大部分を守っている」とAdler氏は語る。

クラウドコンピューティングの成長

甘いSUSE! HPEがLinuxディストリビューションに突入

Twilio、新しいエンタープライズプランを発表

インテル、エリクソン、メディア業界に注力するためのパートナーシップを拡大