1: ノチラ ★ 2018/02/09(金) 00:02:10.35 _USER
 774index
三菱UFJニコスは2018年2月7日、2017年末に発生したシステム障害の原因や影響範囲などについて発表した。同社のクレジットカード「NICOSカード」の基幹システムで、ハードディスク(HDD)が3個故障したのが原因だ。2018年1月末時点で一部の会員に対する請求が遅れているなど、事態を収束しきれていない。

マスターデータから中間加工ファイルを作成するバッチ処理のシステムでHDDが故障し、障害が発生した。三菱UFJニコスによれば、HDD15個で一連の機能を果たしており、そのうち3個が同時に故障した。「2個までの同時障害は自動復旧可能な仕組みを設けていたが、3個の故障は想定外だった」(広報)。同社はシステムやHDDの開発企業を明らかにしていないものの、「発生確率は極めて低いとの報告を受けている」という。

 故障したHDDは、障害が発生した2017年12月26日中に交換したが、利用会員の売上データ処理などに遅れが発生した。一部の利用会員に2重請求が発生したほか、請求が遅れるなどの事態につながった。同社はシステム機器の監視体制を強化するなどして対策を講じるという。
http://itpro.nikkeibp.co.jp/atcl/news/17/020803126/
引用元: http://egg.5ch.net/test/read.cgi/bizplus/1518102130/


2: 名刺は切らしておりまして 2018/02/09(金) 00:04:02.26
んなわけあるカー位

3: 名刺は切らしておりまして 2018/02/09(金) 00:08:30.64
はいはい、想定外想定外

4: 名刺は切らしておりまして 2018/02/09(金) 00:10:18.24
糞寒い時期なのに珍しいな

5: 名刺は切らしておりまして 2018/02/09(金) 00:11:06.70
3個壊れた事が原因じゃなくて、3個同時に壊した何か外的要因を見付けないと再発するんじゃ…

6: 名刺は切らしておりまして 2018/02/09(金) 00:13:16.40
どうせ二個まで大丈夫だから放置してたんだろ

7: 名刺は切らしておりまして 2018/02/09(金) 00:15:32.33
HDDが3個同時に  ね。
電源だろ。

9: 名刺は切らしておりまして 2018/02/09(金) 00:17:01.41
ミラーとかいろいろな障害対応機器にしてないのか?
故障率減らす対策

10: 名刺は切らしておりまして 2018/02/09(金) 00:17:41.75
これまでどう補修してきたかだねぇ。壊れるごとに1つずつ交換していくと
だんだん壊れる確率は上がってくるんだが...

11: 名刺は切らしておりまして 2018/02/09(金) 00:20:12.73
大昔のメインフレームHDDのほうが壊れないとかw

14: 名刺は切らしておりまして 2018/02/09(金) 00:22:19.24
 


こういうのはさ、本当の原因を明らかにしないこともある。
とりあえず出して来た報告はRaid6?の訂正不能エラーだけどさ。


 

15: 名刺は切らしておりまして 2018/02/09(金) 00:25:16.00
「同時に」ってのがどのくらいかだよなあ
例えば1週間かけて壊れたなら、監視体制が完全に悪い
本当に1秒の狂いもなく同時に壊れたなら、外的要因だからそれを解決しないといかん

偶然では済まされない話

30: 名刺は切らしておりまして 2018/02/09(金) 01:00:40.96
>>15
文系の経営は馬鹿だからこういうことがわからんのです
対応は講じても原因を追求するという研究心がない

17: 名刺は切らしておりまして 2018/02/09(金) 00:27:08.11
SDDに変えよう

18: 名刺は切らしておりまして 2018/02/09(金) 00:28:30.29
SSDです ごめんなさい

20: 名刺は切らしておりまして 2018/02/09(金) 00:30:28.89
 


SSDは増えてるよ。法人向けでは多少高くても。

でもクレカ業界は競争が激しいからなあ。


 

22: 名刺は切らしておりまして 2018/02/09(金) 00:45:07.50
15個くらいSSDに替えろや

25: 名刺は切らしておりまして 2018/02/09(金) 00:50:52.72
同一の初期ロットで何か問題あつろたと考えれるよ
多分公表しないけど

39: 名刺は切らしておりまして 2018/02/09(金) 01:31:31.06
>>25
RAID 製品はロット不良回避するためにシャッフルしてメーカが出荷してくるよ。

26: 名刺は切らしておりまして 2018/02/09(金) 00:52:23.42
同時故障なんて普通ない
ディスクを収容してるハードウェアの問題を疑う

39: 名刺は切らしておりまして 2018/02/09(金) 01:31:31.06
>>26
RAIDカードが誤動作して(実際には故障してないのに)HDD故障連発してくれるやつを
引いたことがあるんで、その可能性はあるね。

27: 名刺は切らしておりまして 2018/02/09(金) 00:53:29.11
まあ、電源が原因だろうな。

39: 名刺は切らしておりまして 2018/02/09(金) 01:31:31.06
>>27
3.5インチの HDD なら 2U で12個収容なので、HDDx15構成の場合はエンクロージャ
2台目にHDD3個収容。 これもありうるね。

29: 名刺は切らしておりまして 2018/02/09(金) 00:58:05.28
>>1
なか〜ま
俺もバックアップ含めて3つの同時に飛んだ
物理的にぶっ壊れてだからしょうがないけどね

でも企業がこれはだらしないね

32: 名刺は切らしておりまして 2018/02/09(金) 01:12:30.62
昔似たようなことを経験したなぁ。
実際には HDD は故障していないにもかかわらず RAID カードが故障と
みなしてちょいちょい HDD が故障が頻発、データロストしてくれましたよ。
たまたま別サーバ増設時に再発して、新規サーバの RAID カードに
交換してみたら直って原因が発覚したが。

35: 名刺は切らしておりまして 2018/02/09(金) 01:22:17.52
因みに対策は、バックアップを取るかレプリケーションを構築することな。

金をけちって、ストレージ1台でやろうとするから、こんなことになるんだよ。

警報監視の強化とかは短期的な施策であって全然根本解決にならない。
基幹システムなら、金をかけて2重化しろってこと。
ニコスの担当役員がアホなんだろうな。

36: 名刺は切らしておりまして 2018/02/09(金) 01:23:33.33
復旧後に重複請求やらかてるあたり、トランザクションDBだと思うので RAID は 10 かな。
3個同時に壊れたとかいってるけど、プレスリリースで対応策のいの一番に監視強化とか
出してる辺り、監視システムの設定忘れなだけだと思う。

38: 名刺は切らしておりまして 2018/02/09(金) 01:24:51.98
これがリスク分散の現実

41: 名刺は切らしておりまして 2018/02/09(金) 01:43:06.34
3台に共通してる部分がなんかしらあるはず

45: 名刺は切らしておりまして 2018/02/09(金) 01:55:01.78
シーゲートだな

46: 名刺は切らしておりまして 2018/02/09(金) 01:55:35.87
同時3個のハードディスクじゃなく
壊れてたけどほったらかし状態だったハードが
3個目でトラブルが出たって言う事でしょ
サーバー的なハードって2個で同じ情報を管理し
1個が壊れても修復が出来るって言う品物

48: 名刺は切らしておりまして 2018/02/09(金) 01:58:04.16
これはしょうがない気もするんだが、続報ほしい

50: 名刺は切らしておりまして 2018/02/09(金) 02:03:10.41
基幹システムはraid0+1の考え方の3重ミラーじゃないと駄目なんだよな。
2重だと片ミラー状態からの復旧時にコピー元が壊れてはいさようならになるし。
raid5とか6なんて信頼性無いと思う。

52: 名刺は切らしておりまして 2018/02/09(金) 02:13:37.06
誰かが意図的にやったか、HDDが故障するような環境状態になったか
まあいずれにしても無理やり偶然だったことにするか

53: 名刺は切らしておりまして 2018/02/09(金) 02:41:19.50
RAID6って、全く同じ情報を二つ持っておくやり方と比べて
どっちが安全性が高いですか?

57: 名刺は切らしておりまして 2018/02/09(金) 03:23:05.06
ユーチューバーと大差ないストレージ環境でカード会社を運営してるのだろうか?

60: 名刺は切らしておりまして 2018/02/09(金) 04:16:07.83
シーゲート製かな

61: 名刺は切らしておりまして 2018/02/09(金) 04:20:45.34
故障という意味ではどのメーカーも故障する
RAID6だから安心ってアカンやろ

スポンサード リンク