1: 田杉山脈 ★ 2018/10/24(水) 22:16:33.82 _USER
wsindex
日本時間で2018年7月16日の正午に始まったAmazonプライムデー2018では、セール開始直後にサーバーがダウンして約1時間にわたってアクセス障害が発生しました。Amazonが内部調査を行って作成した報告書によると、この問題は取引のデータベース(DB)を従来のOracle製から自社製に乗り換えたことが最大の理由である可能性が高まっています。

Amazon move off Oracle caused Prime Day outage in warehouse
https://www.cnbc.com/2018/10/23/amazon-move-off-oracle-caused-prime-day-outage-in-warehouse.html

Amazonプライムデー2018は同社にとって「史上最高」となるセールス記録を樹立しました。Amazonは売上高を公表しないことで知られていますが、2018年にはセール期間中に1億点以上の商品が売れたとしており、日本円で2000億円規模の売上高があったとみられています。

Amazon、プライムデーで過去最高の売上を記録 1億点以上の商品を販売 - iPhone Mania
https://iphone-mania.jp/news-219376/

世界的な「ネット通販絶好調」を改めて認識させる実績だったわけですが、実はその裏ではセール初日にサーバーがダウンして、日本円で100億円以上の機会損失が発生していたことも明らかになっています。

Amazonの調査報告書を入手したというCNBCが報じたところによると、オハイオ州にある北米最大のAmazonの倉庫(フルフィルメント・センター)で起こった障害は、DBの処理能力がネックとなって発生したものであると分析されているとのこと。Amazonは2020年までに商品管理のDBをOracle製から自社製に入れ替える方針を定めており、既に多くの工場ではAmazon Web Service(AWS)のAmazon Aurora PostgreSQL(Aurora)の導入が進められています。しかしこの新DBが爆発的に増加した注文数に対応しきれなくなったことで、システム全体がダウンする事態に至った模様です。

大きな問題を引き起こすことになった要因の一つが、OracleとAuroraの間で「savepoint」の扱い方が異なる点にあるといいます。savepointは個別の取引をトラッキングあるいは復元するために重要なDBツールなのですが、プライムデーに発生した極めて大量の注文により膨大な量のsavepointが作成され、システム全体の処理速度が異常に低下してしまったと報告書では示されているとのこと。

イリノイ大学アーバナ・シャンペーン校のコンピューターサイエンティストであるマット・シーザー氏はCNBCが入手した資料に目を通して、「もしAmazonがOracleを使い続けていたら、この問題は起こらなかったでしょう」と述べて、DBシステムの乗り換えが障害の最大の要因であることを指摘。さらに、増大する取引量の規模に見合った事前の対策が行われず、問題が発生した際の対処マニュアルなどの準備が不足していたために、障害を取り除くまでに1時間もかかってしまったという問題点も指摘されています。

このように、Amazonの大規模なシステム障害は「起こるべくして起こった」という側面は否定しきれない模様。この件とは別に、Oracleの会長で共同設立者でもあるラリー・エリソン氏はAmazonがOracleから距離を置くという方針を示したことに対し、「Oracleなしでは無理だ」という発言を過去に行っています。また、Moor Insights & Strategyのアナリストであるパトリック・ムーアヘッド氏は「AWS Auroraは、将来志向のアプリケーション向けに設計されているのに対し、Oracleはレガシー的なアプリケーションに適した設計となっています」と語っています。
https://gigazine.net/news/20181024-amazon-prime-day-outage-database/
引用元: http://egg.5ch.net/test/read.cgi/bizplus/1540386993/


2: 名刺は切らしておりまして 2018/10/24(水) 22:17:28.18
AmazonよりZOZOTOWNの方が優秀だよ(´・ω・`)

3: 名刺は切らしておりまして 2018/10/24(水) 22:21:36.93
なるほど・・・オラクル止めれば、長い目で見たら相当なコスト削減になる

4: 名刺は切らしておりまして 2018/10/24(水) 22:28:31.01
プライムやめたのにプライムになってた

45: 名刺は切らしておりまして 2018/10/25(木) 00:57:55.33
>>4
実は俺も

5: 名刺は切らしておりまして 2018/10/24(水) 22:34:21.98
OracleとPostqresってそんなに差があるのかな?
savepointの実装や使い方がOracleに最適化されていてそのまま使ったことが問題だったとかはないのか?
AWSのインスタンスとかストレージとかは同じ条件で比べてるのか?
そもそもリレーショナルDBを使うほど否定的の問い合わせが多いのか?

19: 名刺は切らしておりまして 2018/10/24(水) 23:03:39.24
>>5

マルチスレッドの使い方はoracleの方がスゴイよ。

27: 名刺は切らしておりまして 2018/10/24(水) 23:34:42.36
>>5
>OracleとPostqresってそんなに差があるのかな?
ある。

>savepointの実装や使い方がOracleに最適化されていてそのまま使ったことが問題だったとかはないのか?

そのままなんて使わない。
バカは本文の意味がわからないね。

>AWSのインスタンスとかストレージとかは同じ条件で比べてるのか?

バカ?なんで、AWSのインスタンスなんかと比べるの?

>そもそもリレーショナルDBを使うほど否定的の問い合わせが多いのか?

は?NoSQLでは手に負えないレベルの話はほぼRDBMSですよ?

ど素人はまずITパスポートレベルからやり直せ、

6: 名刺は切らしておりまして 2018/10/24(水) 22:40:28.92
>Amazonプライムデー初日にサーバーがダウンした

おまえいつも落ちてんだろうが。
落ちないデーなプライムデー初日がまったくないだろうが。

60: 名刺は切らしておりまして 2018/10/25(木) 07:11:50.42
>>6
こういうのは「いいか!押すなよ!絶対に押すなよ!」と同じで鯖落ちするところまでが祭りのお約束だよね

7: 名刺は切らしておりまして 2018/10/24(水) 22:42:06.50
oracleからいくらもらってこの記事書いたんだ?

29: 名刺は切らしておりまして 2018/10/24(水) 23:38:21.82
>>7
まあ、地道なトランザクションはオラクルはチューニングすれば大体なんとかなる。
DB2は危なっかしいが、設計する側が優秀なことが多いから力技使ってもなんとかする。
MySQLやPostGressは差が大きいね。

MySQLはデータベースモデル変えて、オンザフライで動かせばNoSQL並みの速度になる。
PostGressはそもそも速度優先のデータベースじゃない。

10: 名刺は切らしておりまして 2018/10/24(水) 22:45:12.72
オラ狂う

11: 名刺は切らしておりまして 2018/10/24(水) 22:46:40.72
でもこれで経験値稼いで次からあのとんでもないトランザクションをちゃんと処理をこなせるだろ

14: 名刺は切らしておりまして 2018/10/24(水) 22:50:05.48
ボラクルは最近使いづらさの限界点を超えちゃったからな
バージョンアップする度に、変なオプションつけないとまともにメンテ契約できなくなるし

15: 名刺は切らしておりまして 2018/10/24(水) 22:53:09.56
簡単な負荷試験で再現できそうだな…

17: 名刺は切らしておりまして 2018/10/24(水) 22:56:14.02
「データベースは接続技術(キリッ)」
変な顔のAAを使う奴がいたら、そう言ってやろう
発狂するよ

20: 名刺は切らしておりまして 2018/10/24(水) 23:10:59.66
鈍重だけど、お金と人をかけてちゃんと最適化してやれば、
どんだけ負荷をかけても耐えられる化物に進化可能なのが Oracle
でもまあ、お金食い過ぎだよね……

22: 名刺は切らしておりまして 2018/10/24(水) 23:13:22.81
ボラクルが何を言おうが、もうoracle脱出動きは止まらないよ。

25: 名刺は切らしておりまして 2018/10/24(水) 23:19:33.35
オラクルだと落ちなかったという保証は全くないんだよね。
むしろプライムデーの大量アクセスに対して1時間で復旧できたなら
オラクル並みかむしろそれ以上かもしれない、と思うけど。

28: 名刺は切らしておりまして 2018/10/24(水) 23:36:13.66
Amazonや銀行みたいな所はともかく、
普通の企業で何が何でもオラクルじゃないと駄目だという場面は
ほとんど無いだろうな。

32: 名刺は切らしておりまして 2018/10/24(水) 23:41:34.25
AmazonのDBはおかしいな。応答が異常に遅い。

34: 名刺は切らしておりまして 2018/10/25(木) 00:10:11.43
オラクルなんか買収しちまえ

35: 名刺は切らしておりまして 2018/10/25(木) 00:13:49.04
posgreと書いてあるから一から作ってるわけではないだろうが
果てしない開発業務をこなしてるんだな。
たぶん、1秒間に数百万リクエストとか、ほぼ未知の領域の
処理を求められてるんだろう。

36: 名刺は切らしておりまして 2018/10/25(木) 00:16:06.38
ポスグレってamazon製なの?

38: 名刺は切らしておりまして 2018/10/25(木) 00:26:05.23
>>36
ググレカス

39: 名刺は切らしておりまして 2018/10/25(木) 00:27:34.93
オラクルに無駄金使うより自社DB技術者にノウハウ溜まる方が得やん

41: 名刺は切らしておりまして 2018/10/25(木) 00:47:21.55
そのうち枯れたら使ってみたいねaurora

44: 名刺は切らしておりまして 2018/10/25(木) 00:56:09.13
AWS Auroraで構築したけど、Oracleの方が遙かに優れている
けど信者たちはAWSを信じ切っているだけ

48: 名刺は切らしておりまして 2018/10/25(木) 01:27:24.34
sqlite最強

50: 名刺は切らしておりまして 2018/10/25(木) 01:42:10.36
一方、俺は
デブマリアに乗り換えた

52: 名刺は切らしておりまして 2018/10/25(木) 02:30:01.05
要するに、高いソフトだけの性能はある
ってだけの話っすよね

54: 名刺は切らしておりまして 2018/10/25(木) 03:21:03.98
オラクル切りは正しい
事故ったのはいい勉強になっただろ
1時間で直ったのはすごい、単なる再起動じゃなく原因特定して問題解決させたのなら
MySQLのAuroraはコスパ悪い
1時間で何億円の損失が予想されるの?

59: 名刺は切らしておりまして 2018/10/25(木) 06:52:31.98
>>Amazonプライムデー2018は同社にとって「史上最高」となるセールス記録を樹立しました

じゃあいいじゃんw

63: 名刺は切らしておりまして 2018/10/25(木) 07:31:28.03
あー、こりゃバグだな。
savepointってトランザクションの途中まで戻るやつだけど、
大量の処理さばききれなくてロック多発しまくって、全体のパフォーマンスが大幅に落ちたんだろ。

逆に1時間でどう解消したんだろな?ひたすらロックしてるSQLをKillしまくったんかな?

65: 名刺は切らしておりまして 2018/10/25(木) 07:46:26.40
負荷試験が甘かったか。
でも、プライムデーの状況は、事前テスト可能なんだろうか?どうしても事前にテストできないような状況だったのから、この障害が起きたのかも。

67: 名刺は切らしておりまして 2018/10/25(木) 07:57:38.37
付属のツールが使いやすいしSQLServerでいいわ

スポンサード リンク