工行系统故障找到了“替罪羊”:IBM软件

来源:百度文库 编辑:超级军网 时间:2024/04/27 06:22:40


http://news.mydrivers.com/1/268/268575.htm
近日,中国工商银行信息科技部就6月23日工行系统故障事件(以下简称“6·23事件”)正式作出内部通报,这份通报称,工行数据中心(上海)主机系统出现故障,是由于IBM提供的主机DB2V10版本内存清理机制存在缺陷引发。
而在技术问题之外,工行本身的管理问题以及国内银行业信息系统落后的沉疴可能也是此次事件的诱因。
事件原因直指IBM:软件存在缺陷
6月28日上午,工行某直属一级分行信息科技部员工陆续收到内部通报邮件。该通报就6·23事件的情况及原因作了基本描述,但对事件影响范围、内部处理能力判断均语焉不详。
通报称:“6月23日上午,数据中心(上海)监控发现主机CPU利用率升高,经分析判断与6月23日凌晨实施的主机DB2数据库软件升级版本有关(从V9升级到V10),在紧急回退升级系统软件版本后系统运行恢复正常。”同时,工行总行信息科技部将该事件直接原因归为IBM公司提供的软件产品存在缺陷,并称这点“经IBM公司正式确认”。


工行就6·23事件做出的正式内部通报文件
6月23日上午,全国多地中国工商银行柜台、ATM、网银业务出现故障,持续近1个小时。作为服务2.92亿个人客户及400多万公司客户的全国金融服务巨头,工行此次故障波及北京、上海、广州、武汉、哈尔滨等多个大中型城市。
当日,工行将该事故对外模糊描述为:“中国工商银行部分地区因计算机系统升级原因造成柜面和电子渠道业务办理缓慢。”这也是迄今为止工行就6·23事件向用户发布的唯一公开解释。
IBM公开官方资料显示,工行与IBM的合作始于1997年,至今16年之久。针对通报中提及的“经IBM公司正式确认”,记者联系多位IBM相关负责人,但均未得到回应。
工行IT运维能力遭质疑
这份内部通报由一位不愿透露姓名的工行在职员工提供。该员工表示,自己并不太满意这份解释:“对灾难备份只字未提,有意将管理问题规避为技术问题。”
通报也提及了一些管理问题,但表述颇为模糊,通报称:“(数据中心上海)没有按照‘第一时间恢复生产’的要求采取果断措施及时进行回退,并且回退过程不坚决,耗时较长。”
银行的灾难备份系统,是指银行对本地数据中心的数据、业务系统、软硬件等资源进行同城或异地备份,以确保发生某些不可预测的灾难后,重要信息系统的数据安全的一种预防措施。
据中国银行业监督管理委员会(以下简称“银监会”)发布的《银行业金融机构信息系统风险管理指引》,银行业金融机构应制定信息系统应急预案,并定期演练、评审和修订;全国性数据中心要实现异地灾备。
日前,国内最大的灾难备份服务商万国数据CEO黄伟在接受福布斯中文网采访时表示:“银行的IT系统永远面临信息安全的挑战,但悲哀的是,银行在IT系统和灾难备份中不计成本,但遇到这样的大面积的安全问题依然无法在短时间内恢复系统。”他认为,长久以来国内银行的IT系统运作是在给这样的事件埋下伏笔,他最后指出:“在国内银行,IT系统的搭建更像是给上级和银监会看的‘政绩工程’。”
2008年,现任银监会副主席郭利根曾就多起国内银行信息科技风险事件发表讲话。他说,工行等国有银行是国内在IT技术和风险管控上都比较先进的银行,它们的问题频发,“充分暴露出我国银行业信息系统的脆弱性。”
他指出,基础建设滞后、软硬件及核心技术受制于人和系统管理粗放是当时银行业信息科技建设存在的主要问题,“特别是在业务连续性规划、业务恢复机制、风险化解和转移措施、技术恢复方案等方面,存在明显的‘短板’”。
整整五年过去,工行6.23事件证明了这些问题仍旧没有得到有效解决

http://news.mydrivers.com/1/268/268575.htm
近日,中国工商银行信息科技部就6月23日工行系统故障事件(以下简称“6·23事件”)正式作出内部通报,这份通报称,工行数据中心(上海)主机系统出现故障,是由于IBM提供的主机DB2V10版本内存清理机制存在缺陷引发。
而在技术问题之外,工行本身的管理问题以及国内银行业信息系统落后的沉疴可能也是此次事件的诱因。
事件原因直指IBM:软件存在缺陷
6月28日上午,工行某直属一级分行信息科技部员工陆续收到内部通报邮件。该通报就6·23事件的情况及原因作了基本描述,但对事件影响范围、内部处理能力判断均语焉不详。
通报称:“6月23日上午,数据中心(上海)监控发现主机CPU利用率升高,经分析判断与6月23日凌晨实施的主机DB2数据库软件升级版本有关(从V9升级到V10),在紧急回退升级系统软件版本后系统运行恢复正常。”同时,工行总行信息科技部将该事件直接原因归为IBM公司提供的软件产品存在缺陷,并称这点“经IBM公司正式确认”。

s_62fced6507ea40c6a5bf8f846b66f00a.jpg (92.45 KB, 下载次数: 0)

下载附件 保存到相册

2013-7-9 16:07 上传



工行就6·23事件做出的正式内部通报文件
6月23日上午,全国多地中国工商银行柜台、ATM、网银业务出现故障,持续近1个小时。作为服务2.92亿个人客户及400多万公司客户的全国金融服务巨头,工行此次故障波及北京、上海、广州、武汉、哈尔滨等多个大中型城市。
当日,工行将该事故对外模糊描述为:“中国工商银行部分地区因计算机系统升级原因造成柜面和电子渠道业务办理缓慢。”这也是迄今为止工行就6·23事件向用户发布的唯一公开解释。
IBM公开官方资料显示,工行与IBM的合作始于1997年,至今16年之久。针对通报中提及的“经IBM公司正式确认”,记者联系多位IBM相关负责人,但均未得到回应。
工行IT运维能力遭质疑
这份内部通报由一位不愿透露姓名的工行在职员工提供。该员工表示,自己并不太满意这份解释:“对灾难备份只字未提,有意将管理问题规避为技术问题。”
通报也提及了一些管理问题,但表述颇为模糊,通报称:“(数据中心上海)没有按照‘第一时间恢复生产’的要求采取果断措施及时进行回退,并且回退过程不坚决,耗时较长。”
银行的灾难备份系统,是指银行对本地数据中心的数据、业务系统、软硬件等资源进行同城或异地备份,以确保发生某些不可预测的灾难后,重要信息系统的数据安全的一种预防措施。
据中国银行业监督管理委员会(以下简称“银监会”)发布的《银行业金融机构信息系统风险管理指引》,银行业金融机构应制定信息系统应急预案,并定期演练、评审和修订;全国性数据中心要实现异地灾备。
日前,国内最大的灾难备份服务商万国数据CEO黄伟在接受福布斯中文网采访时表示:“银行的IT系统永远面临信息安全的挑战,但悲哀的是,银行在IT系统和灾难备份中不计成本,但遇到这样的大面积的安全问题依然无法在短时间内恢复系统。”他认为,长久以来国内银行的IT系统运作是在给这样的事件埋下伏笔,他最后指出:“在国内银行,IT系统的搭建更像是给上级和银监会看的‘政绩工程’。”
2008年,现任银监会副主席郭利根曾就多起国内银行信息科技风险事件发表讲话。他说,工行等国有银行是国内在IT技术和风险管控上都比较先进的银行,它们的问题频发,“充分暴露出我国银行业信息系统的脆弱性。”
他指出,基础建设滞后、软硬件及核心技术受制于人和系统管理粗放是当时银行业信息科技建设存在的主要问题,“特别是在业务连续性规划、业务恢复机制、风险化解和转移措施、技术恢复方案等方面,存在明显的‘短板’”。
整整五年过去,工行6.23事件证明了这些问题仍旧没有得到有效解决
这是在为换系统做宣传吗?
结合前段时间国产服务器在新疆银行使用的消息来看
灾备是保护数据的措施。
迅速恢复业务,最扯得上的也就热备,但这次是数据库升级,即使热备也得数据库统一。
遇上新数据库本身的缺陷,无解,除了停止业务把数据倒回去还有什么办法?
zchzyh 发表于 2013-7-9 16:10
这是在为换系统做宣传吗?
结合前段时间国产服务器在新疆银行使用的消息来看
工行用的是Z系列主机,无法替代,只有抱着十八摸大腿。
灾备是保护数据的措施。 迅速恢复业务,最扯得上的也就热备,但这次是数据库升级,即使热备也得数据库统一 ...
应该找实验机,试升级。
核心金融完全被国外控制
ertert 发表于 2013-7-9 16:41
应该找实验机,试升级。
工行肯定做过的,但实验环境和线上环境还是有差异,缺陷未必能暴露出来。
工行肯定做过的,但实验环境和线上环境还是有差异,缺陷未必能暴露出来。
怎么个肯定法?
IBM在某狼那里不是无所不能吗?怎么软件还会出问题?
是不是因为俺弟弟离开了数据中心,换了个新手接班啊……:)
ertert 发表于 2013-7-9 17:08
怎么个肯定法?
虽然没亲眼见他们这次是不是确实做了测试,但是呢,就常规来说,这么大规模升级,不可能不做实际测试。否则工行珠海开发中心地下室摆的大机们干嘛用的?
ertert 发表于 2013-7-9 17:08
怎么个肯定法?
没有直接证据。
个人以前做过银行项目,像迁移数据库这么大的动作,像工行牵涉面如此广的单位,一定会慎重行事。
这样说肯定无法满足你,不信我也没办法了。
花落庭院 发表于 2013-7-9 17:43
IBM在某狼那里不是无所不能吗?怎么软件还会出问题?
很多年前我在某行开发程序,Informix数据库存在一个游标上的bug,短时间内厂商解决不了,只好在编程上绕过。
IBM的P系列机器上也遇到过AIX的很古怪的问题,谁都不知道怎么处理,只能绕过。
软件用久用细了,多多少少都会发现毛病,很正常的事情。
核心东西一直用国外的!什么时候才能都用上国产的
前几年银联系统故障那次,貌似也是IBM扛了。据说是系统版本有bug,有补丁,但是没打上这个补丁。
十八摸真是懂中国领导啊~!难怪生意做得这么好~!
中国领导出了事肯定要找人扛的。。十八摸这次帮领导扛了,,,工行领导至少要给他们10个亿的生意~!


热备不是那么容易切的

说无缝切其实绝少能有真无缝的

银行数据,丢一条都是不得了的事情

当年星展大机当机,也是宁可10多个小时停止服务硬抗,也没敢切热备

而且这次还是数据库软件本身出了问题

热备不是那么容易切的

说无缝切其实绝少能有真无缝的

银行数据,丢一条都是不得了的事情

当年星展大机当机,也是宁可10多个小时停止服务硬抗,也没敢切热备

而且这次还是数据库软件本身出了问题
壮东风 发表于 2013-7-9 20:34
很多年前我在某行开发程序,Informix数据库存在一个游标上的bug,短时间内厂商解决不了,只好在编程上绕 ...
informix数据库也被IBM收购了,但已经不再维护,不负责了,因此我们公司都把原来的informix库转到oracle了。
informix,成了我一个记忆了,与其打了10年交道
htl 发表于 2013-7-10 07:54
informix数据库也被IBM收购了,但已经不再维护,不负责了,因此我们公司都把原来的informix库转到oracle ...
我想IBM还是提供Informix的技术支持的。
貌似Informix被收购以后就转型了。
壮东风 发表于 2013-7-10 08:58
我想IBM还是提供Informix的技术支持的。
貌似Informix被收购以后就转型了。
用了oracle之后,真心觉得,informix也确实该了。
甲骨文已经是数据库界的大神了。。