Aprende programación






21 ago 2010

Caso Spanair, ¿puede el sistema informático tener parte de responsabilidad en el accidente del JK5022?


Precisamente ayer 20 de agosto, hace dos años en España se sufrió un trágico accidente aereo en la términal T4 de barajas.

A día de hoy se sigue el secreto de sumario sobre la investigación de las causas del accidente, pero los tentaculos de la prensa son muy amplios y existen filtraciones. Una de las noticias con las que nos levantamos es precisamente un artículo del país:
http://www.elpais.com/articulo/espana/ordenador/Spanair/anotaba/fallos/aviones/tenia/virus/elpepuesp/20100820elpepinac_11/Tes

En este artículo comenta que además de los fallos técnicos del avión, el sistema informático no estaba disponible por software malicioso. Por ese motivo los técnicos no pudieron apuntar las incidencias y como consecuencia no saltó la alarma a control para revisar más profundamente el problema. A pesar de ser prensa escrita (que muchas veces lanzan rótulos o noticias partidarias o exageradas) me gustaría comentar que hoy en la radio han entrevisado al presidente de la asociación de dagnificados por el accidente JK5022 y ha dicho que eso era secreto de sumario pero que era una cosa que se había solicitado.

El famoso "sistema caido" son causas que nos encontramos cada vez más en puntos de venta, gestiones o administración. En este caso, ha coincidido con una tragedia y, por supuesto, hay que revisar absolutamente todo. En ningún momento se dice que esta sea la principal causa ya que es una cadena de circunstancias pero si puede ser un eslabón más. Sin embargo si es interesante analizar como de responsable es el sistema, los técnicos informáticos o los gerentes y directores.

Sistema informático, ¿crítico o no crítico?.
El primero de los temas que nos debemos plantear es, ¿es el sistema informático crítico para la vida de las personas?. Un sistema informático puede ser muchas cosas, desde una simple extensión de lo que gestionabamos antes con bolígrafos y papel, hasta sistemas de control de máquinas. Determinar ese nivel de responsabilidad de cada sistema y poner recursos y presupuesto en función la responsabilidad depende de la parte gestora y dirección. Cuando de un sistema puede ser responsable de vidas humanas, es necesario que exista una regulación al respecto, ¡pero ojo!, no vale con decir si has estudiado 3-5 años una ingeniería vales o no. Los ingenieros informáticos no tenemos control de, por ejemplo, el código que se implanta en las actualizaciones de Windows o si un runtime o actualización de software funcionará para todas las operaciones que se hagan. Si pueden evitar y probar el sistema para minimizar el error pero a diferencia con otros campos de ingenieria que trabajan con medidas y valores invariables, en la informática se trabaja sobre el trabajo de otras personas que no cuantifican su trabajo.

El CLUF: la mayoría de software excluyen de responsabilidad de fallos al proveedor
En todos los sistemas operativos o aplicaciones que solemos utilizar en ordenadores personales existe un CLUF o contrato de uso en el que los proveedores de software excluyen toda la responsabilidad de fallos del programa o sistema. No se puede certificar un trabajo que funciona sobre otro trabajo en el cual el propio fabricante excluye su responsabilidad en el caso de fallos. Por todo ello, se utilizan excusas como "fallo informático" para evadirse de la responsabilidad de fallos o errores. En cuestiones de gestión que lo único que provoca son retrasos no es tan crítico pero en sistemas en los que depende la vida de la personas la cosa es más seria.

Para que de la informática pueda depender de vidas humanas, hay que tener sistemas operativos, lenguajes y aplicaciones certificados en seguridad y disponibilidad. Decir que algo está certificado es decir que va a funcionar para ciertas condiciones y para ciertas tareas y por supuesto responsabilizarse de ello en vez de tener un CLUF de exclusión de resposabilidad. Un sistema multiuso como Windows, Linux o Solaris que son multiuso no pueden estar certificados asegurando que todo lo que hacen lo va a hacer bién al 100% bién porque realizan muchas tareas y existen muchos agentes que pueden tirar abajo el sistema. Por ejemplo, un sistema operativo sin ninguna aplicación instalada, el propio hardware lo puede tirar si dá problemas.

¿Que es necesario para sistemas críticos?
Para sistemas críticos, nos tenemos que ir a sistemas informáticos especializados (Mainframes menos conocidos para usuarios) que llevan el hardware y software incorporado de fábrica y no se permite la realización de actualizaciones o modificaciones de ficheros por otras aplicaciones ajenas al sistema. Estos realizan tareas concretas y certifican que estas funcionan en las tareas en las que están especializadas.

Por los datos de la noticia sobre malware, deduzco que el sistema operativo era un Windows Server por lo que se deduce con esas condiciones parece que optaron por reducir costes e ir a un sistema más comercial (menos industrial) y más inestable. Desde el punto de vista de dirección, no era un sistema crítico para la empresa. Tan solo una herramienta de gestión más.

En tal caso, si esa tarea de anotación de incidencias era vital para la vida de las personas, debía existir un procedimiento alternativo (como llamar por teléfono, apuntar en una hoja, etc), en el que se pudiese realizar la misma tarea si ocurriese algo con el sistema informático. En tal caso es responsabilidad del director de sistemas y/o organización establecer más alternativas en el caso de que el sistema falle.

Informática es ahorrar, pero volcarte a otro sistema y ahorrar en informática es perder en disponibilidad del sistema.
En general la informática dá muchas ventajas. Se ahorran costes porque una misma persona puede gestionar muchos más datos que escribirlo en papel. Sin embargo, apuntes que son más serios se deben tener también en papel.

Gestionar del mismo modo información abundante que sirve a modo estadístico para optimizar procesos e información seria de problemas es un error. Ambos pueden ir en el sistema informático, pero los problemas serios al ser menos abundantes deben tener una gestión alternativa (en papel o un sistema cerrado y certificado, por ejemplo).

En fin, no debemos olvidar que la informática multiuso (PCs personales) son una evolución del bolígrafo y papel. Al igual que cuando antes nos fallaba un boligrafo teniamos la alternativa o la precaución de tener varios y tomar otro, el PC también puede fallar y debemos tener previsto que hariamos en tal caso.

Resumen:
Como conclusiones, ha salido a relucir unos de los problemas que cada vez existen en multitud de negocios. Que yo haya sufrido personalmente haciendome ir otro día: al comprar billetes del tren, en el polideportivo, en un juzgado y en el banco/caja. Existe una gran tendencia a informatizar todo para poder sacar estadísticas o para centralizar la información, pero muchas veces nos olvidamos de pensar en que ocurriría si el sistema informático cae. Esto es algo tolerable en negocios pero no en sistemas críticos.

Por todo ello, como hemos comentado, si existiese alguna resposabilidad, y la tarea de anotar estas incidencias sea esencial para proteger la vida de las personas, sería de la parte de dirección de sistemas y/o organización o gerentes por no evaluar este procedimiento de anotación de incidencias como nivel crítico para la vida de las personas, y en tal caso, instalar un servidor que puede ser vulnerable a ataques tan comunes a costa de reducir costes y no tener un procedimiento alternativo en el caso de fallar el sistema.

No hay comentarios:

Publicar un comentario