|
|
|
Scsi y tipos de Raid |
|
SCSI Y TIPOS DE RAID.
Este tutorial trata sobre la importancia del sistema SCSI, así como de qué es exactamente un sistema RAID, sus tipos y para qué sirven realmente. En una época en la que estamos acostumbrados a discos duros de 320GB o más, velocidades de transferencia de 300MB/s en discos SATA2, conexiones USB, etc., olvidamos lo que era la informática hace sólo unos años. Es por eso por lo que debemos recordar algunos datos para que nos sirvan de referencia, a la vez que debemos pensar que lo que era una gran solución hace tan solo unos pocos años no tiene por qué seguir siéndolo en la actualidad. Hasta hace tan sólo unos años (bien pocos, además) un ordenador tenia pocas opciones para comunicarse con los dispositivos de almacenamiento, así como con dispositivos externos, ya sea de almacenamiento o de captura de datos. Por supuesto, ni pensar en cosas tan comunes hoy en día como puede ser un MP3 o un lápiz de memoria. Las formas de comunicarse eran: Para discos duros y lectores de CD internos, los conectores IDE en estándar ATA y ATAPI. Para discos duros externos y otros periféricos se tenía que recurrir al puerto SERIE (RS-232) y al puerto PARARELO (CENTRONIC), mas conocido como puerto de impresora. El puerto RS-232 es muy lento, por lo que prácticamente se limitó su uso a la conexión del ratón, impresoras, MODEM y algún que otro periférico de uso profesional con un tráfico muy pequeño de datos, tales como scanner de mano, lectores de códigos de barra, grabadoras de EPROM y poco mas. Por otro lado, los puertos paralelos tienen una tasa de transferencia en su versión mas desarrollada (IEEE-1284, del año 1.994) de 1MB/s., poco incluso para un scanner de sobremesa, y no digamos para un disco duro. En cuanto a los conectores IDE, permiten tan sólo dos unidades por conector, no pudiendo además acceder a las dos a la vez, por lo que cuando lee en uno el otro debe permanecer inactivo. Incluso hasta hace bien poco no se podía acceder a ambos canales IDE de forma simultánea. A esto hay que sumarle unas velocidades de transferencia no demasiado altas, que han ido evolucionando con el tiempo de la siguiente forma: IDE, Hasta 1.988, máximo de 4MB/s ATA-1, año 1.988, máximo de 8MB/s, permite dispositivos ATAPI en modo PIO. ATA-2, año 1.992, máximo de 15MB/s, soporta transferencias rápidas en bloque y multiword DMA. ATA-3, año 1.995, es el ATA-2 revisado. ATA-4, año 1.998, 33MB/s. ATA-5, año 2.000, 66MB/s. ATA-6, año 2.002, 100MB/s. ATA-7, año 2.005, 133MB/s. A partir de ATA-5 se necesita una faja especial (de 80 hilos), siendo ésta imprescindible en ATA-6 y ATA-7. Los máximos de transferencia sólo se alcanzan en condiciones óptimas. Tampoco la velocidad de giro y lectura de los discos duros era excepcional, ya que lo normal era una velocidad de giro de entre 4.200 rpm. y excepcionalmente 5.400 rpm. (hace sólo un par de años que están disponibles los discos IDE a 7.200 rpm. y menos aun los discos de 10.000 rpm., reservados aun a SATA y a SCSI o los rapidísimos SCSI de 15.000 rpm.). A esto debemos añadir que la distancia máxima de un cable IDE no debe superar los 46 cm. Por todos estos motivos, y sobre todo pensando en los SERVIDORES y en estaciones de trabajo de alto rendimiento, se creó en 1.986 el estándar SCSI (Small Computer System Interface). Tarjeta controladora SCSI. Esta tabla explica el desarrollo de SCSI a través del tiempo: TIPO ----------> AÑO ---> BUS TRANSF. MAX. ---> LOG. CABLE ---> Nº DISP. SCSI 1 ---------> 1.986 ------> 8 bits -- 5 MB/s. --------> 6 mts. ----------> 8 disp. FAST SCSI ----> 1.989 -----> 8 bits -- 10 MB/s. -------> 1.5 / 3 mts. ----> 8 disp. WIDE SCSI ----> 1.989 -----> 16 bits -- 20 MB/s. ------> 1.5 / 3 mts. ----> 16 disp. ULTRA SCSI ---> 1.992 -----> 8 bits -- 20 MB/s. --------> 1.5 / 3 mts. ---> 5 – 8 disp. ULTRA WIDE --> 1.992 -----> 16 bits -- 40 MB/s. ------> 1.5 / 3 mts. ---> 5 – 8 disp. ULTRA2 SCSI --> 1.997 -----> 8 bits -- 40 MB/s. -------> 12 mts. ---------> 8 disp. ULTRA2 WIDE -> 1.997 -----> 16 bits -- 80 MB/s. ------> 12 mts. ---------> 16 disp. ULTRA3 SCSI --> 1.999 -----> 16 bits -- 160 MB/s. ----> 12 mts. ----------> 16 disp. ULTRA 320 -----> 2.003 -----> 16 bits -- 320 MB/s. ----> 12 mts. ---------> 16 disp. Está prevista la salida de un SCSI 620 para dentro de muy poco tiempo. Como puede observarse, las ventajas de SCSI sobre IDE son (o al menos lo eran) enormes, teniendo en cuenta que hasta 1.998 no nos encontramos con dispositivos IDE que tengan una tasa de transferencia de 33MB/s., cuando en ese mismo año los dispositivos SCSI estaban sobre los 40 – 80MB/s. A esto hay que añadir el mayor número de dispositivos que podemos conectar y la mayor longitud del cable que podemos usar. Esto, aunque en ordenadores de sobremesa es de poca importancia, en servidores llega a ser fundamental, máxime si consideramos que hasta hace poco mas de 4 años el tamaño máximo de un disco duro era de 20GB. A esto hay que sumar la versatilidad en cuanto a dispositivos SCSI se refiere (discos duros, lectores y grabadoras de CD y DVD, scanner de sobremesa, impresoras) y la posibilidad de conectarlo todo en el mismo cable. Otra propiedad de gran interés en los dispositivos SCSI es que las tarjetas SCSI hacen un direccionamiento lógico de los discos, y no físico, por lo que eliminan las limitaciones del BIOS en cuanto a tamaño y rendimiento del disco, pasando a depender de la capacidad de la tarjeta SCSI y del slot PCI. Las nuevas tarjetas SCSI ya vienen para PCI Express o PCIx (no confundir estos dos tipos de puertos). Las tarjetas SCSI suelen permitir conexiones tanto externas como internas, siendo las más comunes las de 50 hilos, tanto en formato HD como en formato CENTRONIC, para SCSI 1, la Micro 68, para WIDE y SCSI 3 y la Micro D50 y micro cinta de 60 hilos para SCSI 2. En cuanto a la configuración de los dispositivos, no existe una configuración maestro/esclavo, tal y como la conocemos en los dispositivos IDE, sino que se le asigna a cada dispositivo una ID SCSI. Esta configuración puede ser mediante pines, mediante pulsador o automática (depende del dispositivo, marca, modelo, etc.). En los sistemas antiguos, el disco de arranque debía estar configurado como ID0, pero en los sistemas modernos ya no es necesario esto. Es necesario un terminador que corte la búsqueda de dispositivos. Este puede ser independiente (se conecta a la faja) o bien estar implementado en un dispositivo. El orden entre dispositivos se establece mediante una BIOS y setup que llevan las placas SCSI. Cables SCSI. A la izda. cable SCSI de 50 hilos. A la drcha. cable SCSI Ultra360. Conectores SCSI de diferentes tipos. Si todo son ventajas, ¿por qué cada vez está menos extendido, salvo para grandes servidores y sistemas RAID de alto rendimiento y por qué no se estandarizó en ordenadores de sobremesa? Pues bien, existen varios motivos. En primer lugar, el costo de instalación es muy superior, así como el costo de los periféricos. Muy pocas placas base soportan SCSI de forma nativa (tan solo placas base para servidores), por lo que hay que instalar una tarjeta PCI-SCSI, que suele tener un costo bastante alto, y además un disco duro SCSI o una grabadora SCSI es bastante más cara que una IDE. Esto, con los precios actuales, nos puede parecer poco importante, pero debemos recordar que en el año 2.000 una grabadora de CD superaba las 40.000 ptas. de costo (unos 240 euros) y que un disco duro de 6GB. estaba sobre las 60.000 ptas. (unos 360 euros). Además, gran parte de las ventajas de SCSI se han superado con la tecnología actual (los discos duros SATA tienen una tasa de transferencia cuando menos igual a los SCSI), son comunes discos duros de 7.200 rpm, hasta hace poco reservados a los SCSI, y a todos nos suena eso de poder conectar varios dispositivos externos en un solo puerto, con una tasa de transferencia bastante alta (USB 2.0, FIREWIRE), pudiendo además poner cables SATA de hasta 1 mt. de longitud, lo que es más que suficiente para la inmensa mayoría de los ordenadores de sobremesa e incluso de los grandes servidores. La practica totalidad de las placas base actuales incorporan SATA 2 (entro 2 y 8, dependiendo de la placa base), soportan RAID por hardware (de los tipos 0, 1, 5 y JBOD, dependiendo de la placa base), incorporan USB 2.0 y, en la gama media-alta – alta, puertos Firewire. Es por estos motivos por los que, salvo para grandes servidores, se justifica cada vez menos el empleo de discos SCSI, que si bien es cierto que son algo (muy poco) más rápidos y algo más fiables (aunque esto depende mucho del disco que compremos), son muchísimo más caros. Incluso la ventaja que supone para un servidor la posibilidad de conectar o desconectar en caliente (sin apagar el sistema) un dispositivo (que es soportado por las placas SCSI de gama alta) es algo común, tanto en USB como en SATA. Si a esto le sumamos que son ya habituales los discos de mas de 300GB, a unos precios más que asequibles, tenemos los motivos por los que SCSI se ha visto relegado a su uso en servidores de alto rendimiento, sobre todo cuando queremos montar un sistema RAID con mas de 6 discos duros (no es raro en servidores que no pueden parar por una avería en un disco). Ni que decir tiene que el costo de un equipo con dispositivos SCSI y RAID de alto rendimiento es bastante alto. Una buena placa SCSI-RAID o SATA-RAID puede superar los 650 euros (solo la placa controladora). Antes de seguir, para que tengamos un concepto claro de lo que en términos SCSI y RAID es caro o barato, vayan algunos ejemplos. Un disco duro SCSI 320 de 10.000 rpm. de 73GB sale por unos 210 euros aprox.. Ese mismo disco, pero de 300GB sale por ''solo'' unos 825 euros. Una controladora SCSI + RAID baratita sale por unos 300 euros, llegando en una controladora de gama mas alta, que soporte RAID de varios tipos, a los 700 euros (esto sin irnos por las mejores). Una simple faja SCSI para 6 dispositivos sale por unos 35 euros (un cable IDE 80 sale por menos de 3 euros en el peor de los casos), y por ultimo, pero no menos importante, el terminador sale por otros 38 euros aprox. Un disco SATA 2 de 320GB nos puede salir por unos 75 euros. Para configurar un RAID 1 con dos discos de 320GB sobre SATA 2 en placa base la inversión sería de 150 euros aprox. (el costo de los dos discos, ya que el sistema RAID sobre SATA 2 lo trae la propia placa base). Esta misma configuración sobra SCSI U-360, con un incremento de menos de un 10% en prestaciones, supondría una inversión de al menos 1.925 euros (prácticamente un 1.280%). RAID: Dos controladoras RAID de gama alta. A la izda. una controladora RAID SCSI y a la srcha. una controladora RAID SATA, ambas para PCIx. Para comprender bien la finalidad de algunos RAID debemos tener en cuenta dos datos. El primero, que RAID no se concibió como un sistema para su uso en ordenadores domésticos, sino para un entorno profesional y sobre todo para servidores. El segundo y no menos importante es le fecha en que se concibió y el material que en esa época había disponible. Por poner un ejemplo (mas adelante explicare los diferentes tipos de RAID que hay), en el año 1.988, si necesitabas dispones de 2GB. de capacidad, la única forma de hacerlo era recurrir a un RAID de tipo 0 con varios discos (al menos 6 discos). RAID (Redundant Array of Inexpensive Disks, actualmente conocido como Redundant Array of Independent Disk) fue diseñado en 1.986 (aunque la idea surgio ya en 1.978) y publicado en su forma actual en 1.988. Debemos pensar que en ese año la capacidad máxima de un disco duro randota los 320MB. (hasta 1.992 no aparecieron los primeros discos de 1GB), salvo los discos duros especiales de IBM para grandes sistemas, discos de 10.8'' con una capacidad de hasta 2.8GB, pero con un precio que superaba el millón de las antiguas pesetas y destinados además a sistemas especiales (10.8'' son aprox. 26.5cm). Esto implica que en esos años, cualquier empresa que necesitara una gran capacidad de almacenamiento de datos tenia que recurrir por fuerza a sistemas RAID. Actualmente un sistema RAID se entiende como un sistema de seguridad y de integridad en sistemas informáticos (sobre todo en servidores), salvo RAID 0 y JBOD, que tan solo cumple con la finalidad ya explicada de aumentar la capacidad de almacenamiento. Incluso la mejora en el rendimiento que supone un RAID 0 ha quedado hoy en día relegada a un segundo plano, dado el rendimiento de los discos actuales y de los puertos SATA 2. Hay dos formas de implementar un sistema RAID, bien por software o bien por hardware. Un sistema RAID por software es mucho más económico que por Hardware, pero obtendremos un rendimiento menor y un alto consumo de CPU tan sólo para su gestión. En cuanto a RAID por hardware, evidentemente es mucho más costoso, pero obtendremos una mejora en el rendimiento, al descargar al sistema de buena parte de la gestión de los datos en los discos. Los RAID por hardware se suelen montar con discos SCSI y, sobre todo, con discos SATA. Sólo en controladoras económicas o de bajo rendimiento encontramos RAID sobre discos IDE. El único inconveniente de un sistema RAID por hardware es (aparte del costo) que añadimos un elemento más de riesgo al sistema (la tarjeta RAID), pero esto se subsana creando un sistema con varias tarjetas. Con esto, además de ganar en seguridad, también lo hacemos en rendimiento, y no debemos perder de vista que son sistemas pensados para su uso PROFESIONAL, en el que el costo queda relegado a un segundo plano. La mayoría de las placas base actuales soportan RAID (bien sobre discos SATA o sobre discos IDE), pero este suele ser vía Software, encargándose la BIOS de la placa base de gestionarlo. Hay placas base de gama media-alta y alta que incorporan RAID vía Hardware incorporado en la placa base. Placa base con RAID incorporado, tanto en ATA como en SATA Los principales tipos de RAID son los siguientes: RAID 0: Diagrama de distribución de datos en RAID 0 RAID 0 (conjunto dividido) es el más básico de los RAID (aunque en realidad no se puede considerar como tal). No tiene control de paridad ni es tolerante a fallos, lo que no lo hace utilizable como sistema de copia de seguridad ni en el volumen donde vamos a instalar el sistema operativo, ya que este (ya sea Windows o Linux) necesita una seguridad bastante alta en la integridad de los datos. Este sistema multiplica la capacidad del menor de los discos por el número de discos instalados (aunque con algunas controladoras de gama alta se consigue que la capacidad total sea igual a la suma de la capacidad de los discos), creando una capacidad de almacenamiento equivalente al resultado de esta operación, utilizable como una sola unidad. A la hora de usar estos discos, divide los datos en bloques y escribe un bloque en cada disco, lo que agiliza bastante el trabajo de escritura/lectura de los discos, dándose el mayor incremento de ganancia en velocidad cuando esta instalado con varias controladoras RAID y un solo disco por controladora. Estas ventajas, utilísimas hace 10 años, hoy en día son menos importantes, primero porque la velocidad de transferencia de los discos actuales (sobre todo los SATA 2) es lo suficientemente alta, segundo porque es mucho más barato un disco de 320GB que dos de 160GB y tercero porque el mayor inconveniente de este sistema es que un error en uno de los discos hace que falle todo el sistema y que además, al depender un sólo dato de dos o más discos se multiplican las posibilidades de fallos y errores. JBOD: Al igual que RAID 0, JBOD (Just a Buch Or Drives, o solo un montón de discos) no es un RAID en el puro sentido. JBOD nos crea una sola partición en varios discos (o una sola partición a partir de varias particiones), comportándose como si fuera una sola partición. Al contrario que RAID 0 los datos no se dividen entre los discos, sino que se comporta exactamente igual que si de un solo disco se tratara, siendo el tamaño de éste el resultado de la suma de los tamaños de los discos. Una ventaja de JBOD sobre RAID 0 es que si falla un disco, sólo se pierde la información que contenga este, mientras que con RAID 0 el fallo en un disco supone la perdida total de datos. Al contrario que RAID 0, JBOD no aporta ninguna mejora en el rendimiento del sistema, siendo el rendimiento del conjunto igual al del componente más lento. Tanto RAID 0 como JBOD se pueden hacer con un solo disco duro o con varios, siendo una solución muy interesante cuando tenemos varios discos de poca capacidad y queremos hacer con ellos un solo disco de gran capacidad o bien cuando el sistema operativo no soporta gestionar discos de gran capacidad. En cuanto a obtener una mejora significativa en el rendimiento con los discos duros actuales, tendríamos que montar un RAID por Hardware, a ser posible con una tarjeta para cada disco, por lo que el costo de esto se dispararía, a igual que las posibilidades de errores, que se multiplicarían por el número de elementos que integren el RAID. Hay que aclarar que en un RAID 0 montado en un sólo disco duro NO tenemos ningún incremento en el rendimiento, ya que este siempre será el del disco sobre el que se monta. RAID 1: Diagrama de distribución de datos en RAID 1 RAID 1 (conjunto espejo) es el primer nivel de RAID autentico. Para que sea efectivo es necesario que la tarjeta RAID permita dos lecturas duplicadas por cada par duplicado y dos escrituras concurrentes separadas por cada par duplicado. En la práctica esto crea discos espejo (contienen exactamente la misma información), dando una tasa de escritura igual a la de un solo disco y una tasa de lectura igual al doble de la de un disco. En el caso de fallo en uno de los discos, podemos seguir trabajando con el otro y sustituir el dañado. Además, al ser un disco espejo, igual al otro y conteniendo todos los datos, en la practica se puede utilizar este disco en un sistema sin ningún tipo de RAID. La mayor desventaja es que, debido a la alta carga de trabajo, es el más ineficaz de todos los tipos de RAID. RAID 2 Es el único nivel de RAID que no se usa actualmente. Divide los datos a nivel de bits en lugar de a nivel de bloques, usando el código de Hamming (que permite detectar errores en uno o dos bits y corregirlos) en lugar de la paridad (que permite detectar errores en un bit, sin corregirlo) para la corrección de errores. Permite unas tasas de transferencia altísimas, pero, en teoría, en un sistema moderno necesitaría 39 discos para funcionar. 32 para almacenar los datos (código de 32 bits, 1 bit en cada disco) más 7 para la corrección de errores. RAID 3: Diagrama de distribución de datos en RAID 3 Prácticamente no se usa. Usa una división a nivel de Bytes (1 byte = 8 bits), más un disco de paridad. Uno de los efectos que esto supone es que no puede atender más de una petición de información a la vez, ya que un bloque se divide entre todos los discos en la misma dirección, teniendo que activar todos los discos para escribir o leer esta información, no pudiendo atender a otra petición hasta que no termine con la anterior. Son necesarios al menos 3 discos para implementar RAID 3. RAID 4: Prácticamente igual al RAID 3, pero con los datos divididos a nivel de bloque, más un disco de paridad. Esto supone que se active un solo disco si pedimos una información que ocupe un solo bloque (o tantos discos como bloques compongan dicha información). Con controladoras que lo permitan, puede atender varias operaciones de lectura simultáneamente. También podría hacer varias operaciones de escritura a la vez, pero al existir un solo disco de paridad, esto supondría un cuello de botella. Son necesarios, al igual que en RAID 3, al menos 3 discos duros. RAID 5: Diagrama de distribución de datos en RAID 5 Es el más versátil (y quizás el mas completo) de los tipos de RAID, a la vez que uno de los más utilizados, si no el que más. También es el nivel más eficaz, ofreciendo una gran tolerancia a fallos y una buena optimización del sistema. Graba la información en bloques de forma alternativa, distribuida entre todos los discos. A diferencia de RAID 4, no asigna un disco para la paridad, sino que distribuye ésta en bloques entre los discos, eliminando el cuello de botella que el tener un disco para la paridad supone. Si tenemos el número suficiente de discos, el rendimiento se aproxima al de RAID 0. Son necesarios un mínimo de 3 discos para implementar RAID 5, si bien el rendimiento óptimo se alcanza con 7 discos. RAID 6: Similar al RAID 5, pero con un segundo esquema de paridad distribuido entre los discos. Ofrece una tolerancia extremadamente alta tanto a fallos como a caídas de disco, reemplazando los datos prácticamente en tiempo real, pero tiene el inconveniente de que necesita unas controladoras RAID que soporten esta doble paridad, bastante complejas y muy caras, por lo que no se suele usar comercialmente. Es el mejor tipo de RAID para grandes sistemas, en los que tanto la rapidez como la seguridad e integridad de los datos están por encima del costo del sistema, que es altísimo. RAID 0+1: No es uno de los tipos de RAID originales, sino una mezcla de dos. Crea dos líneas de RAID 0 y un disco espejo (RAID 1). Tiene todas las ventajas de RAID 0 más las de RAID 1, pero también los problemas de este ultimo. No tolera dos fallos simultáneos de discos. RAID 1+0 o RAID 10: Al igual que RAID 0+1, tampoco es uno de los tipos originales. Se crean múltiples discos espejo y una línea de RAID 0 sobre ellos. Es tolerante a múltiples fallos de discos, mientras uno de cada par permanezca en funcionamiento. Este sistema requiere un mínimo de dos canales RAID con dos discos cada uno. Crea una distribución de los datos igual a RAID 0 más un espejo de cada disco. Tiene las mismas ventajas y desventajas que RAID 1. Todas las tarjetas RAID SCSI o SATA permiten el cambio de discos ''en caliente'', es decir, sin necesidad de apagar el sistema, reconstruyéndose la información del disco dañado a partir de los demás discos (esto NO se puede hacer en un sistema RAID montado sobre discos IDE/ATA). Como norma general, el mejor rendimiento en cualquier configuración RAID se consigue con discos iguales (de la misma velocidad, tasa de transferencia y capacidad). En sistemas RAID grandes es común incorporar uno o más discos ''dormidos'', que permanecen desactivados (pero conectados al sistema), entrando en funcionamiento en el caso de fallar un disco (en la mayoría de los casos automáticamente) y reconstruyendo la información de éste, así como montar el sistema RAID en una torre RAID independiente, conectada al host mediante un cable SCSI. Como puede verse por lo expuesto, un sistema RAID a partir de nivel 3 puede llegar a ser muy costoso, pero es el precio de la seguridad en los datos. Actualmente se están empleando los sistemas de seguridad RAID en unidades especiales independientes, conectador por red (ya sea Ethernet o Wifi) o mediante USB o FireWire, como es el caso del servidor de seguridad que vemos en la imagen ingerior. Imagen de un servidor RAID, conectable tanto por red como por USB. Ahora bien, la gran pregunta es ''sirve un sistema RAID como copia de seguridad?'' La validez de esta pregunta viene impuesta por que podemos pensar en utilizar un RAID como copia de seguridad. Bien, la respuesta a esta custión es que NO. Y este NO se basa en lo siguiente: En un sistema RAID el segundo disco es una copia espejo del primero, por lo que va a tener los mismos errores y virus que tengamos en el primero, así como EXACTAMENTE la misma información. Esto quiere decir que si perdemos algún dato en el disco 1 también lo vamos a perder en el disco 2. Un sistema RAID sirve para garantizar que si se estropea un disco vamos a poder seguir funcionando, pero NO para tener una copia de seguridad de nuestros datos. Un sistema RAID tan sólo sirve como copia de seguridad si está implementado para ello. Es decir, podemos tener un sistema RAID (normalmente externo) sobre el que escribimos nuestra copia de seguridad, con lo que aseguramos la integridad de esa copia, pero no podemos utilizar un disco en RAID como copia de seguridad propiamente dicha. |
Tags: Hardware, Disco duro |
|
|
|
|