El procesador Central

 

Por sistema de cómputo se entiende la configuración completa de una computadora, junto con unidades periféricas y con los programas de base (sistemas operativos) que la hacen funcionar como un todo coherente.

 El procesador central

bullet

Es el conjunto formado por la unidad de control y la unidad aritmética y lógica.

bullet

También es conocido como unidad central de procesamiento UCP.

bullet

Sus funciones consisten en decodificar y ejecutar las instrucciones de un programa, leer y escribir contenidos de las celdas de memoria y llevar y traer datos entre celdas de memoria y registros especiales.

bullet

Se encarga de distribuir las tareas entre subsistemas diversos y de recibir el reporte del inicio y fin de sus actividades por medio de interrupciones.

bullet

Normalmente ejecuta a enorme velocidad los cuatro pasos empleados para la ejecución de una instrucción. Cuando dentro de un programa el procesador encuentra una instrucción especial (usualmente de entrada o salida de datos), se produce una señal de interrupción, la cual provoca un desvío hacia un pequeño programa residente en memoria, cuya función es atender esa instrucción.

bullet

Para no desperdiciar ciclos, abandona temporalmente el programa que pidió la operación lenta, y se dedica ese lapso a atender a algún otro programa residente en la memoria central. Y espera que el subsistema le envíe la interrupción que le indique que terminó con la operación que se le encargó.

bullet

Su operación está controlada por un reloj central, que indica cada cuándo se debe iniciar una nueva operación. En términos generales, será este reloj el que determine la velocidad de operación del procesador, y suele trabajar a una frecuencia medida en centenas de MHz.

bullet

Integrada a él existe una serie de celdas que se utilizan con mucha frecuencia y que por ello no están en la memoria. Estas celdas reciben el nombre de registros. Puede tener una decena o dos de ellas.

bullet

La unidad aritmética y lógica (UAL), como su nombre indica, se encarga de efectuar las operaciones relacionadas con los cálculos numéricos y simbólicos. Sólo es capaz de realizar un número reducido de operaciones muy elementales pero a gran velocidad.

bullet

Existen procesadores auxiliares, especializados en calcular funciones matemáticas complicadas para el hardware a velocidades muy altas. A estos se les conoce como Coprocesadores matemáticos o unidades de punto flotante

bullet

Existen procesadores de tecnología CISC (Complex Instruction Set Computer) y RISC (Reduced Instruction Set Computer). Un procesador CISC está dotado de operaciones complejas que, sin embargo, son muy poco uitlizadas porque son especializadas. Un RISC es un procesador muy sencillo pero muy rápidos.

bullet

Los procesadores son clasificados por el tamaño de palabra que son capaces de manejar, osea la cantidad de bits simúltaneos que manipulan. Las máquinas con procesador de tamaño de 8 bits formaron una familia de microcomputadoras, que hacia 1980 fueron reemplazadas por las de 16 bits. Las minicomputadoras suelen tener procesadores de 32 bits, y las máquinas grandes (aunque ya no físicamente) manejan palabra de 64 bits.

 

La Memoria Central

 

La memoria central es un conjunto -generalmente grande- de celdas direccionables donde la computadora almacena toda la información (datos y programas) que utilizará mientras esté encendida.

 Cualquier instrucción que el procesador efectúe debe necesariamente residir en la memoria central, ya que allí es donde la UCP buscará la siguiente instrucción.

 Tipos de dispositivos

 RAM

 Las computadoras de la primera generación se caracterizaban por disponer de muy pocas celdas de memoria, pues éstas eran costosas y muy difíciles de construir. La tecnología de las memorias de la primera y segunda generación estuvo dominada por las memoria de núcleos de ferrita. Cada celda de memoria consistía en un grupo de 8 milimétricas rondanas de ferritas, atravesadas por varios alambres. Cada rondana actuaba como un electroimán. Si la ferrita estaba magnetizada en un sentido representaba un 1 lógico y en el sentido contrario un 0.

 A partir de la tercera generación las ferritas son reemplazadas por memoria de semiconductores, fabricados con circuitos integrados. La ventaja de éstos con respecto a las anteriores es que se pueden construir por métodos industriales y no a mano como se hacia para las de rondanas de ferritas.

 En 1970 una computadora disponía de 16,384 celdas de memoria (16 KB), treinta años después las computadoras poseen memorias de decenas a cientos de millones de celdas (512 MB)

 El parámetro más importante en una memoria es su velocidad de acceso: tiempo transcurrido desde que el procesador pide la información contenida en una celda cualquiera hasta que ésta puede ser leída (o el tiempo transcurrido para el proceso de escritura). Los tiempos de acceso de las memorias se miden en millonésimas de segundo.

 El nombre genérico de estas memorias (estáticas o dinámicas) es RAM (Random Access Memory). Memoria cuyo tiempo de acceso para la celda 1 o para la celda X es el mismo.

 Caché

 Como la velocidad de operación de los procesadores actuales es tan grande, muchas veces se vuelve necesario contar con un tipo especial de memoria de altísima velocidad (y considerable costo) en la cual circuitos especiales depositan de antemano una copia de las siguientes instrucciones del programa que se está ejecutando.

 Estos circuito especiales de memoria "super rápida" (de poca capacidad) reciben el nombre de memoria caché, cuando existen, ocupan un lugar intermedio entre el procesador y la memoria. La memoria caché es una especie de RAM estática y se encuentra dentro de los procesadores, también podemos encontrarla de manera externa.  

 ROM

La desventaja de las memorias de semiconductores es que se pierde la información que tenían almacenadas cuando se interrumpe la alimentación eléctrica. Esto obliga a la construcción de memoria no volátiles, en las que se graba la información que ya no se pierde. Estos circuitos reciben el nombre genérico de ROM (Read Only Memory).

La memoria ROM consiste en un conjunto bidimensional de cables paralelos que se cruzan pero no se tocan. Para grabar datos se hace una interconexión entre algunos de estos cruzamientos de cables conductores.

 

 

 

 

 

 

  1       1       1       1       1       1

 

                   Escritura

 

0

 

0

 

0

     Lectura

0

 

0

 

0

 

 

 

 

 

 

 

 

 

 

  1       1       1       1       1       1

 

                   Escritura

 

1

 

1

 

0

     Lectura

1

 

0

 

0

 

 

 

 

 

 

 

 

 

La desventaja de las memorias ROM es que se tienen que grabar en la fábrica, y que además ya no se pueden borrar nunca, por lo que existen otros tipos de dispositivos de memoria no volátil (PROM: Programmable Read Only Memory, EPROM: Erasable Programmable Read Only Memory, EEPROM: Electrically Erasable Programmable Read Only Memory), co capacidades crecientes de regrabación.

Codificación de datos

 Entendemos por codificación de datos al patrón de bits que representa a un número cualquiera a almacenar. Sabiendo que para el almacenamiento de información en la memoria sólo empleamos números.

 Existen diferentes tipos de sistemas de codificación o simplemente códigos.

bullet

ASCII ("áski:): American Standard Code for Information Interchange. Código estandarizado muy empleado para representar letras. Cada carácter en ASCII emplea 7 bits; pero como el byte es de 8 bits, el octavo bit es utilizado para hacer extensiones (otras 128 combinaciones adicionales). Utilizadas para representar letras griegas, vocales acentuadas, letras como "Ñ", "ñ", "ç". Sin embargo las extensiones del código ASCII a 8 bits no están estandarizadas.

bullet

EBCDIC ("ebsidik"): Extended Binary Coded Decimal Interchange Code. Es otro código de 8 bits en uso.

bullet

UniCode. Durante años una comisión internacional trabajó en la definición de este código universal, el cual emplea 16 bits para codificar un enorme número de letras y caracteres, aptos para ser empleados en muchos idiomas. Está siendo ya uitlizado por aplicaciones de Internet, lenguaje Java, por ejemplo.

 

Unidades de entrada y salida

 

Un procesador se comunica con el exterior por medio de interfaces que permiten la entrada y salida de datos desde y hacia la memoria, esta es la única manera de comunicarlo con el entorno exterior a la computadora, para hacerle llegar la información de los usuarios y poderles mostrar los datos ya procesados.

 Las unidades de entrada más comunes fueron las lectoras de tarjetas  y actualmente las terminales de video. Las unidades de salida más usuales son las impresoras y las terminales de video. Existe gran variedad de model9os entrada/salida pero la mayoría utiliza los dos mismos elementos para lograr la comunicación entre el humano y la máquina: un teclado y una pantalla de video.

 Las primeras tres generaciones estaban dominadas por las lectoras de tarjetas, unidades exclusivamente de entrada. Durante la segunda parte de la tercera generación, las computadoras se comunicaban de manera interactiva con el usuario, para lo cual se requeria una unidad bidireccional. La opción más adecuada para este fin es la terminal de video, cuyo teclado muchas veces suele acompañarse de un dispositivo conocido como mouse.

 La unidad de entrada está conectada al puerto de entrada del procesador: un registro de pocos bytes de capacidad, por lo cual es imprescindible interrumpir al procesador cada vez que  hay un dato de entrada, para que ejecute un pequeño programa cuya función consiste en llevar ese byte del puerto de entrada a un lugar en la memoria RAM. El programa especial para manejo básico de entradas y salidas es el BIOS (Basic Input Output System) y suele residir en forma permanente en una memoria PROM.

 Las unidades exclusivas de salida están representadas por una amplia gama de impresoras, que van desde las sencillas y relativamente lentas hasta subsistemas computarizados de muy alta velocidad, calidad y costo. Las impresora mecánicas lentas, ya en desuso, funcionaban con un mecanismo de impacto parecido al de una máquina de escribir eléctrica de "margarita". Eran capaces de escribir hasta 10 caracteres por segundo.

 Unas impresoras aún muy utilizadas escriben a razón de entre cuarenta y trescientos caracteres por segundo, utilizando un mecanismo de generación de caracteres mediante un conjunto de puntitos (que reciben el nombre de matriz) que una cinta entintada lleva al papel.

 Las pequeñas impresoras conocidas como de inyección de tinta representan un muy buen compromiso entre bajo costo y alta calidad de letra, con velocidad aceptable. En éstas, una cabeza impresora (controlada por un microprocesador dedicado) recorre el renglón de la hoja, activando a su paso unos inyectores que hacen hervir minúsculas gotas de tinta y las lanzan al papel, en donde "dibujan" las letras.

Son muy comunes unas impresoras de mediana velocidad y capacidad que imprimen texto y gráficas de excelente calidad, y cuyo principio de funcionamiento es similar al de las fotocopiadoras, con la diferencia de que en estas impresoras no es un proceso electrostático, sino un rayo láser, el que graba temporalmente la imagen por reproducir en el mecanismo entintador.

 Otras de las capacidades de los equipos de cómputo actuales es representar la información de salida por medio de gráficas y dibujos. Las unidades especiales para estos fines son los gráficadores.

 El problema inverso, leer gráficas, se resuelve mediante aparatos especializados conocidos en inglés como scanners, "digitalizadores" o lectores ópticos. Su función es digitalizar imágenes para almacenarlas en memoria. La digitalización consiste en dividir la imagen mediante una fina cuadrícula y tomar muestras de cada uno de los puntos en las intersecciones. Un valor comúnmente empleado es de 300 muestras por pulgada (dpi), para una pulgada cuadrada se toman 300x300 valores.

 Las cámaras digitales son el caso extremo de los lectores ópticos, pues transforman el campo completo de visión en información binaria (mediante microsensores ópticos integrados, llamados CCD: charge-coupled devices).

Existen múltiples formatos para el almacenamiento de información gráfica, entre los que sobresalen BMP (Windows Bitmap Format), GIF (Graphics Interchange Format), JPEG (Join Photographic Experts Group), TIF (Tagged Image File Format), entre otros.

Por otro lado, si la hoja consta de letras, se debe de pensar en que el programa de manipulación de gráfica las reconozca e identifique, con lo cual estaría efectivamente leyendo textos. Es decir convertir los millones de bits que representan los 300x300 puntos de cada pulgada cuadrada de texto por 8 bits asignados a cada letra (código ASCII). El complejo software que realiza esta función se conoce como OCR: Optical Character Recognition.

 

Unidades de memoria auxiliar

 

Como la memoria central de una computadora es costosa y escasa, se vuelve necesario tener áreas adicionales de almacenamiento para guardar grandes cantidades de información de manera más económica. Además, la memoria central es volátil: pierde los datos almacenados al interrumpirse el suministro de corriente eléctrica, por lo que no resulta práctico utilizarla para almacenamiento permanente de datos.

 Éstas y otras razones dan lugar a la creación de unidades periféricas de memoria que en conjunto reciben el nombre de memoria auxiliar, periférica o secundaria. Los tipos más comunes de dispositivos, que a continuación se describen, son:

bullet

Cintas magnética

bullet

Discos magnético

bullet

Discos ópticos

 El funcionamiento de los medios magnéticos es similar al de las cintas o cassettes de audio; esto es, los datos a guardar en la cinta se representan mediante señales magnéticas que se recuperan y escriben empleando una cabeza lectora/grabadora.

 Existen básicamente dos tipos de unidades periféricas magnéticas: aquellas en donde la información se lee/graba de manera secuencial, y otras en que el acceso a los datos es directo, es decir, sin importar el orden previo de lectura o escritura. El primer caso está representado por las cintas, y el segundo por los discos.

 Almacenamiento secuencial: cintas magnéticas

 Las cintas magnéticas suelen manejarse en dos presentaciones: carrete y cartucho, aunque las primeras ya casi no se emplean.

 En los cartuchos los datos se graban en forma serial, bit tras bit, a lo largo de varias pistas consecutivas en las que se divide la cinta. De esta forma, a densidades de 6,400 bits por pulgada (bpi: bits per inch), en un paquete de aproximadamente 10 x 8 x 2 cm. es posible almacenar varios cientos de MB de información. Otra ventaja de los cartuchos, además de su facilidad de manejo (no es necesario embobinar el carrete), es que el formato está estan­darizado, y es posible leer un cartucho grabado en otras máquinas.

 Además, se emplea un bit extra de control —llamado de paridad—, que sirve como verificador de consistencia de la información. Existen dos tipos de paridad: par e impar. En la paridad par, el último bit se escribe como 1 si es que en los ocho anteriores existe un número non de unos, de modo que el número final de bits en 1 sea par. En la paridad impar sucede lo contrario. Ambos tipos de paridad sirven para detectar la pérdida de información de un bit: si una cinta, por ejemplo, está codificada con paridad par, será fácil detectar errores simplemente verificando que los nueve bits tengan una cantidad par de unos.

 La principal característica del almacenamiento secuencial consiste en que sólo es posible leer, por ejemplo, el registro número 10 después de haber leído e ignorado los nueve primeros. Esto puede ser grave cuando se trata del registro número 190,000, porque hay que esperar a que la cinta se mueva varios metros, con una considerable pérdida de tiempo.

 La utilización primaria de las cintas magnéticas es para efectuar respaldos de la información residente en los discos, porque el costo de cada carrete o cartucho es lo suficientemente bajo como para poderlos archivar en un cajón o una bodega para propósitos de seguridad.

 

Almacenamiento directo: discos magnéticos

 

Una forma más conveniente de manejar información consiste en depositarla (en forma Magnética) directamente sobre la superficie de un disco que gira, mediante un brazo mecánico que se mueve en forma radial, y en cuyo extremo está la cabeza lectora/grabadora. Los discos magnéticos existen en diversas presentaciones: discos rígidos fijos (es decir, que no se pueden sacar del dispositivo que los contiene), y discos flexibles removibles: los conocidos diskettes. En términos generales, las unidades de acceso directo son más costosas que las de acceso secuencial, pues la mecánica y los circuitos electrónicos requeridos para el movimiento de las cabezas lectoras/grabadoras son complejos de gran y precisión.

 Un disco rígido consiste en uno o más platos o superficies magnéticas (casi  siempre se emplean las dos caras de cada plato), montados junto con otros sobre un eje común. Para cada superficie existe una cabeza lectora/grabadora montada en un brazo que puede desplazarse en sentido radial —es decir, acercándose o alejándose del centro del disco que gira constantemente a gran velocidad—. En cada superficie, los datos se almacenan en pistas (tracks), organizadas como círculos concéntricos. Cada pista, a su vez, está dividida en porciones llamadas sectores. Visto por sectores, el funcionamiento de los discos es similar al de las cintas magnéticas, pues en cada uno la información se almacena de manera secuencial. La diferencia consiste en que en el disco la cabeza sí puede ir directamente de una pista a otra (moviendo el brazo hacia o desde el centro) y, una vez en una pista, puede dejar pasar sectores (recuérdese que el disco gira constantemente) hasta que llegue el deseado. Viendo el disco por arriba, todas las pistas de los diferentes platos que lo componen están alineadas (es decir, ocupan la misma posición en planos paralelos entre sí y se  conocen como cilindros. En disco con 8 superficies de 1,024 pistas cada una, por eje tiene 1,024 cilindros, aunque su número total de pistas es ocho veces más.

 Tanto en los discos como en las cintas se requiere un espacio para almacenar el directorio con la información sobre los archivos, y suele conocerse como FAT: File Allocation Table, tabla de asignación de archivos.

 Los parámetros para calificar una unidad de discos son la velocidad de rotación (y, por tanto, el tiempo que toma localizar una sección del disco, llamado tiempo de latencia o de espera rotacional) y el tiempo que el brazo tarda en moverse entre pista y pista (llamado tiempo de acceso, seek-time). Por lo común, los discos rígidos tienen más capacidad que las cintas, además de su muy superior velocidad de acceso.

 Para dar un ejemplo, una unidad sellada de disco rígido fijo que almacena 5 GB de datos, tiene cuatro platos de 3.5 pulgadas de diámetro cada uno, gira a una velocidad de 7,200 rpm con un tiempo de latencia de 4 milisegundos (ms) y un tiempo de acceso de 9 ms en promedio para cada una de las 1,024 pistas incluidas en cada una de sus 8 superficies.

 Los discos fijos presentan el problema de que si se dañan, se pierde la información contenida en ellos, por lo que en general suelen copiarse periódicamente a carretes o cartuchos de cinta magnética. Esta operación de respaldo se conoce en inglés como backup o dump.

 Los discos flexibles, por otro lado, son pequeños platos de material plástico que almacenan entre setecientos mil y dos millones de caracteres, a velocidad relativamente baja y con poca densidad. Su ventaja está, por supuesto, en el precio, pues cuestan mucho menos que los discos rígidos.  Se usan sobre todo en micro y minicomputadoras, aunque cada vez son menos útiles, debido a la imparable "inflación de software" y al empleo de gráficas en los archivos de texto, que los crecen desorbitadamente (ya suele ser común que un pequeño archivo de pocas hojas no cabe en un diskette). La principal diferencia operativa con respecto a los discos descritos líneas antes es que en las unidades de diskettes, la cabeza lectora/grabadora se apoya sobre la superficie del disco, mientras que en los otros "flota" por encima del plato, a unas milésimas de pulgada. Esto significa que los discos flexibles se desgastan con el uso (igual que las cintas) mientras que los rígidos son virtualmente indestructibles bajo operación normal.

  

Almacenamiento masivo: discos ópticos

 

La idea del almacenamiento digital es realmente sencilla, pues basta con guardar dos tipos diferentes de representaciones: las correspondientes al O y al 1 lógicos, y tener siempre la capacidad de distinguir entre ambas.

 En los discos ópticos se aprovechan las características únicas de la luz láser para grabar micrométricas marcas en una superficie. Como el láser es luz monocromática de altísimo grado de coherencia, puede incidir sin dispersarse sobre áreas de millonésimas de metro de radio, separadas entre sí también por millonésimas de metro, con lo cual se obtienen densidades de grabación enormes. Una vez "quemada" la superficie de un disco con millones y millones de microscópicas marcas que representan bits en O y en 1, el disco original se reproduce por medios mecánicos (empleando técnicas de moldeo y pren­sado de materiales plásticos especiales), y cada copia se recubre con un material metálico reflejante y luego se sella con una capa de plástico transparente.

 Los compact discs así obtenidos son, desde su inicio en 1982, el principal medio de distribución de grabaciones musicales (desde su invención, se han vendido en el mundo más de 400 millones de aparatos reproductores de discos compactos y 6,000 millones de discos), porque un pequeño y conveniente disco contiene más de una hora de sonido estereofónico de alta fidelidad.

 Para hacer al sonido compatible con las computadoras será necesario digitalizarlo, lo cual se logra —como en el caso de las gráficas— mediante técnicas de muestreo. Al sonido lo definen dos componentes: la amplitud (volumen) y la frecuencia (es decir, sus cambia en el tiempo), y debe ser adecuadamente muestreado. También tiene que haber un número de muestras suficiente para no tener pérdida de fidelidad: es decir, la señal digitalizada mantendrá todos los detalles de amplitud y frecuencia del sonido (analógico) original. Un importante resultado matemático conocido como teorema del muestreo india que para digitalizar una señal de ancho de banda limitado (es decir, con una gama finita de frecuencias) basta con tomar un número de muestras equivalente al doble de su máxima frecuencia, y con ello se garantiza que no se perderá detalle alguno de la señal continua. En términos ideales, el oído humano puede registrar sonidos con una frecuencia que varía entre 20 y 20,000 Hertz (ciclos por segundo), por lo que deberán entonces tomarse 40,000 muestras de la señal audible cada segundo. Estas muestras, por su parte, deberán ser codificadas en forma tal que mantengan el registro de toda la gama posible de variaciones de volumen, desde el sonido más débil hasta el más potente.

 El estándar internacional de audio digital emplea 16 bits para cada muestra y una tasa de muestreo de 44,100 Hz., por lo cual se tiene

44,100 muestras/seg x 16 bits/muestra = 705,600 bits/seg

 y como hay 60 segundos en un minuto, entonces 75 minutos de grabación estereofónica
(dos canales) se llevarán  

60 s/min x 75 min x 2 X 705,600 bits/s = 6,350,400,000 bits

 lo cual es aproximadamente igual a 760 MB.

 Aunque parezca increíble, en un disco compacto de audio hay más de 6,000 millones de microscópicas marcas que un rayo láser grabó en el molde original, por lo que cada disco puede contener más de 700 millones de bytes. Existen, además, nuevas técnicas de codificación y de grabación, que elevan a más del triple la capacidad de un disco óptico.

 Pero nada obliga a que ésos bits representen sonido porque, con la codificación adecuada, las cadenas de ceros y unos pueden significar casi cualquier cosa: todo depende del tipo de conversión A/D empleada. Como hemos visto, para almacenar en esta forma gráficas o sonido se requiere un proceso de digitalización; pero los números y las letras ya están codificados (por ejemplo, en ASCII), y entonces se podrán guardar en forma directa.

 Cuando el disco compacto no contiene codificación de sonido sino datos binarios, recibe el nombre de CD-ROM (Compact Disc Read Only Memory), para recalcar su característica de memoria únicamente de lectura, y su principal uso es para tener acceso (recuperar) a los datos que se grabaron en la fábrica. Ni los discos compactos de audio ni los CD-ROM de datos son grabables o alterables por el usuario, quien los adquiere ya grabados. Por otra parte, la tecnología que permite al usuario grabar su propia información en discos compactos funciona con dos formatos incompatibles entre sí: CD-R y CD-RW; el primero permite una sola grabación, que ya no se puede borrar, pero que sí es compatible con el es­tándar de los discos compactos de audio, mientras que con el segundo sistema sí es posi­ble regrabar el disco, pero se requiere un aparato especial, y es incompatible con los CD y CD-ROM normales.

 Por último, cuando el sistema de cómputo dispone además de los programas necesa­rios para extraer y manipular la información contenida en un CD-ROM, suele entonces hablarse de multimedia. Un disco óptico puede contener tanto datos como sonido, además de gráficas o video, por lo cual se vuelve factible mostrar por la pantalla imágenes de color en movimiento, junto con textos y música. (Para ello, claro, deben existir los compo­nentes electrónicos (hardware) de audio y video, además del lector de discos ópticos, junto con el software para controlar todo el sistema integral.)

 La cantidad de almacenamiento requerida para la grabación o reproducción de video digitalizado es tan grande (166 megabits por segundo), que un CD normal sólo sería capaz de almacenar menos de 40 segundos de video de alta calidad, y sin sonido, además. Eso obligó a la creación de un nuevo estándar de almacenamiento digital: DVD (originalmente Digital Versatile Disc, aunque luego en forma oficial se quitó el significado de la abreviatura), con la ventaja adicional de que sus aparatos reproductores pueden leer los discos compactos anteriores, porque existe cierto grado de compatibilidad.

 Aunque su uso aún no se ha vuelto tan común como esperaban sus fabricantes (debi­do a problemas de distribución comercial y pago de regalías, que frenaron su lanzamiento durante un par de años), muchas computadoras ya los emplean como medio de almacenamiento masivo, y además constituyen el nuevo medio establecido para la distribución de películas.

 El diámetro de ambos discos sigue siendo de 120 mm, aunque los DVD pueden, emplear dos substratos (superficies) por cada cara del disco, mientras que los CD usan un solo substrato en una sola cara (es decir, el rayo láser puede enfocarse para leer dos diferentes superficies –substratos- de información en cada cara del disco).

La longitud mínima de cada marca en el DVD disminuyó a la mitad: 0.4 micras (millonésimas de metro), y la longitud de onda del láser se redujo a 635 nm (milmillonésimas de metro), de los 780 nm empleados por el CD. Si el DVD es de un solo substrato en una cara, guarda 4.7 GB; si es de dos substratos en una cara, almacena 8.5 GB, o bien 9.4 GB en un substrato en cada cara del disco, o la gigantesca cantidad de 17 GB cuando el disco es de cuatro substratos, dos por cara. Por último, las densidades de grabación pasaron de las 16,000 pistas por pulgada del CD a 34,000 en el DVD (y de 43,000 bits por pulgada a 96,000), junto con aumentos en la velocidad de transferencia.  

Como parte fundamental del procesamiento digital de señales, debemos hacer un paréntesis y mencionar la compresión: un conjunto de técnicas matemáticas empleadas para reducir la gigantesca cantidad de muestras obtenidas a partir del mundo real. Sabemos ya que el sonido se digitaliza a razón de 44,100 muestras por segundo por cada canal, pero eso es poco comparado con el enorme número de datos binarios requeridos para las imágenes y, más todavía, para las imágenes en movimiento. En un disco DVD se puede hacer caber una película completa de más de dos horas de duración (133 minutos), a color, con sonido envolvente en "5.1" canales (izquierdo, derecho, central, izquierdo posterior, derecho posterior y bajas frecuencias) y con varios tipos de subtítulos, manteniendo una calidad muy superior a la obtenida con las videograbadoras analógicas (VHS: Video Home System). Esto simplemente no sería posible sin la compresión digital, que puede reducir a mucho menos de la mitad la cantidad de bits necesarios, sin perder apreciablemente calidad.

 Al hablar de los lectores ópticos, se menciona el estándar JPEG (Joint Photographic Experts Group Compressed File: archivo comprimido tipo grupo combinado de expertos fotográficos), empleado internacionalmente para la codificación de imágenes. Cuando además las imágenes están en movimiento y tienen sonido, entonces se habla de un estándar derivado, llamado MPEG (Moving Picture Experts Group: grupo de expertos para imágenes en movimiento). El carácter de "combinado" de los grupos obedece a que es un esfuerzo común entre ISO: Organización Internacional para la Estandarización, e IEC: Comisión Electrotécnica Internacional. La descripción del estándar MPEG-2 empleado en los discos DVD y en la transmisión de televisión vía satélite es como sigue: "uso de esquemas de compresión con y sin pérdidas, que incluyen preprocesamiento; reducción de redundancia espacial mediante transformadas cosenoidales discretas, cuantización no lineal y codificación de entropía; reducción de redundancia temporal mediante predicciones adelan­tada y bidireccional, utilizando vectores de movimiento.