Quizás te parezca aburrido este capitulo ya que es puramente teórico, pero es necesario para que entiendas a fondo y parte del curso que dicto a mis alumnos de primer ciclo de ingeniería informática en la Universidad Alas Peruanas. Puedes saltar entre los términos con los cuales aun no estas familiarizado y dejar los demás para mas adelante como referencia.
Es una red mundial de redes de computadoras, que permite la comunicación directa y transparente para compartir información y servicios entre usuarios.
Un computador que forme parte de esta red de redes puede comunicarse con otro en cualquier parte del mundo, con tal que este otro computador también este conectada a Internet en ese momento.
Para que la comunicación entre dos computadoras sea posible es indispensable que ambas hablen el mismo idioma, es decir usen el mismo protocolo de comunicación.
Protocolo entonces es el conjunto de reglas que determinan cómo se realizará el intercambio de información entre dos computadores.
Transmission Control Protocol/Internet Protocol. Dos protocolos de comunicaciones diseñado originalmente para la red ARPA, proyecto de comunicación de computadoras del Departamento de Defensa de USA que posteriormente ha adoptado Internet.
Transmission Control Protocol (TCP): Divide la información en paquetes de tamaño adecuado, los numera, añade cierta información para su posterior decodificación y para detectar posibles errores luego de ser transmitidos.
Internet Protocol (IP): Este protocolo se encarga de la transmisión de los paquetes previamente preparados por el TCP, proporcionando la dirección de origen y destino.
Dos variaciones de este protocolo son SLIP (Serial Line/Internet Protocol) y PPP (Point to Point Protocol).
Existen muchos servicios a disposición de los usuarios en Internet, los más importantes son:
File Transfer Protocol (FTP): Permite el intercambio de archivos. Simple Mail Tranfer Protocol (SMTP): Permite el intercambio de correo. El protocolo TELNET: permite la emulación de terminal para todo tipo de computadoras.
Son paginas de hipertexto que pueden ser consultadas mediante un navegador (Browser) en modo gráfico y contienen texto formateado, imágenes, sonido, video y conexiones para manejar de forma fácil e interactiva la información.
Para establecer la comunicación es necesario que cada computador sea identificado de forma única en la red, para ello se usa la dirección o número IP que esta formado por cuatro números que pueden tomar valores entre 0 y 255, separados por puntos. Estos números son asignados por una organización internacional, para evitar cualquier duplicidad.
Las computadoras necesitan el número IP para establecer contacto entre sí, pero ese número es muy difícil de recordar para nosotros los humanos y es por eso que usamos el dominio.
Un dominio es un conjunto de códigos literales, separados por puntos, llamados subdominios. Cada subdominio identifica un grupo de computadoras. Si leemos el dominio de izquierda a derecha, cada subdominio será más vasto que el subdominio ubicado a su izquierda. Por ejemplo el dominio uap.edu.pe, identifica a la Universidad ALAS Peruanas en internet, donde: uap es el nombre que hemos elegido, edu identifica a las organizaciones educativas y pe a nuestra ubicación geográfica, el Perú. Para ver una lista de dominios clic AQUI
Id | Descripción | Id | Descripción |
---|---|---|---|
com | Comercial | es | España |
edu | Educación | cl | Chile |
org | Organización sin fines de lucro | pe | Perú |
gob | Gobierno no militar | mx | México |
mil | Militar | co | Colombia |
net | Recurso de red | USA |
URL (Uniform Resource Locator=localizador uniforme de recursos), es la dirección de un archivo escrito en un formato que el servidor de Web puede interpretar, para lograr acceder al archivo. Usualmente esta esta formado de la siguiente manera:
[protocolo://][dominio][:puerto][/ruta/]archivo
9.1 Protocolo:// Es opcional, por omisión se asume http://, es el protocolo usado para transmitir archivos en Internet. Para el acceso a servidores Web, el protocolo suele ser http, pero se admiten otros protocolos (ftp, gopher, news, file...).
9.2 Dominio Es opcional y define el nombre del servidor que contiene el objeto buscado (como: www.uap.edu.pe). Por omisión asume el mismo que el de la ultima dirección usada.
9.3 :puerto Es opcional y solo es necesaria cuando se usa un numero de puerto TCP no estándar.
9.4 /ruta/ Es opcional y define la ruta por donde deberá buscarse el archivo. Por omisión se asume el mismo que el de la ultima dirección usada. Nota que es necesario usar la / como en UNIX y no \ como en DOS.
9.5 archivo Este parámetro es obligatorio e indica el nombre del archivo que quieres abrir.
La razón de este convenio es precisamente que la mayor parte de los servidores de Web que hay en Internet están basados en UNIX. Esto se nota también en que por lo general los nombres de los archivos son largos y pueden contener varios puntos. También debemos tener en cuenta que en UNIX las mayúsculas y las minúsculas son distintas en los nombres de archivo.
Una URL relativa es una URL incompleta, en la que por ejemplo falta el protocolo, dominio y hasta parte de la ruta, que el navegador puede deducir segun las definidas para el documento en uso.
Son unas computadoras cuya misión es traducir los nombres de dominio (ej: empresa.com) a sus correspondientes números IP.
Es un servidor que almacena contenidos a cambio de un pago anual.
Son básicamente archivos tipo texto, que mediante etiquetas HTML, que son interpretados por el navegador como etiquetas de formateo de texto, es decir, texto presentado de forma estructurada y agradable, con enlaces (hyperlinks) que conducen a otras fuentes de información relacionadas y con objetos multimedia (imágenes, sonido, video...).
La tecnología hipertexto funciona gracias a que para especificar de manera uniforme el objeto al que apunta nuestro enlace, se usa una forma estandarizada que se denomina URL, asi cada archivo tiene una dirección única, de forma que puede ser ubicado.
HTML (Hypertext Markup Language = lenguaje con marcas de hipertexto) es un lenguaje muy sencillo que permite diseñar hipertexto.
La descripción se basa en especificar en el texto la estructura lógica del contenido (títulos, párrafos de texto normal, enumeraciones, definiciones, citas, enlaces, listas, tablas, etc) y dejar que luego la presentación final de dicho hipertexto se realice por un programa especializado, llamado navegador (Chrome, FireFox, Safari, iExplorer o Mosaic).
Tomando como base que el contenido de un documento debe estar separado de su formato, es decir los diferentes efectos que se quieren dar (tipos de letra, tamaño y color de letra, cursiva, negrita, alineamiento, color de border, fondos, etc)
La mayoría de efectos se especifican poniendo etiquetas al rededor de lineas de texto, para indicar al navegador como debe lucir cierta parte del texto.
Ejemplo: Hola <B>Tiburón</B> como estas hoy ?
Se vera así: Hola Tiburón como estas hoy ?
Todos los etiquetas están encerrados entre los signos < y >, y con la barra / cuando se trata del fin de un etiqueta, aunque algunos etiquetas no requieren cierre.
A veces es necesario ofrecer datos adicionales a cada etiqueta en forma de parámetros. Por ejemplo, cuando se define un hiperenlace hay que especificar su destino. Estos parámetros siempre se ponen en la apertura de la etiqueta y tienen el formato <etiqueta parmetro1=valor1 parametro2=valor2...>, el texto afectado se encontrara inmediatamente después hasta encontrar la etiqueta de cierre, con el formato </etiqueta>.
Más adelante en este DEMO mostrare el efecto de los etiquetas más usados en la creación de un documento HTML. Como un ejemplo es mejor que mil palabras en muchas etiquetas casi no explico nada y voy de frente al ejemplo del efecto que produce dicho etiqueta.
Eso depende del navegador que use cada cliente en particular y del grado de avance de implementacion de las recomendaciones de la W3C de dicho navegador.
Formato de documento estándar para manejo de paginas Web. HTML es una aplicación de SGML.
Estándar internacional para describir la estructura de un documento Markup. La idea básica del SGML es hacer la información independiente de cualquier software o hardware particular. Esto se logra guardando todos los documentos como texto puro y hacer referencia a otros documentos en otros formatos como formatos, estilos, imágenes, sonido etc cuando se requieran. SGML fue definido por el estándar ISO 8879 en 1986.
Código especial en un documento que especifica que parte del documento debe ser procesado por una aplicación. En un procesador de palabras, Markup especifica como el texto deberá ser formateado; en un documento HTML, Markup especifica la estructura del documento (encabezado, títulos, párrafos, etc)
Texto que contiene conexiones con otros documentos. Los documentos HTML son un ejemplo de hipertexto.
Un programa visualizador cliente que trabaja en modo gráfico comúnmente usado en Web, para ver y manejar documentos HTML. Estos programas por ser gráficos solo funcionan bajo Win 3.1, 95 o 98. Ej: Netscape Navegator, Internet Explorer, Mosaic, Lynx, Cello etc
Navegador HTML que puede ser usado en el modo de terminal como VT100 o una PC con un software de comunicaciones. Los mas comunes son Lynx y WWW de CERN.
Documento de presentación o caratula de un servicio o grupo de paginas HTML en un servidor Web.
Laboratorio Europeo para Fisica de Particulas, ubicado en Ginebra, donde se invento el World Wide Web. Para mas información consulta: http://www.cern.ch
Localizado en la Universidad de Illinois en Urbana-Champaign. El NCSA fue fundado por el gobierno de U.S. para hacer mas accesible las computadoras. Aqui fue creado el Mosaic el primer navegador para paginas Web y en el que están basados todos los navegadores modernos.
Es una característica de los servidores Web, que permite a los navegadores cliente correr aplicaciones instaladas como scripts en el servidor. Los scripts CGI pueden ser creados en cualquier lenguaje de programación que corra en el servidor.
Un protocolo usado para mensajes de correo. La antigua versión POP2 (1980) era solo para recibir mensajes y era necesario el uso de SMTP para el envío de mensajes de correo. Hoy tenemos la POP3 que ya supero este problema y se puede usar en conjunto con SMTP o sola.
Protocolo estándar Internet usado para el envío de mensajes de correo. Un intento de expandirlo para envío/recepcion se frusto, por lo que es muy comun que trabaje en pareja con el POP. Soportado por Pegasus Mail 2.4, MS Internet Mail 3.0, Eudora Pro 2.2 etc
Nuevo estándar similar al POP, pero con caracteristicas de busqueda entre los mensajes del servidor usando palabras claves sin necesidad de almacenarlos vocalmente. La versión IMAP4 soporta envío de archivos no ASCII y MIME. Aun no soportado por la mayoría. Lo soportan Embla 1.2 y Simeon 4.0
Un protocolo aun en desarrollo en la Carnegie-Mellon, que ha prometido superar a IMAP4 para suscribirse a listas de interesa, buzones de correo y buscar direcciones en agendas.
Codificación usada para transportar archivos no ASCII (ejecutables, Word, Excel, imágenes, video etc). Soporta multiparte, es decir que puedes dividir el archivo y enviarlo en varios mensajes. Actualmente soportado por IMAP4. Es también el formato usado por los servidores Web y navegadores (browser) para transferir archivos. MIME le dice a los navegadores el tipo de archivo y como procesarlo.
Unix to Unix. Es un algoritmo de codificación/decodificacion para el envío de archivos no ASCII a través del correo. El remitente convierte el archivo en ASCII y luego el receptor lo decodifica reconstruyendo los datos originales.
Esquema que permite a un navegador (browser) enviar un formulario (form) a una dirección de correo electrónico (E-mail) o generar la ventana de edicion de correo.
Protocolo usado para transferir documentos HTML por la red, entre el servidor Web y el navegador cliente.
Programa de red que responde a los requerimientos locales o remotos de documentos HTML. Solo hay que proporcionar el nombre del archivo en el formato URL y el servidor responde el archivo que puede estar en cualquier formato como texto, binario etc.
En redes, es un computador dedicado a prevenir el acceso de intrusos a través de Internet hacia la red interna o intranet. Si tu tienes un Firewall en tu sitio, normalmente no podrás conectar directamente a un servidor en Internet. Necesitaras de un agente llamado servidor proxy, que haga la conexión por ti. La mayoría de firewalls tiene un proxy asociado a cada protocolo ej: HTTP, FTP y Telnet.
Los proxys típicos aceptan conexiones de usuarios, toman decisiones y completan, a nombre del usuario, una conexión en un destino remoto.
Uno de los esquemas que puede ser especificado en las direcciones URL. Tradicionalmente el mas usado de los servicios y te permite obtener una copia del archivo desde la computadora remota o conectarte a esta usando TCP/IP.
La organización WWW en el MIT es una organización sin fines de lucro que promueve el X Windows proporcionando códigos de ejemplo. Para mas información consulta: http://www.w3C.org
Responsables del manejo tecnico de Internet. El IETF coordina con los diseñadores los estándares HTML.
Tecnica creada por ICADD y documentada en las especificaciones ISO 12083, que transforma de forma automática archivos SGML (incluso archivos HTML) a Braille o sistemas de sintetizacion de voz. Todos los documentos HTML creados con HoTMetaL son compatibles ICADD y pueden ser leídos por conversores usando las técnicas ICADD.
ISO = International Organization for Standardization
This is the character set for `special' or `accented' characters supported by HTML. This character set is also called `ISO Latin 1'. It includes characters required for most western European languages: Dutch, English, French, German, Italian, Irish, the `Iberian' languages, and the `Nordic' languages. This character set is one of several in the ISO 8859 standard: others support, for example, eastern European languages and Cyrillic-based languages. Only ISO 8859/1 is currently supported by HTML, however.
Es el nombre generico para cualquier clase de identificador de recipiente en Internet. Hay tres tipos basicos:
URL (Uniform Resource Locator)
URC (Uniform Resource Classification)
URN (Uniform Resource Name)
La implementacion de URC y URN están aun en etapa experimental.
La idea básica es que la fuente (por ejemplo un documento) es identificado por un URN, un tipo de identificador publico en el SGML. El URN esta sujeto al URC, que es una colección de información sobre la fuente (que puede incluir, por ejemplo, el precio y uno o mas URL).
Conviene que nos detengamos momentáneamente en la estructuración habitual de un servidor Web. Para empezar, siempre hay una página de bienvenida (home page) que podría compararse con la caratula de una revista, si no sabemos exactamente qué es lo que buscamos, o no sabemos dónde encontrarlo, la caratula es lo primero que vemos. Para acceder al HOME PAGE de cualquier servidor de Web, basta con escribir una barra en el lugar de la ruta (es decir, reclamamos al servidor el directorio raíz). La mayoría de servidores responderán con una pagina de nombre index.htm, index.html, index.php otros usan default en lugar de index.
El resto de la información que se puede encontrar en un servidor Web se distribuye a partir de ese directorio raíz en distintos subdirectorios y archivos. Un convenio muy habitual relativo al nombre de los ficheros es hacer que los archivos que contengan documentos HTML terminen en htm o html.
Para más información lee mis referencias