Conceptos básicos

Quizas te paresca aburrido este capitulo ya que es puramete teorico, pero es necesario para que entiendas a fondo y parte del curso que dicto a mis alumnos de primer ciclo de ingenieria informatica en la Universidad Alas Peruanas. Puedes saltar entre los terminos con los cuales aun no estas familiarizado y dejar los demas para mas adelante como referencia.

1. Qué es Internet ?

Es una red mundial de redes de computadoras, que permite la comunicación directa y transparente para compartir información y servicios entre usuarios.

Un computador que forme parte de esta red de redes puede comunicarse con otro en cualquier parte del mundo, con tal que este otro computador también este conectada a Internet en ese momento.

2. Qué es Protocolo ?

Para que la comunicación entre dos computadoras sea posible es indispensable que ambas hablen el mismo idioma, es decir usen el mismo protocolo de comunicación.

Protocolo entonces es el conjunto de reglas que determinan cómo se realizará el intercambio de información entre dos computadores.

3. Qué es TCP/IP ?

Transmission Control Protocol/Internet Protocol. Dos protocolos de comunicaciones diseñado originalmente para la red ARPA, proyecto de comunicación de computadoras del Departamento de Defensa de USA que posteriormente ha adoptado Internet.

Transmission Control Protocol (TCP): Divide la información en paquetes de tamaño adecuado, los numera, añade cierta información para su posterior decodificación y para detectar posibles errores luego de ser transmitidos.

Internet Protocol (IP): Este protocolo se encarga de la transmisión de los paquetes previamente preparados por el TCP, proporcionando la dirección de origen y destino.

Dos variaciones de este protocolo son SLIP (Serial Line/Internet Protocol) y PPP (Point to Point Protocol).

4. Servicios de Internet

Existen muchos servicios a disposición de los usuarios en Internet, los más importantes son:

  1. Hipertexto: WWW
    El World Wide Web o simplemente Web (telaraña) fue desarrollado por el Laboratorio Europeo de Física de Partículas, para facilitar el manejo de información.
    Está basado en el Hyper Text Transport Protocol (HTTP) que permite el intercambio de documentos de texto en un formato especial llamado Hyper Text Markup Language (HTML), el cual posee la característica de poder formatear el texto (Tipos, tamañs y colores de letras, atributos como negrita, itálica, subrayado, estilos, listas, tablas, formularios, marcos etc), fácil enlace de documentos de forma que un simple clic de mouse sobre una palabra nos muestra otro documento asociado, además soporta multimedia (imagenes, audio y video) y aplicaciones en línea.
    Para poder acceder a estos documentos se requiere un navegador, software de cliente que es capas de interpretar el lenguaje HTML.
  2. Correo electrónico: CORREO
    Este es uno de los servicios más importantes y se trata de el intercambio de documentos (en texto puro) usando el protocolo SMTP (Simple Mail Transfer Protocol) que define el formato del mensaje y la manera como será menajado en la red. Para usar el correo cada usuario debera tener asignado un buzón en algún servidor de correo, ya que el intercambio es solo entre servidores y no entre clientes. Para leer su buzón el usuario debe acceder a su servidor de correo vía un programa cliente de correo y luego identificarse ante el servidor.
  3. Listas de interés: USENET
    Son foros de debate sobre algun tema en común, donde se puede dicutir e intercambiar informacion sobre algun tema. Cada usurio envia al servidor su correo dirigido al grupo y este es almacenado para que en cualquier momento este y otros mensajes sean recogidos por los interesados en la lista.
  4. Noticias: NEWS
    Uno se inscribe es una lista (normalmente son servicios pagados), cada nueva noticia o articulo sobre el tema es transferido al servidor quien se encarga de la distribucion enviando el material como mensaje de correo a cada uno de los usuarios inscritos en la lista.
  5. Transferencia de archivos: FTP
    Servicio con el que puedo transferir todo tipo de archivos usando el File Transfere Protocol, el cual permite que computadores con sistemas operativos distintos intercambien informacion sin problemas. Ademas de tener la direccion del servidor FTP debemos tener un codigo de acceso aunque muchos aceptan el modo anonimo (anonymous) el cual es un modi de acceso publico.
  6. Acceso remoto: Telnet
    El protocolo TErminaL EmulaTion fue creado por ARPA y permite accesar a una computadora situada en un lugar remoto, como si estuviesemos frente a ella. Ademas de conocer la direccion de dicha camputadora, tendremos que tener un codigo de acceso a ella, aunque muchos aceptan el modo invitado (guest).
  7. Chat o IRC - Internet Relay Channel
    Un servicio en el cual los usuarios establecen comunicacion en tiempo real, las cuales pueden ser privadas o entre un grupo de personas. Los metodos de comunicacion pueden ser el teclado, el audio y el video.
  8. En el mas comun y sencillo de los casos los usarios acceden a un servidor IRC que les presentara una pizarra donde podran leer lo que escriba cualquier persona del grupo en forma instantanea, estableciendose casi una conversacion escrita. Logicamente la comunicacion es limitada (no transmite tonos ni inflexiones de voz), un poco impersonal ya uno no ve a sus interlocutores y lenta por la velocidad de escritura.
  9. Gopher:
    Diseñ en la Universidad de Minesota es el primer intento de facilitar la consulta de documentos por un sistema de menus. Solo soprta texto y actualmente esta dejando de usarse dandole paso a la Web.

File Transfer Protocol (FTP): Permite el intercambio de archivos. Simple Mail Tranfer Protocol (SMTP): Permite el intercambio de correo. El protocolo TELNET: permite la emulacion de terminal para todo tipo de computadoras.

5. Que es Word Wide Web ?

El mas poderoso servicio de Internet llamada la telaraña mundial tambien conocida como WWW, W3 o simplemente Web, apoya el hipertecto y la multimedia via lo que llamamos paginas Web.

6. Que son paginas Web ?

Son paginas de hipertexto que pueden ser consultadas mediante un navegador (Browser) en modo grafico y contienen texto formateado, imagenes, sonido, video y conexiones para manejar de forma facil e interactiva la informacion.

7. Direcciones IP

Para establecer la comunicación es necesario que cada computador sea identificado de forma única en la red, para ello se usa la dirección o número IP que esta formado por cuatro números que pueden tomar valores entre 0 y 255, separados por puntos. Estos números son asignados por una organización internacional, para evitar cualquier duplicidad.

8. Dominio

Las computadoras necesitan el número IP para establecer contacto entre sí, pero ese número es muy difícil de recordar para nosotros los humanos y es por eso que usamos el dominio.

Un dominio es un conjunto de códigos literales, separados por puntos, llamados subdominios. Cada subdominio identifica un grupo de computadoras. Si leemos el dominio de izquierda a derecha, cada subdominio será más vasto que el subdominio ubicado a su izquierda. Por ejemplo el dominio uap.edu.pe, identifica a la Universidada ALAS Peruanas en internet, donde: uap es el nombre que hemos elegido, edu identifica a las organizaciones educativas y pe a nuestra ubicación geográfica, el Perú. Para ver una lista de dominios clic AQUI

IdDescripciónIdDescripción
comComercialesEspaña
eduEducaciónclChile
orgOrganización sin fines de lucropePerú
gobGobierno no militarmxMéxico
milMilitarcoColombia
netRecurso de red USA

9. Que es URL ?

URL (Uniform Resource Locator=localizador uniforme de recursos), es la direccion de un archivo escrito en un formato que el servidor de Web puede interpretar, para lograr acceder al archivo. Usualmente esta esta formado de la siguiente manera:

[protocolo://][dominio][:puerto][/ruta/]archivo

9.1 Protocolo:// Es opcional, por omision se asume http://, es el protocolo usado para transmitir archivos en Internet. Para el acceso a servidores Web, el protocolo suele ser http, pero se admiten otros protocolos (ftp, gopher, news, file...).

9.2 Dominio Es opcional y define el nombre del servidor que contiene el objeto buscado (como: www.uap.edu.pe). Por omision asume el mismo que el de la ultima direccion usada.

9.3 :puerto Es opcional y solo es necesaria cuando se usa un numero de puerto TCP no estandar.

9.4 /ruta/ Es opcional y define la ruta por donde debera buscarse el archivo. Por omision se asume el mismo que el de la ultima direccion usada. Nota que es necesario usar la / como en UNIX y no \ como en DOS.

9.5 archivo Este parametro es obligatorio e indica el nombre del archivo que quieres abrir.

La razón de este convenio es precisamente que la mayor parte de los servidores de Web que hay en Internet estan basados en UNIX. Esto se nota también en que por lo general los nombres de los archivos son largos y pueden contener varios puntos. Tambien debemos tener en cuenta que en UNIX las mayúsculas y las minúsculas son distintas en los nombres de archivo.

Una URL relativa es una URL incompleta, en la que por ejemplo falta el protocolo, dominio y hasta parte de la ruta, que el navegador puede deducir segun las definidas para el documento en uso.

10. Servidor DNS - Domain Name Server

Son unas computadoras cuya misión es traducir los nombres de dominio (ej: empresa.com) a sus correspondientes números IP.

11. Hosting

Es un servidor que almacena contenidos a cambio de un pago anual.

12. Que es hipertexto ?

Son basicamente archivos tipo texto, que mediante etiquetas HTML, que son interpretados por el navegador como etiquetas de formateo de texto, es decir, texto presentado de forma estructurada y agradable, con enlaces (hyperlinks) que conducen a otras fuentes de información relacionadas y con objetos multimedia (imagenes, sonido, video...).

13. Como funciona el hipertexto ?

La tecnologia hipertexto funciona gracias a que para especificar de manera uniforme el objeto al que apunta nuestro enlace, se usa una forma estandarizada que se denomina URL, asi cada archivo tiene una direccion unica, de forma que puede ser ubicado.

14. Que son las etiquetas HTML ?

HTML (Hypertext Markup Language = lenguaje con marcas de hipertexto) es un lenguaje muy sencillo que permite diseñar hipertexto.

La descripción se basa en especificar en el texto la estructura lógica del contenido (títulos, párrafos de texto normal, enumeraciones, definiciones, citas, enlaces, listas, tablas, etc) y dejar que luego la presentación final de dicho hipertexto se realice por un programa especializado, llamado navegador (Chrome, FireFox, Safari, iExplorer o Mosaic).

15. Que es el estilo CSS ?

Tomando como base que el contenido de un documento debe estar separado de su formato, es decir los diferentes efectos que se quieren dar (tipos de letra, tamaño y color de letra, cursiva, negrita, alineamiento, color de border, fondos, etc)

La mayoria de efectos se especifican poniendo etiquetas al rededor de lineas de texto, para indicar al navegador como debe lucir cierta parte del texto.

Ejemplo: Hola <B>Tiburón</B> como estas hoy ?

Se vera asi: Hola Tiburon como estas hoy ?

Todos los etiquetas están encerrados entre los signos < y >, y con la barra / cuando se trata del fin de un etiqueta, aunque algunos etiquetas no requieren cierre.

A veces es necesario ofrecer datos adicionales a cada etiqueta en forma de parametros. Por ejemplo, cuando se define un hiperenlace hay que especificar su destino. Estos parametros siempre se ponen en la apertura de la etiqueta y tienen el formato <etiqueta parmetro1=valor1 parametro2=valor2...>, el texto afectado se encontrara inmediantamente despues hasta encontrar la etiqueta de cierre, con el formato </etiqueta>.

Más adelante en este DEMO mostrare el efecto de los etiquetas más usados en la creación de un documento HTML. Como un ejemplo es mejor que mil palabras en muchas etiquetas casi no explico nada y voy de frente al ejemplo del efecto que produce dicho etiqueta.

16. Que tipos de archivo soporta HTML ?

Eso depende del navegador que use cada cliente en particular y del grado de avance de implementacion de las recomendaciones de la W3C de dicho navegador.

TXT
texto
HTM
Pagina Web
PS
Script
JPG, TIP
imagenes
GIF
Imagenes y animaciones
WAV, MP3, AU, AIF
Sonidos
AVI, MOV, MPG, JPEG
Videos
Tambien debes tener en cuenta que para que se pueda mostar un cierto tipo de letra, esta debe estar cargada en el Windows del cliente.

17. Hits, cookies y visitantes

Es muy interesante saber para el que tiene una pagina Web, el numero de visitantes de la pagina, que hacen ellos en la pagina etc.

17.1 HIT
Se denomina asi a un pedido del navegador respecto a un archivo, dicho de otra manera el clic de un usuario en un enlace. Inmediatamente despues del clic el navegador contacta la URL y transfiere el archivo HTML (el texto) y luego transfiere los otros archivos como imagenes, sonido Appletes de JAVA etc y en las estadisticas cada uno de estos archivo transferido es un HIT.

17.2 VISITA
Se denomina asi a un unico navegante que genera multiples pedidos de carga sobre el mismo sitio desde una unica ubicacion, en un tiempo prudencial (por lo gereal 30 minutos).

17.3 VISITANTE
Es el hecho de registrar el numero de visitantes distintos, lo que implica que hay que identificarlos para no contar un navegante que regresa. Normalmente esta identificacion se hace con un COOKIE o pidiendo registro.

17.4 COOKIE
Es un pequeño archivo de texto plano almacenado en la carpeta de temporales del discu duro del cliente, para poder identificarlo, lo que le permitira posteriormente rastrearlo, para determinar como se mueve en la pagina.

18. HTML = HyperText Markup Language

Formato de documento estandar para manejo de paginas Web. HTML es una aplicacion de SGML.

18.1 SGML

Estandar internacional para describir la estructura de un documento Markup. La idea basica del SGML es hacer la informacion independiente de cualquier software o hardware particular. Esto se logra guardando todos los documentos como texto puro y hacer referencia a otros documentos en otros formatos como formatos, estilos, imagenes, sonido etc cuando se requieran. SGML fue definido por el estandar ISO 8879 en 1986.

18.2 Markup

Codigo especial en un documento que especifica que parte del documento debe ser procesado por una aplicacion. En un procesador de palabras, Markup especifica como el texto debera ser formateado; en un documento HTML, Markup especifica la estructura del documento (encabezado, titulos, parrafos, etc)

18.3 Hypertext = hipertexto

Texto que contiene conexiones con otros documentos. Los documentos HTML son un ejemplo de hipertexto.

18.4 Browser = navegador

Un programa visualizador cliente que trabaja en modo grafico comunmente usado en Web, para ver y manejar documentos HTML. Estos programas por ser graficos solo funcionan bajo Win 3.1, 95 o 98. Ej: Netscape Navegator, Internet Explorer, Mosaic, Lynx, Cello etc

18.5 Line-mode browser

Navegador HTML que puede ser usado en el modo de terminal como VT100 o una PC con un software de comunicaciones. Los mas comunes son Lynx y WWW de CERN.

18.6 Home page = pagina principal

Documento de presentacion o caratula de un servicio o grupo de paginas HTML en un servidor Web.

18.7 CERN

Laboratorio Europeo para Fisica de Particulas, ubicado en Ginebra, donde se invento el World Wide Web. Para mas informacion consulta: http://www.cern.ch

18.8 NCSA = National Center for Supercomputing Applications

Localizado en la Universidad de Illinois en Urbana-Champaign. El NCSA fue fundado por el gobierno de U.S. para hacer mas accesible las computadoras. Aqui fue creado el Mosaic el primer navegador para paginas Web y en el que estan basados todos los navegadores modernos.

18.9 CGI = Common Gateway Interface

Es una caracteristica de los servidores Web, que permite a los navegadores cliente correr aplicaciones instaladas como scripts en el servidor. Los scripts CGI pueden ser creados en cualquier lenguaje de programación que corra en el servidor.

18.10 POP - Post Office Protocol

Un protocolo usado para mensajes de correo. La antigua version POP2 (1980) era solo para recibir mensajes y era necesario el uso de SMTP para el envio de mensajes de correo. Hoy tenemos la POP3 que ya supero este problema y se puede usar en conjunto con SMTP o sola.

18.11 SMTP - Simple Mail Transfer Protocol

Protocolo estandar Internet usado para el envio de mensajes de correo. Un intento de expandirlo para envio/recepcion se frusto, por lo que es muy comun que trabaje en pareja con el POP. Soportado por Pegasus Mail 2.4, MS Internet Mail 3.0, Eudora Pro 2.2 etc

18.12 IMAP - Internet Mail Access Protocol

Nuevo estandar similar al POP, pero con caracteristicas de busqueda entre los mensajes del servidor usando palabras claves sin necesidad de almacenarlos localmente. La version IMAP4 soporta envio de archivos no ASCII y MIME. Aun no soportado por la mayoria. Lo soportan Embla 1.2 y Simeon 4.0

18.13 IMSP - Interactive Mail Support Protocol

Un protocolo aun en desarrollo en la Carnegie-Mellon, que ha prometido superar a IMAP4 para suscribirse a listas de interesa, buzones de correo y buscar direcciones en agendas.

18.14 MIME - Multipurpose Internet Mail Extensions (RFC-1510)

Codificacion usada para transportar archivos no ASCII (ejecutables, Word, Excel, imagenes, video etc). Soporta multiparte, es decir que puedes dividir el archivo y enviarlo en varios mensajes. Actualmente soportado por IMAP4. Es tambien el formato usado por los servidores Web y navegadores (browser) para transferir archivos. MIME le dice a los navegadores el tipo de archivo y como procesarlo.

18.15 UUencode/UUdecode

Unix to Unix. Es un algoritmo de codificacion/decodificacion para el envio de archivos no ASCII a traves del correo. El remitente convierte el archivo en ASCII y luego el receptor lo decodifica reconstruyendo los datos originales.

18.16 MailTo

Esquema que permite a un navegador (browser) enviar un formulario (form) a una direccion de correo electronico (E-mail) o generar la ventana de edicion de correo.

18.17 HTTP= HyperText Transfer Protocol

Protocolo usado para transferir documentos HTML por la red, entre el servidor Web y el navegador cliente.

18.18 Servidor Web

Programa de red que responde a los requerimientos locales o remotos de documentos HTML. Solo hay que proporcionar el nombre del archivo en el formato URL y el servidor responde el archivo que puede estar en cualquier formato como texto, binario etc.

18.19 Firewall

En redes, es un computador dedicado a prevenir el acceso de intrusos a traves de Internet hacia la red interna o intranet. Si tu tienes un Firewall en tu sitio, normalmente no podras conectar directamente a un servidor en Internet. Necesitaras de un agente llamado servidor proxy, que haga la conexion por ti. La mayoria de firewalls tiene un proxy asociado a cada protocolo ej: HTTP, FTP y Telnet.

18.20 Servidor Proxy

Los proxys tipicos aceptan conexiones de usuarios, toman decisiones y completan, a nombre del usuario, una conexion en un destino remoto.

18.21 FTP = File Transfer Protocol

Uno de los esquemas que puede ser especificado en las direcciones URL. Tradicionalmente el mas usado de los servicios y te permite obtener una copia del archivo desde la computadora remota o conectarte a esta usando TCP/IP.

18.22 W3C

La organizacion WWW en el MIT es una organizacion sin fines de lucro que promueve el X Windows proporcionando codigos de ejemplo. Para mas informacion consulta: http://www.w3C.org

18.23 IETF = Internet Engineering Task Force

Responsables del manejo tecnico de Internet. El IETF coordina con los diseñadores los estandares HTML.

18.24 ICADD = International Committee for Accessible Document Design

Tecnica creada por ICADD y documentada en las especificaciones ISO 12083, que transforma de forma automatica archivos SGML (incluso archivos HTML) a Braille o sistemas de sintetizacion de voz. Todos los documentos HTML creados con HoTMetaL son compatibles ICADD y pueden ser leidos por conversores usando las tecnicas ICADD.

ISO = International Organization for Standardization

18.25 ISO 8859/1 character set

This is the character set for `special' or `accented' characters supported by HTML. This character set is also called `ISO Latin 1'. It includes characters required for most western European languages: Dutch, English, French, German, Italian, Irish, the `Iberian' languages, and the `Nordic' languages. This character set is one of several in the ISO 8859 standard: others support, for example, eastern European languages and Cyrillic-based languages. Only ISO 8859/1 is currently supported by HTML, however.

18.26 URI = Uniform Resource Identifier

Es el nombre generico para cualquier clase de identificador de recipiente en Internet. Hay tres tipos basicos:
URL (Uniform Resource Locator)
URC (Uniform Resource Classification)
URN (Uniform Resource Name)

La implementacion de URC y URN estan aun en etapa experimental.

La idea basica es que la fuente (por ejemplo un documento) es identificado por un URN, un tipo de identificador publico en el SGML. El URN esta sujeto al URC, que es una coleccion de informacion sobre la fuente (que puede incluir, por ejemplo, el precio y uno o mas URL).

19. Algo mas...

Conviene que nos detengamos momentáneamente en la estructuración habitual de un servidor Web. Para empezar, siempre hay una página de bienvenida (home page) que podría compararse con la caratula de una revista, si no sabemos exactamente qué es lo que buscamos, o no sabemos dónde encontrarlo, la caratula es lo primero que vemos. Para acceder al HOME PAGE de cualquier servidor de Web, basta con escribir una barra en el lugar de la ruta (es decir, reclamamos al servidor el directorio raíz). La mayoria de servidores responderan con una pagina de nombre index.htm, index.html, index.php otros usan default en lugar de index.

El resto de la información que se puede encontrar en un servidor Web se distribuye a partir de ese directorio raíz en distintos subdirectorios y archivos. Un convenio muy habitual relativo al nombre de los ficheros es hacer que los archivos que contengan documentos HTML terminen en htm o html.

Para más información lee mis referencias