2 Internet-Dienste im Überblick

"The Information Superhighway is a misnormer.
First, there's no highway - there are no roadmaps,
guides, rules. And second, it ain't super."
David Martin.

Die einzelnen Dienste, die man heute im Internet in Anspruch nehmen kann, haben sich nach und nach entwickelt. Zu Beginn wurde die Basis des Internets von den drei Diensten elektronische Post, Telnet und FTP gebildet. Später kamen dann Informationsdienste wie News, Archie, Gopher und WAIS hinzu. Der jüngste Dienst ist WWW, der nahezu alle anderen Dienste integrieren kann. Deshalb fange ich mit dem wichtigsten Basisdienst, der elektronischen Post, an und schließe mit WWW den Überblick.

2.1 Die elektronische Post

Ein Beispiel: Sie haben gerade eine tolle Werbung für Ihr neues Gerät entworfen und möchten sie von Ihrem Geschäftsfreund in Amerika überprüfen lassen. Sie schicken ihm rasch eine elektronische Post (Electronic Mail, E-Mail) über das Internet. Dieser holt sich das Dokument auf seinen Bildschirm, bringt ein paar Korrekturen an und schickt Ihnen das Dokument zurück. Beide bezahlen für diese Transatlantik-Operation nicht mehr als ein paar Pfennige - wesentlich weniger als für ein Telefongespräch.

E-Mail: Inzwischen ist es schick, eine E-Mail-Adresse auf der Visitenkarte zu haben. Auch in Veröffentlichungen in Zeitungen und Zeitschriften finden sich Mail-Adressen der Autoren und Herausgeber als Möglichkeit der Kontaktaufnahme. Der 'Klammeraffe' wird in Namen von Produkten, Firmen und Zeitschriften als Ersatz für das 'a' verwendet (sprachlich ein Paradox, denn das ASCII-Zeichen '@' wird 'at' ausgesprochen).
Bei E-Mail (auch 'Email', 'e-mail' oder schlicht nur 'Mail' genannt) handelt es sich um einen schnellen, bequemen Weg, Nachrichten bzw. Dokumente zwischen Rechnersystemen mit dem gewünschten Partner auszutauschen. Obwohl E-Mail der einfachste (und auch wohl älteste) netzübergreifende Dienst ist, will ich ihn etwas ausführlicher behandeln. Die anderen Dienste sind dann um so leichter zu verstehen.

Computer, die mit einem Multiuserbetriebssystem ausgestattet sind, also Systeme, bei denen mehrere Anwender (quasi-)gleichzeitig arbeiten können, besitzen nahezu alle die Möglichkeit, daß sich diese Anwender auch untereinander verständigen können. Das geschieht mittels eines kleinen Programms, das es ermöglicht, Nachrichten zu schreiben und diese dann an einen gewünschten Empfänger zu schicken. Der Adressat erhält dann beim nächsten Login den Hinweis auf neu eingegangene Post. Je nach Verbindung zu anderen Rechnern wird die Nachricht direkt zum Empfänger geschickt oder über einige Zwischenstationen geleitet (hier zeigt sie die Analogie zur althergebrachten Post).
Für diese Art des Versendens von Mitteilungen hat sich sehr schnell der englische Begriff 'Mail' (auf deutsch 'Post') eingebürgert. Und da es sich nicht um eine Post im üblichen Sinne handelt, also auf Papier geschrieben und im Umschlag überreicht, bezeichnet man das Ganze als 'Electronic Mail' oder kurz 'E-Mail'. Auch im Deutschen haben sich die englischen Begriffe 'Mail' und 'E-Mail' etabliert. Wird ein Computer an ein Netz angeschlossen, kann die E-Mail nicht nur an Benutzer auf dem lokalen System, sondern auch an Benutzer jedes Rechners im Netz versendet werden. Ist das Netz seinerseits an das Internet angeschlossen, kann die E-Mail prinzipiell an jeden Benutzer eines Rechners im Internet versendet werden.

Die E-Mail gewann in den letzten Jahren spürbar an Bedeutung, sowohl in der Wirtschaft als auch in der Technik, da es sich gezeigt hat, daß diese Art der Kommunikation die schnellste ist, die es gibt. Es ist eine Tatsache, daß die Erfolgsquote bei der E-Mail sogar noch höher liegt als beim Telefon.
Mit Erfolgsquote ist gemeint, daß man die Nachricht nach dem Absenden vergessen kann; man muß nicht warten, bis man den Empfänger eventuell erst nach mehreren Versuchen erreicht (z. B. mehrmals Anrufen oder warten, bis das Faxgerät beim Empfänger frei ist). Heutzutage ist E-Mail nicht nur mehr auf einem Mehrbenutzer-Computersystem üblich. Man verteilt vielmehr die Post an andere Rechner, so daß überregionale Kommunikation per E-Mail abgewickelt werden kann.

Weg eines normalen Briefes

Electronic Mail ist in vielen Bereichen analog zur normalen sogenannten gelben Post aufgebaut (von den Fans der Electronic Mail auch 'snail mail' = Schneckenpost genannt). Deshalb soll zuerst noch einmal der Lebensweg eines (normalen) Briefes aufgezeigt werden. Ein normaler Brief, z. B. ein Geschäftsbrief, besteht aus zwei Teilen. Zuerst kommt der Briefkopf mit den Adressen von Empfänger und Absender, dem Datum, einer Betreffzeile usw. Darauf folgt der eigentliche Inhalt des Briefes und eventuell ein paar Anlagen. Nachdem der Brief geschrieben wurde, wird er in einen Umschlag gesteckt und dieser Umschlag mit der Adresse des Empfängers und des Absenders versehen. Zusätzlich kann er spezielle Versand-Vermerke bekommen.
Anschließend wird der Brief in einen gelben Briefkasten der Deutschen Bundespost geworfen. Der Briefkasten wird geleert und die Briefe werden zu einem Postamt gebracht. Dort werden sie sortiert, und es wird entschieden, wohin der Brief als nächstes gebracht werden soll. Es kann sein, daß der Brief im gleichen Postamt bleibt, oder aber er wird von einem Postamt zum anderen weitergegeben, bis er bei dem Postamt landet, in dessen Zustellbezirk der Empfänger wohnt. Ein Postbote bekommt den Brief und liefert diesen in den Briefkasten des Empfängers aus bzw. übergibt ihn ei- genhändig an den Empfänger, wenn der Brief ein Einschreiben ist. Oder aber der Brief kommt in ein Postfach an diesem Postamt. Der Umschlag wird entfernt, der Brief wird gelesen, dann weggeworfen oder in einer Ablage aufbewahrt.

Weg eines elektronischen Briefes

Auf einem Computer wird mit einem Editor der Inhalt des Briefes in eine Datei geschrieben und mit Hilfe eines Mail- Programms mit Umschlag und Empfängeradresse versehen und in die Ausgangs-Mailbox gelegt. Den ersten Teil des Briefes nennt man 'Header', den Inhalt und die Anlagen 'Body Parts'. Der Umschlag heißt auf englisch 'Envelope' (letzterer hat hauptsächlich etwas mit dem Übertragungsprotokoll zu tun, der Normalanwender bekommt ihn nicht zu Gesicht). D. h. eine Mail, die an das Mail- System übergeben wird, besteht aus dem Envelope, dem Header und einem oder mehreren Body Parts. Die Postboten und Postämter nennt man 'Message Transfer Agents' (MTA), die zusammen das 'Message Transfer System' (MTS) bilden. Dieses MTS sorgt dafür, daß eine Mail von einem Rechner zum anderen gelangt.
Beim Ziel-MTA angelangt, wird die Mail in die Eingangs- Mailbox des Empfängers gelegt. Der Empfänger kann sich dann mit Hilfe eines Mail-Programms seine Mail aus dem Postfach in seine Eingangs-Mailbox holen und lesen. Wenn er sie danach nicht wegwirft, wird er sie in eine Ablage kopieren, die man 'Folder' nennt. Die Benutzeroberfäche zum Erstellen einer Mail, die Eingangs- und Ausgangs-Mail-Boxen, die Folder und eine eindeutige Mailadresse zusammen nennt man den 'Mail User Agent' (MUA) oder 'Mailer'.

Je nach verwendetem Mail-System gibt es meist noch weitere Funktionen, z. B. das Weiterleiten von Nachrichten (ggf. mit Kommentar), Versenden von Nachrichten an mehrere Empfänger, Benachrichtigung des Versenders einer Nachricht, daß Mail beim Empfänger angekommen und gelesen wurde. Übrigens, wenn Sie nur den Rechner, aber nicht die genaue Benutzerkennung wissen, dann schreiben Sie versuchsweise an den 'postmaster' des Systems. Der 'postmaster' ist die Mail-Adresse, bei der alle Fehlermeldungen, aber auch Anfragen von außen, z. B. nach Benutzerkennungen, anlaufen. Dahinter versteckt sich normalerweise der Systemverwalter.
Briefe, die an einen anderen Computer gehen, werden in der Regel sofort abgeschickt, so daß sie der Empfänger im Internet in kurzer Zeit erhält. Briefe, die innerhalb eines Systems verschickt werden, erreichen ihren Empfänger ein paar Sekunden nach dem Abschicken.
Rechner mit direkter TCP/IP-Verbindung tauschen ihre E-Mail direkt aus. Das Protokoll heißt SMTP (Simple Mail Transfer Protocol). Hier wird die E-Mail dem Zielrechner direkt zugestellt, mehr dazu im Kapitel 4. Die E-Mail kann nicht nur mit über das Netz transportiert werden, sondern auch z. B. über eine Modemverbindung über die normale Telefonleitung, weshalb wesentlich mehr Rechner via E-Mail erreichbar sind als im Internet existieren. Auch die Benutzer von Mailboxnetzen wie Compuserve, AOL oder T-Online sind per E-Mail erreichbar. Außerdem gibt es auch Erweiterungen der Mail-Software, die das Nachsenden der elektronischen Post an jeden Ort der Welt oder das Bereithalten zur Abholung ermöglichen. Es gibt sogar automatische Antwortprogramme (z. B. für Infodienste).

Was ist MIME?

Der erste Mail-RFC 822 legte in erster Linie den Standard für Kopfzeilen in der elektronischen Post fest. Dort wurde unterstellt, beim Inhalt des Briefes handele es sich um reinen ASCII-Text. Wer Dateien versenden wollte, die Zeichen enthielten, welche nicht unter den 128 Zeichen des ASCII-Alphabets vorkamen, mußte die Datei so codieren, daß sie nur noch aus ASCII-Zeichen bestand.

MIME (Multipurpose Internet Mail Extensions) fügt diesem Standard vier weitere Felder hinzu, die genauer den Inhalt des Briefes spezifizieren. Aus diesen Feldern kann das Post-Programm, so es diese berücksichtigt, entnehmen, welche anderen Programme aufzurufen sind, um z. B. ein Bild darzustellen. Das heißt nicht, daß die Daten im Brief nicht codiert würden, aber ein MIME-konformes Post-Programm bietet die Möglichkeit, alle Codierungsvorgänge zu automatisieren.

Das erste Feld, welches der MIME-Standard definiert, heißt MIME-Version:. Bislang gibt es nur die Version 1.0, so daß der Eintrag 1.0 dem Standard genügt. Mit der Verwendung dieses Feldes wird dem Post-Programm signalisiert, daß der Inhalt des Briefes mit dem MIME-Standard konform geht.

Kannte der RFC 822 zwei Teile eines Briefes, nämlich den Kopf und den Text, so können Briefe im MIME-Format aus mehreren Teilen bestehen. Die Zeile MIME-Version: 1.0 muß nur einmal im Kopf des Briefes auftauchen. Die anderen Felder, welche der MIME-Standard definiert, können öfter verwendet werden. Sie beschreiben dann jeweils die Einzelteile, aus denen der Brief besteht. Ein Beispiel:

...
MIME-Version: 1.0
Content-Type: MULTIPART/MIXED; BOUNDARY="8323328-2120168431-
824156555=:325"
                                          
--8323328-2120168431-824156555=:325
Content-Type: TEXT/PLAIN; charset=US-ASCII

Textnachricht....

--8323328-2120168431-824156555=:325
Content-Type: IMAGE/JPEG; name="teddy.jpg"
Content-Transfer-Encoding: BASE64
Content-ID: <Pine.LNX.3.91.960212212235.325B@localhost>
Content-Description: 
/9j/4AAQSkZJRgABAQAAAQABAAD//gBqICBJbXBvcnRlZCBmcm9tIE1JRkYg
aW1hZ2U6IFh0ZWRkeQoKQ1JFQVRPUjogWFYgVmVyc2lvbiAzLjAwICBSZXY6
[..]
se78SaxeW7Qz3zeW33tqqu7/AHtv3qyaKmOGox96MSeSIUUUVuUFFFFABRRR
RZAFFFFABRRRTAKKKKACiiigAooooA//2Q==
--8323328-2120168431-824156555=:325--
Mit dem Feld "Content-Type:" wird der Inhalt eines Briefes beschrieben. Im Kopf des Briefes legt das Feld "Content-Type:" den Aufbau des ganzen Briefs fest. Das Stichwort Multipart signalisiert, daß der Brief aus mehreren Teilen besteht. Der Untertyp von "Multipart" Mixed liefert den Hinweis, daß der Brief aus heterogenen Teilen besteht. Der erste Teil dieses Beispiels besteht denn auch aus Klartext, und der zweite Teil enthält ein Bild. Die einzelnen Teile des Briefes werden durch eine Zahlenkombination eingegrenzt, die im Kopf des Briefes im Feld "Boundary" festgelegt wurde. Diese Grenze (Boundary) ist nichts weiter als eine eindeutig identifizierbare Zeichenfolge, anhand derer die einzelnen Teile einer E-Mail unterschieden werden. Ein MIME-konformes Post-Programm sollte anhand dieser Informationen jeden einzelnen Teil adäquat darstellen können. Im Feld "Content-Type:" können sieben verschiedene Typen festgelegt werden, die jeweils bestimmte Untertypen zur genaueren Beschreibung des Inhalts umfassen:
  • text: plain, enriched, html
  • multipart: mixed, alternative, parallel, digest
  • message: rfc822, partial
  • image: jpeg, gif
  • audio: basic
  • video: mpeg
  • application: octet-stream, PostScript, active
Die Typen "image", äudio", "video" sprechen für sich selbst. Der Typ "message" sollte dann verwendet werden, wenn der Brief einen anderen Brief enthält. (z. B. einen weitergeleiteten Brief). Der Typ äpplication" ist für die Beschreibung ausführbarer Programme gedacht.

Dem Typ "text" kann noch der Parameter "charset:" beigefügt werden. Die Vorgabe der Programme lautet in der Regel "charset: us-ascii". Anstelle von üs-ascii" kann hier auch "iso-8859-1" eingetragen werden. Inzwischen werden auch vielfach E-Mails, markiert durch "text/html", wie HTML-Seiten codiert (beim Netscape-Browser ist sogar Klartext und HTML-Darstellung voreingestellt, man bekommt den Brief also doppelt).

Über kurz oder lang stößt wohl jeder Benutzer der elektronischen Post auf folgende Zeichen: =E4, =F6, =FC, =C4, =D6, =DC, =DF; im Klartext: ä, ö, ü, "A, "O, "U, ß. Für den Fall, daß der Brief Zeilen enthält, die länger als 76 Zeichen sind, erscheint ein "="-Zeichen am Ende der Zeile für den automatischen Zeilenumbruch. Verantwortlich für dieses Phänomen ist der Eintrag "quoted-printable" im Feld "Content-transfer-encoding". Mit der Vorgabe "quoted-printable" soll ein MIME-konformes Post-Programm alle Zeichen, deren Wert größer als 127 ist, hexadezimal mit einem vorangestellten Gleichheitszeichen darstellen, und es soll Zeilen, die länger als 76 Zeichen sind, umbrechen. Unter Umständen werden noch einige andere Zeichen codiert. Einige Post-Programme verwenden von vornherein "quoted-printable", obwohl eine andere Belegung des Feldes möglich ist; z. B.: "7bit", "8bit", "binary", "base64". Die ersten drei signalisieren allgemein, daß keine Codierung vorgenommen wurde. "7bit" signalisiert insbesondere, daß ein Brief reine ASCII-Zeichen enthält; "8bit", daß ein Brief über den ASCII-Zeichensatz hinausgeht, und "binary", daß es sich um 8-Bit-Zeichen handelt, wobei die Zeilenlänge über 1000 Zeichen hinausgehen kann. Ein mit "base64" codierte Teil des Briefes besteht nur noch aus Zeichen, die mit 7 Bit dargestellt werden können. Der Vorteil dieses Codierungsverfahrens besteht im Gegensatz zu anderen darin, daß diese Untermenge in vielen anderen Zeichensätzen ebenfalls enthalten ist. Damit wird eine fehlerfreiere Übermittlung erreicht, als mit anderen Verfahren.

Base64-Codierung

In Fällen, in denen binäre Dateien (Image, Audio) codiert werden müssen, wird die Encoding-Regel "Base64" verwendet, die Bitfolgen einer byteweise organisierten Datei in ein Alphabet aus 64 Textzeichen des ASCII-Zeichensatzes übersetzt. Da nur 64 Zeichen (lesbare) dargestellt werden, bedeutet dies, daß lediglich sechs Bit zu einem Zeichen zusammengefasst werden. Insgesamt wird die Datei in Gruppen zu 24 Bit (drei Bytes) strukturiert. Das Ergebnis für jede dieser 24-Bit-Gruppen ist eine Folge aus vier ASCII-Zeichen. Die Übersetzung erfolgt seriell nach der Regel einer Code-Tabelle: Zunächst werden die ersten sechs Bit in ein ASCII-Zeichen übersetzt. Das bedeutet, daß vom ersten byte noch zwei Bit uncodiert sind. Diese beiden Bit des ersten bytes sowie die ersten vier Bit des folgenden bytes werden in ein Zeichen übersetzt und so weiter. Das Prinzip ist denkbar einfach, allerdings hat dieses Verfahren, das mittlerweile etabliert ist, einen kleinen Schönheitsfehler, denn die Nachrichten werden in codierter Form bedeutend länger.

WertCodeWertCodeWertCodeWertCode
0A17R34i51z
1B18S35j520
2C19T36k531
3D20U37l542
4E21V38m553
5F22W39n564
6G23X40o575
7H24Y41p586
8I25Z42q597
9J26a43r608
10K27b44s619
11L28c45t62+
12M29d46u63/
13N30e47v  
14O31f48w  
15P32g49x  
16Q33h50y  
Padding:       =Quelle: RFC 2045

Der Begriff "Text" ist nicht damit gleichzusetzen, daß das Ergebnis der Codierung auf den ersten Blick lesbar ist. Die Buchstaben, Ziffern und die Zeichen "+", "/" und "=" dienen lediglich als Symbole für die entsprechenden Bitfolgen. Die Tabelle zeigt die Übersetzung gemäß "Base64", wobei die Angabe der Werte in den zu übersetzenden Bitfolgen (jeweils sechs Bit) in dezimaler Schreibweise erfolgt. Das Zeichen "=" hat eine besondere Bedeutung, denn es dient als Füllzeichen (Padding), wenn die Menge der zu übertragenden Zeichen aus den Quelldaten kein Vielfaches von vier darstellt. Die Übertragung dieser Zeichen erfolgt in Textzeilen, die maximal 76 Zeichen beinhalten. Alle nicht im Base64-Alphabet definierten Zeichen einschließlich Zeilenumbrüchen werden bei der Decodierung ignoriert.

Was bei E-Mail schiefgehen kann

Natürlich können auch bei E-Mail Probleme auftreten. Schließt man allerdings aus, daß das eigene System nicht korrekt aufgesetzt ist, der POP nicht korrekt arbeitet oder der Name-Server nicht funktioniert, so verbleiben folgende häufigeren Fehlerquellen:
  • Die Adresse ist falsch.
    Dabei kann entweder der Adressat selbst nicht existieren oder falsch geschrieben sein oder Sie haben einen Fehler bei der Angabe der Domain-Angabe (des Mail-Servers) gemacht. Nach einiger Zeit kommt dann die Mail mit etwa folgender Nachricht zurück:
       From: Mail delivery Subsystem
       Subject: Returned mail: Host unknown
       (Name server: ns.e-technik.fh-muenchen.de: host not found) 
    
    oder
       From: Mail delivery Subsystem
       Subject: Returned mail: User unknown 
    
    überprüfen Sie nochmals die Adreßangabe. Haben Sie bei einer Mail-Adresse in einem anderen Netzwerk die ?ersetzungskonventionen richtig beachtet?
  • Der Mail-Server ist nicht erreichbar.
    Versuchen Sie es später nochmals. Haben Sie weiterhin Probleme, sollten Sie sich mit Ihren Provider (telefonisch oder per FAX) in Verbindung setzen.
  • Der Name-Server kann den Namen des Mail-Servers nicht auflösen.
    Auch hier sollten sie es später nochmals versuchen.
  • Die Mail ist beim Empfänger verstümmelt oder kann nicht gelesen werden.
    Wahrscheinlich haben Sie eine unpassende Codierung verwendet oder der Empfänger kann nur reinen ASCII-Text im Mail-Programm anzeigen.
  • Sie erhalten eine Mail mit Anhängen, können diese jedoch nicht anzeigen oder bearbeiten.
    Erkundigen Sie sich beim Absender, in welchem Format der Anhang sein soll. Hier ist Abstimmung erforderlich.
  • Sie finden eine Mail in Ihrem Posteingang, die zo umfangreich ist.
    Die Mail ist so groß, daß die ?ertragung gar nicht möglich ist oder zu lange dauert und damit zu teuer wird. Sie können die Mail löschen.
  • Sie erhalten Mail mit einem großen, eigenartigen Textstück darin.
    Wahrscheinlich handelt es sich um mittels uuencode codierte Binärdaten im Mail-Anhang, der etwa wie folgt aussieht.

    begin 600 DOKUMENT.DOC
    M(&=R;]]E;B!3>7-T96UE;B!J961O8V@@875C:"!I;2!G;&5I8VAE;B!L;VMA
    M;&5N($YE='H@;V1E<B!S;V=A<B!A=68@9&5M(&=L96EC:&5N(%)E8VAN97(@
    M=VEE(&1E<B!#;&EE;G0@87)B96ET96XN($%U9B!E:6YE;2!296-H;F5R(&OV
    M;FYE;B!M96AR97)E(%-E<G9E<BU0<F]G<F%M;64@;&%U9F5N("T@96EN(%)E
    M8VAN97(@:V%N;B!D86UI="!M96AR97)E(%-E<G9E<BU$:65N<W1E('IU<B!6
    
    .....
    
     
    end
    

    Das Mailprogramm sollte mittels uuencode codierte Mail automatisch und ohne Zutun des Benutzers decodieren können. Ähnlich gelagert ist das Problem, wenn die Datei nach 'base64' codiert ist. Es handelt sich dabei um eine MIME-codierte Anlage. MIME-Mails sind typischerweise an den eingestreuten Steuerzeilen (Content-Type: application/octett-stream) und Trennzeilen (--==================_8769453AF34==_) erkennbar.

Was bedeutet "AW:" im Header?

Das bedeutet, daß Ihr Mailpartner Microsoft Outlook verwendet. Dort wird unter der Prämisse "Internationalisierung" alles gnadenlos in die Sprache des jeweiligen Landes übersetzt. So wird aus "Re:" für "reply" nun "AW:" für "Antwort". Dabei haben die Microsoftis aber übersehen, dß "Re:" im entprechenden RFC-Dokument festgelegt wurde, also gar nicht übersetzt werden darf (das hat aber Microsoft noch nie gestört, in einer Windows-3.1-Version wurde sogar die Druckersprache Postscript mal eingedeutscht). Um lange "Re: AW: Re: AW: ..."-Ketten zu vermeiden, kann man Outlook auch wieder RFC-konform machen.
Gehen Sie dazu ins Menü "Extras, Optionen". Auf der Rgistrierkarte "E-Mail-Format" klicken Sie auf "Internationale Optionen" und aktivieren Sie "Nachrichtenkennzeichnungen in Englisch" und "Kopfzeilen von Antworten und Weiterleitungen in Englisch". Damit ist Outlook RFC-fest. Alle anderen Outlook-Funktionen und -Menüs bleiben natürlich in Deutsch. Bei Outlook Express finden Sie die Optionen unter "Extras. Optionen" und dann in der Registrierkarte "Senden" unter "Internationale Einstellungen". Nach diesen Änderungen ist Outlook nicht nur mit allen Mailprogrammen kompatibel, die sich an die Internet-Standards halten, sondern auch Sie selbst outen sich als Fachmann in Sachen E-Mail.

Wer mehr über die Header in E-Mails wissen will, findet hier ein Mailheader-FAQ.

2.2 News - öffentliche Diskussionsforen

News ist ein weltweites elektronisches 'schwarzes Brett' zur Diskussion von Themen, zum Austausch und zur Beschaffung von Informationen und zur Verteilung von Daten. Dieses Kommunikationsmedium ist neben Mailing-Listen das am weitesten verbreitete System für den Austausch von öffentlichen Informationen. News ist nach den verschiedensten Interessengebieten hierarchisch geordnet. Dabei sind weltweit Tausende Themenbereiche (die sogenannten News-Gruppen) verfügbar, die von der Diskussion bestimmter Rechnertypen über die Bekanntmachung von Konferenzen bis hin zur Verteilung von Kochrezepten reichen.
News baut auf NNTP (Network News Transfer Protocol) auf. Dazu benötigt ein Benutzer eine bestimmte Schnittstelle, den sogenannten News-Reader. Dies ist ein Programm, das Verbindung mit einem News-Server aufnimmt, sich dort die einzelnen Beiträge holt und es erlaubt, diese zu lesen und selbst Beiträge zu schreiben. News-Server sind für bestimmte Regionen zentrale Rechner, welche die News-Datenbank halten, die in regelmäßigen Zeitabständen aktualisiert wird und welche für die Verbreitung von Artikeln sorgen. Sie können natürlich auch einen eigenen News-Server betreiben, der sich seine Daten wiederum von einen anderen News-Server holt. Es besteht dann auch die Möglichkeit, lokale Newsgruppen (d. h. firmeninterne Diskussionsforen) einzurichten.

In News können die Beiträge von allen Benutzern gelesen und in der überwiegenden Zahl der Gruppen können auch eigene Artikel oder Antworten veröffentlicht werden. Dies eröffnet etliche neue Möglichkeiten. Man kann oft feststellen, daß Probleme (und deren Lösungen) anderer News-Benutzer auch für einen selbst von Interesse sind, und es bestehen bei eigenen Problemen gute Aussichten, daß einer der vielen Experten (die sogenannten 'Gurus' oder 'Wizards') relativ schnell weiterhelfen kann. Umgekehrt sollte man sich die Zeit nehmen, Fragen anderer News-Nutzer zu beantworten, denn das System funktioniert nur 'auf Gegenseitigkeit'. News ist deshalb auf keinen Fall nur eine kurzweilige Unterhaltung für Computer-Begeisterte, sondern eine ernst zu nehmende Informationsquelle und eine neue Möglichkeit, die wissenschaftliche Zusammenarbeit auf vielen Gebieten zu unterstützen.
Darüber hinaus eröffnet News vollkommen neue Möglichkeiten der Publikation und der schnellen Diskussion innerhalb eines internationalen, offenen Teilnehmerkreises. Dies wird bisher zwar nur in speziellen Fachrichtungen genutzt, wird in Zukunft jedoch bestimmt auf breiteres Interesse stoßen. Wer sich schon gleich zu Beginn auf das Lesen weniger ausgesuchter Newsgruppen beschränkt, kann von Anfang an News als wertvolle Informationsquelle mit minimalem Zeitaufwand kennenlernen. Damit Sie sich nicht gleich als Anfänger outen, zunächst ein paar Fachbegriffe und weiter unten einige Verhaltensregeln:

Einige Begriffe (nach ihrer Wichtigkeit aufgeführt):

  • Newsgroup:
    Die News-Gruppe ist ein Teilbereich von News, der einem bestimmten Thema gewidmet ist. In anderen Netzen heißen sie z. B. 'schwarze Bretter' oder 'Diskussionsforen'.

  • News hierarchy:
    News-Gruppen mit verwandten Themen werden zu Familien zusammengefaßt, wodurch eine hierarchische Strukturierung der Gruppen entsteht.

  • News Article:
    Die von den Benutzern verfaßten Beiträge zu einer News- Gruppe werden als News-Artikel bezeichnet.

  • Newsreader:
    Benutzerschnittstelle für News, mit der i. a. Artikel gelesen, verfaßt, in einer Datei abgespeichert oder an einen anderen Benutzer per E-Mail geschickt werden können.

  • Posten, Posting:
    Das Veröffentlichen eines News-Artikels wird als 'Posten' bezeichnet. Entsprechend wird ein News-Artikel oft auch 'Posting' genannt.

  • Followup:
    Spezieller News-Artikel, der sich auf einen anderen Artikel bezieht. Der Followup übernimmt dabei i. a. den öberschrift-Header des anderen Artikels und setzt dabei noch 'Re:' voran.
    Historisch bedingt ordnet man die News-Hierarchien nach den folgenden Kriterien:

  • Traditionelle (ursprüngliche), weltweit verbreitete News- Hierarchien. Diese Hierarchien gab es schon in der Anfangszeit, als News nur in der USA verfügbar war.

  • Die restlichen (alternativen) Hierarchien, die weltweit gelesen werden können. Sie wurden im wesentlichen zu der Zeit gegründet, ab der News über die USA hinaus verbreitet wurde.

  • Regionale Gruppen sind Gruppen, die i. a. nur von den News-Servern einer bestimmten Region geführt werden. 'Regional' kann sich dabei auf einen Kontinent, ein Land, ein Bundesland, eine Stadt, eine Institution, etc. beziehen.

  • Lokale Gruppen sind nur für einen News-Server selbst oder für seine unmittelbare Nachbarschaft von Bedeutung. Zwischen 'lokal' und 'regional' gibt es i. a. keine scharfe Abgrenzung.

    Die traditionellen News-Hierarchien

  • comp:
    Themen, die mit dem Computer in Beruf, Wissenschaft und Forschung zu tun haben. Häufig existieren für Hardware und Software getrennte Gruppen.

  • misc:
    In dieser Hierarchie werden Gruppen zusammengefaßt, die nicht in eine der anderen Kategorien passen oder die mehrere Gebiete streifen.

  • news:
    Gruppen, die sich mit News selbst beschäftigen (Software, Administration, etc.).

  • rec:
    Gruppen, für Hobbys und Freizeit.

  • sci:
    Allgemeine wissenschaftliche Themen (z. B. Physik, Medizin, Philosophie).

  • soc:
    Gruppen mit sozialen und kulturellen Themen.

  • talk:
    Debattier-Gruppen.

  • biz:
    Kommerzielles.

  • alt:
    Die alternativen News-Hierarchien

Die Newsgruppen sind hierarchisch geordnet. Unterhalb der oben angegebenen Hierarchien wird weiter verzweigt, wobei die einzelnen Hierarchiestufen durch Punkte getrennt werden. Bei landesspezifischen Gruppen wird das Länderkürzel vorangestellt, z. B. für deutschsprachige Gruppen 'de'; die deutsche Entsprechung von 'comp' ist somit 'de.comp'. Dann kann man weiter unterteilen, z. B. für die Duskussion über Computer-Betriebssysteme (operating systems) 'de.comp.os' Nachdem es verschiedene Betriebssysteme gibt, entstehen dann Gruppen wie 'de.comp.os.linux', 'de.comp.os.minix', 'de.comp.os.os2', 'de.comp.os.unix', usw. Eine Unterteilung wird oft dann vorgenommen, wenn die Anzahl der täglichen Artikel in einer Newsgruppe zunimmt und die Gruppe unübersichtlich wird. Die Newsgruppenhierarchie 'de.*' ist übrigens eine internationale deutschsprachige Hierachie im Usenet. Es ist nicht die Deutschlandhierachie, eine Hierachie für Deutschland gibt es nicht.

Einige Newsgruppen enthalten auch Binärdaten (Programme, Bilder, Sound-Dateien etc.). Sie sind durch den Begriff 'binaries' im Namen der Gruppe erkennbar (z. B. comp.binaries.msdos). Da nach wie vor 7-Bit-ASCII als kleinster gemeinsamer Standard für News und Mail gilt, lassen sich Binärdateien nicht ohne weiteres posten. Abhilfe schaffen hier die Programme UUENCODE und UUDECODE, mit deren Hilfe sich binäre Daten auf den Bereich der druckbaren ASCII-Zeichen (Großbuchstaben, Ziffern und Sonderzeichen) abbilden lassen. Es werden also Bytes in 6-Bit-Worten codiert und in Zeilen umbrochen. Die mit UUENCODE erzeugte Datei ist nun zwar größer als die Ursprungsdatei, sie läßt sich aber problemlos per News (oder Mail) verbreiten.

Das wachsende Newsaufkommen hat aber auch zu unschönen Erscheinungen geführt. Die Gruppen sind zwar thematisch untergliedert, aber man findet trotzdem immer mehr uninteressante Beiträge, endlose Streitereien um des Kaisers Bart oder Artikel, die überhaupt nicht zum Thema passen. Der Anteil an solchen nutzlosen Beiträgen wird oft in Analogie zur Störung beim Rundfunkempfang als 'Rauschen' bezeichnet. Das hat bei ständigen Newsbenutzern zu einer Absenkung der Toleranzschwelle geführt. Man muß bedenken, daß nicht nur das Lesen selbst Zeit kostet (selbst wenn man sich auf Überschriften beschränkt), sondern auch der Datentransport der News bis zum Rechner des Lesers in der Regel Telefonkosten verursacht. Wenn dann nur Unsinn zu lesen ist, reagieren die News-Benutzer irgendwann sauer. Insbesondere Nachrichten meist werblichen Inhalts, die in zahlreichen Diskussionsgruppen veröffentlicht werden und in keinem dieser Foren eigentlich einen Platz haben, lösen heftige Raktionen (sogenannte 'flames') aus. Solche Massenveröffentlichungen haben den passenden Namen 'spam' (Sülze) erhalten. Das Rauschproblem hängt aber auch damit zusammen, daß viele Provider ihre Benutzer ohne jede Anleitung auf das Netz loslassen.

Zum Schluß des Abschnitts möchte ich noch auf Newsgruppen hinweisen, die Informationen zu den verschiedensten Themen enthalten. Die wichtigsten sind news.answers und de.newusers. Dort finden Sie die sogenannten 'FAQ's (Frequently Asked Questions and Answers), in denen Antwort auf viele Fragen gegeben wird. Bevor man also eine Frage in den News losläßt, erst einmal in den FAQs stöbern. Sonst gibt es als Antwort auf eine Frage höchstens ein 'RTFM' (Read The Fucking Manual = Lies das Sch...-Handbuch) oder 'RTFAQ'. In Kapitel 4 wird das Thema News noch weiter vertieft. Ein Begriff sollte aber gleich noch geklärt werden, 'Usenet' User Network). News-Artikel und auch Mail sind nicht an das Internet gebunden, sondern können auch auf anderen Wegen, z. B. per Modem-Transfer, ausgetauscht werden (bei den News ist das durch die gewaltigen Datenmengen praktisch nur eingeschränkt möglich). Der Begriff 'Usenet' ist jedoch schwer zu fassen. Deshalb der Versuch einer Unterscheidung: Ein Internet ist eine Menge von Rechnern, die sich via IP ständig (!) untereinander verständigen können. Damit ist ein Internet ein Netz von sich technisch verstehenden Systemen. 'Ständig' ist auf definierte Zeiträume einschränkbar (für PPP und SLIP), heißt aber generell: jederzeit bis auf technische Pannen. Usenet-Rechner müssen darüberhinaus auch E-Mail senden und empfangen können. Dazu noch ein Zitat von Ed Krol aus seinem Buch 'Die Welt des Internet': 'USENET ist eines der am häufigsten mißverstandenen Konzepte. Es ist kein Rechnernetz. Es hängt nicht vom Internet ab. Es ist keine Software. Es ist eine Sammlung von Regeln, wie Newsgruppen weitergeleitet und verwaltet werden. Es ist außerdem ein Haufen Freiwilliger, die diese Regeln anwenden und respektieren. [...]. USENET besteht aus sieben gut verwalteten Newsgruppen-Hierarchien.'

2.3 Telnet

Zweck des Telnet-Programms ist, von einem beliebigen TCP/IP-fähigen Terminal einen interaktiven Zugang zu anderen Computern zu schaffen. Telnet = 'Teletype Network', zu deutsch etwa: 'Fernschreiber-Netzwerk'. Diese Programme gehen im einfachsten Fall von einem Text-Terminal aus und verwenden oft die VT100/VT200-Emulation.

Deshalb kann es bei Programmen zu Problemen kommen, die bildschirmorientiert arbeiten (z. B. Editoren). Für die Steuerung der Ausgabe, beispielsweise die Positionierung der Schreibmarke oder die Einstellung der Bildschirmfarbe, werden Steuerzeichen gesendet, welche die Terminal-Emulation 'verstehen' muß. Man hat also den gleichen Funktionsumfang wie ein lokal an dem jeweiligen Rechner angeschlossenes Terminal - egal wie weit der Rechner entfernt ist. Ist der Verbindungsaufbau erfolgreich, erscheint der Login-Prompt des fernen Rechners. Man kann sich prinzipiell an jedem Rechner im Internet einloggen - vorausgesetzt, man besitzt dort eine Zugangsberechtigung. Viele Rechner bieten jedoch auch einen Gastzugang. Es werden aber auch spezielle Informationsdienste angeboten. Um beispielsweise Whois-Anfragen abzusetzen, kann Telnet verwendet werden. Auch bieten manche Rechner über Telnet Zugang zu Multiuser-Spielen.

Primär dient Telnet aber dem Shell-Zugang auf einem fernen Rechner. Bei Shell-Zugängen verwenden Sie lediglich die Tastatur Ihres Computers, den "Rest" Ihres Computers brauchen Sie eigentlich gar nicht (so wie damals mit DOS beim PC). Sobald Sie die Verbindung zum fernen Rechner aufgebaut haben, können Sie all das auf dem Rechner machen, was man auch lokal an der Konsole machen kann. Je nach Betriebssystem (meist ist es UNIX) müssen Sie dessen Befehle lernen. Für den 'Normalnutzer' spielt Telnet eine untergeordnete Rolle, dagegen kann ein Administrator alle ihm unterstehenden Computer bedienen, ohne seinen Arbeitsplatz verlassen zu müssen.

2.4 FTP (File Transfer Protocol)

Nehmen wir einmal an, Sie hätten noch immer kein vernünftiges Programm für die Nachbearbeitung Ihrer gescannten Bilder. Nachdem Sie in einer Newsgroup erkundigt haben, welches Programm für Windows das beste sei und nachdem man Ihnen einstimmig 'Paintshop Pro' empfohlen hat, starten Sie das FTP-Programm um Paintshop per FTP (File Transfer Protocol) von einem fernen Rechner zu holen. Damit es nicht noch länger dauert als ohnehin schon, kommt das Programm in Form einer einzigen Datei; alle Dateien des Programmpakets sind in einem sogenannten 'Archiv' zusammengepackt und die Daten komprimiert. Im Unterschied zu einer Telnet-Verbindung, die textorientiert ist, können mittels FTP beliebige Daten ausgetauscht werden (Bilder, Programme, Sounds, usw.).

Es gilt übrigens als ausgesprochen unhöflich, beispielsweise von München aus ein Programm in Hawaii abzuholen, wenn man es genausogut von Stuttgart bekommen kann (die Leitungen ins Ausland sind noch nicht so zahlreich, und man sollte deren Belastung möglichst gering halten). Benutzen Sie ausländische Server auch bitte zu Zeiten, wo diese wenig gebraucht werden, also ausserhalb der 'Bürostunden'. Meistens sieht man es der Internet-Adresse an, wo der entsprechende Server steht. Die wichtigsten Kennungen sind 'com', 'edu', 'gov', 'mil', 'net' und 'org' (siehe auch Kapitel 1). Server mit diesen Kennungen sind in der Regel in den USA stationiert (Zeitzone = Mitteleuropäische Zeit minus 6 bis 9 Stunden / Hawaii minus 12 Stunden), obwohl 'com'- und 'net'-Rechner überall auf der Welt stehen können. Andere Server erkennt man an der Länderkennung, z. B:

  • at = Österreich
  • de = Deutschland
  • ch = Schweiz
  • se = Schweden
  • fr = Frankreich
  • uk = England
  • au = Australien (MEZ plus 8 Stunden)
  • ca = Kanada (MEZ minus 6 bis 9 Stunden)
  • jp = Japan (MEZ plus 8 Stunden)

Der Verbindungsaufbau erfolgt wie bei Telnet, indem man dem FTP-Programm den gewünschten Zielrechner angibt. Bei erfolgreicher Verbindung kommt vom fernen Rechner wieder ein Login-Prompt. FTP funktioniert aber auch, wenn man auf dem fernen Rechner keine Benutzerberechtigung hat, denn viele Rechner bieten große Dateibereiche über sogenannten 'anonymen' FTP. Man gibt in diesem Fall als Benutzernamen 'ftp' (manchmal auch 'anonymous') ein und als Paßwort die eigene Mailadresse. Danach kann man sich im öffentlichen Dateibereich tummeln. Dazu braucht man nicht viele Kommandos.

  • Mit 'cd <Verzeichnis>' wechseln Sie in das entsprechnde Unterverzeichnis.
  • 'pwd' zeigt Ihnen das aktuelle Verzeichnis an.
  • Die Befehle 'ls' oder 'dir' ermöglichen die Anzeige des Verzeichnisinhaltes.
  • Mit 'get <Dateiname>' holt man sich die gewünschte Datei und
  • mit 'put <Dateiname>' kann man lokale Dateien zum fernen Rechner übertragen.
  • Mit 'quit'beendet man die FTP-Sitzung.
  • 'help' liefert eine knappe Hilfestellung.

Noch etwas ganz Wichtiges: Das FTP-Protokoll kennt zwei Übertragungsmodi, den Transfer von Texten und von Binärdateien. Um die Daten auch korrekt zu bekommen, sollte man auf jeden Fall mit dem Kommando 'binary' in den Binärmodus schalten (Texte werden da natürlich auch korrekt angeliefert). Es gibt inzwischen, speziell bei Windows, auch etliche grafisch orientierte FTP-Clients, die sich automatisch das Inhaltsverzeichnis des fernen Rechners holen und dieses zusammen mit dem lokalen Verzeichnis wie in einem Dateimanager anzeigen. Hier kann man dann die Dateien per Mausklick hin- und hertransportieren.

Man kann eine zusammengefaßte Liste Hunderter von Anonymous-FTP-Sites erhalten, indem man eine E-Mail-Nachricht an mail-server@rtfm.mit.edu verschickt mit diesen Zeilen im Text der Nachricht:

send usenet/news.answers/ftp-list/sitelist/part1
send usenet/news.answers/ftp-list/sitelist/part2
	...
send usenet/news.answers/ftp-list/sitelist/part13
send usenet/news.answers/ftp-list/sitelist/part18
Dann erhält man per E-Mail 18 Dateien, die die "FTP Site List" enthalten. Jede dieser Dateien ist etwa 60 KB groß, die komplette Liste umfaßt also insgesamt mehr als 1 MB!
Nachdem Sie die Site-Liste erhalten haben, finden Sie etliche Einträge wie den folgenden - Site-Name, Ort und Infos über Dateien, die dort liegen, werden aufgeführt. Zum Beispiel:
Site:       oak.oakland.edu
Country:    USA
Organ:      Oakland University, Rochester, Michigan
System:     Unix
Comment:    Primary Simtel Software Repository Mirror
Files:      BBS lists; ham radio; TCP/IP; Mac; 
            mode protocol info; MS-DOS; MS-Windows; 
            PC Blue; PostScript; Simtel-20; Unix

2.5 Archie

Bei per FTP angebotenen Daten kann man schnell den Überblick verlieren. Wenn man den Namen einer Datei (oder zumindest einen Teil davon) kennt, kann man nachfragen, auf welchem Rechner das Gewünschte zu finden ist. Bestimmte Rechner (Archie-Server) fragen regelmäßig alle Rechner der FTP-Anbieter ab und sammeln die Daten. Natürlich tauschen die Server auch untereinander diese Informationen aus, so daß jeder Archie-Server die gleiche Information bereithält. Die von Archie gesammelten Daten können dann per Telnet oder über ein spezielles Archie-Programm abgefragt werden. Archie liefert dann den/die Rechner, auf dem/denen die gesuchte Datei gespeichert ist und den Pfad zu dieser Datei. Bei der Suche sind auch diverse Optionen möglich. So kann der Suchbereich auf bestimmte FTP-Server (z. B. nur in Deutschland) eingeschränkt werden oder man kann, wenn man den Dateinamen nicht genau kennt, nach einem Teil des Namens suchen.

2.6 Gopher

Wir haben gesehen, daß man mit dem Archie-Programm nach Dateinamen der FTP-Server im Internet suchen kann. Das ist natürlich ein sehr beschränktes Informationsangebot. Was ist mit Datenbankabfrage, Bibliotheksrecherchen, und ähnlichen Informationsangeboten? Da hilft 'Gopher', die Taschenratte.
Gopher ermöglicht den Aufbau eines verteilten Informationssystems mit einem einheitlichen Zugang zu einer Vielzahl von anderen Diensten im Netz (z. B. Archie, WAIS, FTP, etc.), sowie Gateways zu weiteren Diensten (z. B. Online Bibliotheken, Datenbanken, etc.). Gopher arbeitet menügeführt, d. h. man benutzt auf seinem eigenen Rechner ein Programm, den Gopher-Client, der dann Informationen von anderen Rechnern, auf denen ein Gopher-Server läuft, abfragen kann. Der Benutzer sieht dabei eine Baumstruktur von Objekten, den sogenannten 'Gopherspace', durch die er sich bewegt (analog zu Files und Directories), kann aber zum Teil auch gezielt nach Stichworten suchen. Dabei können sich die Objekte (Informationen und Services) weltweit auf beliebige Rechner verteilen, ohne daß der Benutzer etwas davon merken muß.
Wenn man den Gopher-Client startet, stellt dieser eine Verbindung zu seinem voreingestellten Server her, und fordert von diesem eine Liste der verfügbaren Objekte im obersten Directory samt deren Beschreibung an. Danach wird die Verbindung zum Server wieder unterbrochen. Dem Benutzer wird die Liste gezeigt und er kann das Gewünschte mit Cursor und Returntaste (oder mit der Maus, je nach Art des Client-Programms) auswählen.
Der Gopher-Client greift dann auf dieses Objekt zu, wobei er die vom Server erhaltene Beschreibung verwendet, aus der er erfährt, was das Objekt ist und wo es zu finden ist. Der Clou des Gophersystems ist, daß dieses 'wo' auch den Namen des Servers enthält, der das Objekt zur Verfügung stellt, und zu dem der Client eine Verbindung aufbauen muß.
Damit sind beliebige Verweise (Links) zwischen Servern möglich und für den Benutzer transparent, da dieser nur die Baumstruktur sieht, in der er sich bewegt. Der Gopher- Client speichert den Weg im Gopherspace, und kehrt bei Verlassen einer Ebene in die vorherige zurück.
Weiter bietet der Gopher-Client die Möglichkeit, Objekte mit sogenannten 'Bookmarks' zu kennzeichnen. Dabei wird die Beschreibung des Objektes unter einem frei wählbaren Titel in einer Datei lokal gespeichert. In einer späteren Session kann man das Objekt so problemlos wiederfinden. Man läßt sich von seinem Gopher-Client die Liste der Bookmarks zeigen, wählt das Gewünschte aus, und der Client weiß, wo er zu suchen hat.
Was für Objekte gibt es hauptsächlich im Gopherspace ?
  • Directories (Verzeichnisse):
    Sie sind zu erkennen an einem '/' am Ende, in einem Directory liegen weitere Objekte bzw. deren Beschreibungen. Wählt man ein Directory an, holt der Client dieses Inhaltsverzeichnis vom Server und zeigt es als nächste Liste an. Wieder kann man auswählen (man begibt sich in dieses Directory hinein)... Wenn es sich bei dem Objekt um eine Datei auf einem FTP-Server handelt, wird dabei das Gopher-FTP-Gateway benutzt. Der Benutzer merkt davon nichts.
  • Files (Dateien):
    Dies sind in der Regel Textdateien. Sie sind zu erkennen an einem '.' am Ende ihres Namens (Binärdateien sind zusätzlich mit einem '<bin>' gekennzeichnet). Wird eine Datei angewählt, holt der Client sie vom Server und stellt sie mit einen Anzeigeprogramm für Texte (Pager) dar. Die Datei kann aber auch auf Platte gespeichert werden (ein binäres File wird nicht dargestellt, sondern kann nur gespeichert werden). Auch hier gibt es das Gopher-FT-Gateway.
  • Telnet-Verbindungen:
    Sie ist zu erkennen am '<TEL>' dahinter. Bei der Wahl eines solchen Punktes wird vom Rechner des Benutzers aus eine Telnet-Verbindung zu dem Rechner hergestellt, der den genannten Service anbietet. Damit kann z. B. auf Informations-Anbieter zugegriffen werden, die zwar keinen Gopher-Server betreiben, aber per Telnet zugänglich sind.
  • Search Machines (Suchmaschinen):
    Sie sind zu erkennen an einem '<?>' dahinter. Dies sind spezielle Programme, die bei Anwahl vom Benutzer einen Suchstring abfragen, und dann eine Volltext-Datenbank danach durchsuchen. Wenn möglich, wird das Ergebnis der Suche als Liste von Objekten angezeigt. Damit kann z. B. die Datenbasis des FTP-Verzeichnisses ARCHIE nach Strings durchsucht werden, die gefundenen Einträge werden wieder als Liste von Dateien angezeigt. Diese Dateien können dann wieder mit dem Cursor angefordert werden - also sehr viel komfortabler als mit dem Archie-Programm und anschließenden FTP-Transfer. Genauso könnte eine Datenbasis der RFCs ('Request For Comments', die Standardisierungsdokumente im Internet) nach einem bestimmten Stichwort durchsucht werden.
In letzter Zeit sind viele Gopher-Dienste in WWW-Dienste umgewandelt worden und daher verliert Gopher mehr und mehr an Bedeutung.

2.7 IRC (Internet Relay Chat)

Nehmen wir nochmals das Beispiel mit dem Bildbearbeitungsprogramm. Sie möchten wissen, welches Programm sich für Windows am besten eignet. Diesmal plazieren Sie Ihre Anfrage jedoch nicht in einer Newsgroup, wo Sie auf eine Antwort warten müssen. Diesmal wollen Sie Ihre Frage sofort beantwortet haben. Dazu verwenden Sie den 'Internet Relay Chat' (to chat = schwatzen): Sie starten Ihr IRC-Programm und schalten auf den gewünschten Kanal (Channel), in Ihrem Fall am besten 'Windows'. Das Programm wird Ihnen anzeigen, wer noch alles auf diesem Kanal aktiv ist. An dieser Stelle ist ein Absatz zum Begriff 'Kanal' nötig.
Erst die Kanäle ermöglichen vernünftige Gespräche. Stellen Sie sich vor, einige tausend Teilnehmer schwatzen durcheinander. Kein Mensch könnte dem mehr folgen. Die Kanäle erlauben auch Grüppchen weniger Teilnehmer. Außerdem kann man bei vielen Kanälen schon am Namen erkennen, worüber diskutiert wird. Letztendlich kann jeder IRC-Teilnehmer auch einen eigenen Kanal eröffnen und nur bestimmte Teilnehmer zu einem privaten Schwätzchen bitten. Das IRC-Programm läßt Sie nämlich beliebige Kanäle öffnen, auch solche, die noch nicht existieren. Sie wären dann einfach der erste auf diesem Kanal und hätten automatisch Operator-Status.
Normalerweise meldet sich jeder mit einem Spitznamen ('Nickname') an. Sie sollten vorher das Handbuch zu Ihrem IRC-Programm studieren. Sonst wird man Sie bald als 'Newbie' entlarven und auch entsprechend behandeln. Allerdings gibt es im Internet auch viele nette Menschen, die sich gerade gegenüber einem Newbie besonders hilfsbereit zeigen. Eventuell können Sie einen Bekannten bitten, mit Ihnen den ersten 'Chat' auf einem privaten Kanal zu führen. Sie können dann auch die einzelnen Kommandos in Ruhe ausprobieren.
Nach Verbindungsaufnahme begrüßt Sie der Server mit einigen grundsätzlichen Informationen und Neuigkeiten. IRC wird hauptsächlich über eine textbasierte Eingabe gesteuert, was für Online-Gespräche am praktikabelsten ist. Die wichtigsten Befehle sind schnell gelernt, und man kann mit den meisten IRC-Clienten auch zusätzlich Alias-Namen, also Abkürzungen, für die Befehle definieren.

Grundsätzlich beginnen alle Befehle mit einem Schrägstrich. Um einen Kanal auszuwählen, rufen Sie entweder mit '/list' eine Liste der verfügbaren Kanäle auf oder wechseln per '/join #Kanalname' direkt in einen Kanal. Nehmen wir an, Sie wollen in den Kanal #irchelp gelangen. Dazu müssen Sie '/join #irchelp' eingeben. Nun befinden Sie sich in einem Kanal, in dem Sie Hilfe zu Problemen mit IRC finden. Wollen Sie nun etwas zum Gespräch beitragen, müssen Sie Ihren Text lediglich eintippen und mit der Return-Taste abschließen, und schon erscheint die Zeile bei den anderen Teilnehmern des Kanals. Persönliche Nachrichten an einen Teilnehmer sendet man mit '/msg <nickname>'.
Möchten Sie mehr über den IRC-Teilnehmer 'willy' erfahren, geben Sie '/ctcp willy finger' ein. Auf dem Bildschirm erscheint dann mehr Information über ihn. Die Informationen, die andere mit diesem Befehl über Sie erhalten, können Sie meist selbst unter '/ctcp finget reply' in Ihrem Client eintragen.
Eine Liste der momentan auf Ihrem Server verfügbaren Kanäle erhalten Sie, wie oben schon erwähnt, mit dem Befehl '/list'. Diesen Befehl können Sie einschränken, indem Sie etwa mit '/list -min20' nur die Kanäle auflisten lassen, die mindestens 20 Teilnehmer haben. Oder Sie zeigen mit '/list #name' alle Kanäle, bei denen 'name' im Titel vorkommt. Übrigens kann es vorkommen, daß der Server nach dem List-Kommando die Verbindung beendet. Der Grund ist ein Schutzmechanismus im IRC, der verhindern soll, daß mehr Zeichen auf einmal übertragen werden, als man tippen kann. So kann niemand einen Kanal mit Texten blockieren, aber leider setzt dieser Mechanismus auch beim Auflisten der Kanäle ein. Abhilfe schafft da nur ein erneuter Connect (Verbindungaufbau).

Wenn Sie einen eigenen Kanal ins Leben rufen, kommen auch Sie in den Genuß, einmal Operator zu sein. Die Gründung eines Kanals ist denkbar einfach. Sie müssen lediglich den neuen Kanal, beispielsweise 'blafasel', mit '/join #blafasel' aufrufen. In der Liste der Teilnehmer stehen zunächst nur Sie. Wenn Sie sich hier mit Freunden treffen möchten, sollten alle den gleichen IRC-Server verwenden, da neue Kanäle nicht immer auf die anderen Server übertragen werden. Nun können Sie loslegen und Ihren Kanal 'regieren'. Der wichtigste Befehl dabei ist '/mode #Kanal', gefolgt von verschiedenen Parametern. Die Angabe des jeweiligen Kanals ist nur dann nötig, wenn Sie sich nicht in ihm befinden. Ein Pluszeichen vor einem Schalter aktiviert die jeweilige Funktion, ein Minus hebt sie auf. Mit '/mode #blafasel +s' machen Sie 'blafasel' einen geheimen Kanal, der in keiner Liste auftaucht. '/mode #blafasel +b <person>' etwa verbannt jemanden aus dem Kanal. Dabei wird die Person in der Form 'nickname!username@host' angegeben. Wer jetzt glaubt, einen Kanal namens blafasel gäbe es noch nicht, wird enttäuscht - zumindest auf dem Server in München.

Zum Schluß noch eine Warnung: Geben Sie keine Kommandos ein, die Sie nicht kennen. Es gibt nämlich auch die Möglichkeit, innerhalb des IRC Daten zwischen zwei Benutzern zu übertragen oder einem Benutzer gewisse Zugriffsrechte auf dem eigenen Rechner einzuräumen - jedenfalls genügend Möglichkeiten für einen kleinen Schabernack mit einem 'newbie'.

Die deutschen IRC-Server sind miteinander verbunden, Sie sollten sich also immer beim geographisch nächstgelegenen anmelden:

Aachen: irc.informatik.rwth-aachen.de
Berlin: irc.fu-berlin.de
Erlangen: ircserver.informatik.uni-erlangen.de
Kaiserslautern sokrates.informatik.uni.kl.de
Karlsruhe: irc.rz.uni-karlsruhe.de
München: irc.informatik.tu-muenchen.de
Paderborn: irc.uni-paderborn.de
Rostock: irc.informatik.uni-rostock.de
Stuttgart: irc.rus.uni-stuttgart.de

2.8 WAIS

WAIS (Wide Area Information Server) erscheint auf den ersten Blick wie ein landläufiges Informationssystem. Der Zugriff auf diese Datenbanken ist mit der von Archie vergleichbar. Es wird ein Stichwort eingegeben und WAIS betreibt in einer schon zuvor ausgewählten Datenbank eine Volltext-Suche. Hier zeigt sich die Verwandtschaft mit Gopher. Für jedes Dokument, welches dieses Stichwort beinhaltet, wird eine Titelzeile (Headline) ausgegeben. Entscheidet man sich für ein oder mehrere Dokumente, die rein von der Überschrift her interessant sein könnten, so kann man sich diese vollständig anzeigen lassen. Die Suche kann natürlich auch mit mehreren Stichworten und/oder mehreren verschiedenen Datenbanken betrieben werden.
Ein nicht zu verachtender Pluspunkt ist der absolut einfache Aufbau einer eigenen WAIS-Datenbank. Als Basis dafür nimmt man im einfachsten Falle eine einzige Textdatei. Das im WAIS-Programmpaket enthaltene Tool 'waisindex' indiziert diese Textdatei und erzeugt die zur schnellen Suche benötigten Zusatzdateien. Damit ist diese Textdatei als Datenbank in WAIS verfügbar und ermöglicht nun die Suche nach bestimmten Stichworten. Das Tool 'waisindex' ist sehr leistungsfähig, es können z. B. mehrere Dokumente zu einer Datenbank zusammengefaßt werden, wobei die Dokumente verschiedene Formate haben dürfen. Es können auch Bilder (GIF-Format) indiziert werden.
Um auf die vorbereiteten Datenbanken zugreifen zu können, benötigt man ein WAIS-Programm, einen WAIS-Clienten. Am Textterminal muß man sich leider mit 'waissearch' zufriedengeben. Wesentlich bedienungsfreundlicher ist die XWindow-Version 'xwais'. Die Bedienung geschieht weitestgehend über die Maus, das Interface ist praktisch selbsterklärend.
Bei der Anzeige der gefundenen Dokumente, enthält jede Ergebniszeile die Überschrift des Dokumentes, seine Länge und einen 'Score', die relative Häufigkeit des gefundenen Stichwortes im Vergleich zur Größe des Dokumentes. Der höchste Score (1000) gibt an, daß dieses Dokument wohl am ehesten dem Gesuchten nahekommt. Ist die erste Auswahl von Dokumenten zu grob, so kann man die Verweise auf die interessanteren Artikel speichern und nur in diesen gezielt weitersuchen. Sollte es vorkommen, daß kein Stichwort in einer der vorgegebenen Datenbanken zu finden ist, so gibt 'xwais' zusätzlich zur Fehlermeldung noch eine Übersicht aller vorhandenen Dokumente in den angegebenen Datenbanken an.

Interessant wird es, wenn man auf schon vorhandene Datenbanken zurückgreifen kann. Jeder, der eine eigene WAIS-Datenbank aufbaut, hat die Möglichkeit, diese registrieren zu lassen; damit bietet man anderen Benutzern seine Datenbank an. Das Verzeichnis aller Datenbanken nennt sich directory-of-servers.src und kann wie die anderen lokalen Datenbanken durchsucht werden. Sucht man in dieser Übersicht, so gibt der WAIS-Server als Suchergebnisse komplette spezielle Datenbanken als Ergebnis zurück, die für den Benutzer interessant sein könnten. Diese sind dann genauso verfügbar wie die eigenen.

Auch viele WAIS-Datenbanken werden nach und nach in WWW-Angebite umgewandelt, so daß dieser Dienst zunehmend an Bedeutung verliert.

2.9 Finger

Das finger-Kommando erlaubt es, Informationen über Benutzer zu erlangen, weshalb es aus Gründen des Datenschutzes oft auch gesperrt wird. Mit dem Kommando 'finger user@host' kann man sich über einen bestimmten Benutzer informieren. Die Ausgabe sieht beispielsweise folgendermaßen aus:
    Login: plate Name: Juergen Plate
    Directory: /home/plate Shell: /bin/sh
    No unread mail.
    On since Sun Nov 20 19:36 (MET) on ttyp3
    No Plan.

Die Informationen werden einigen Standarddateien des Rechners entnommen. Interessant ist die letze Zeile. Wer möchte, kann die Finger-Info um eigene Einträge ergänzen. Dazu müssen (bei Unix-Systemen) im eigenen Home-Directory die Dateien '.plan' und '.project' erstellt werden. Eine weitere Möglichkeit ist, einen anderen Hostrechner 'anzufingern'. Beim Kommando wird dann der Benutzer weggelassen. Man erhält dann Information darüber, welche Benutzer eingelogt sind.
Wegen eines Programmfehler ist vor einigen Jahren der Finger-Dienst als 'Hacker-Werkzeug' in Verruf geraten und von einigen Systemadministratoren gesperrt worden. Inzwischen sollten aber keine fehlerhaften Versionen mehr vorhanden sein.

2.10 WWW (World Wide Web)

Diesen Dienst habe ich aus zwei Gründen bis zum Schluß aufgespart: Er ist die jüngste Erfindung im Netz und er integriert viele der anderen Dienste. Man kann deshalb fast alles mit nur einem Programm erledigen.


Erfinder des WWW: Tim Berners-Lee
WWW wurde 1989 im CERN (dem Europäischen Kernforschungszentrum in Genf, Conseil Européen pur la Récherche Nucléaire) entwickelt, basierend auf einem System namens Hypertext. Stellen Sie sich ein Lexikon vor. Sie schlagen einen Begriff nach und finden dort auch Querverweise auf verwandte Begriffe. Ist das Lexikon einbändig, müssen Sie nur etwas blättern, um den angegebenen Querverweis zu finden. Bei einem mehrbändigen Lexikon müssen Sie unter Umständen einen anderen Band aus dem Regal nehmen. Handelt es sich beim Querverweis um eine andere Literaturangabe, ist möglicherweise ein Gang zur Bibliothek notwendig. 'Hypertext' bedeutet also, daß der Text Querverweise enthält, die man mit dem Betrachtungsprogramm per Tastendruck oder Mausklick abrufen kann. Das Hilfesystem von MS-Windows verwendet ein sehr einfaches Hypertextsystem. Nur geht WWW sehr viel weiter, es können nicht nur lokale Dateien, sondern Dateien auf beliebigen Rechnern im Internet als Querverweis angegeben und per Knopfdruck erreicht werden.

Aber das WWW ist nicht nur ein weiterer verbesserter Informationsservice wie Gopher oder WAIS, sondern es erlaubt auch die Einbindung von Bildern, Sounds oder Animationen in die Hypertext-Dokumente. Das Informationsangebot kann nun multimedial sein. Das hat letztendlich auch zur derzeitigen Popularität des Internet geführt; aber auch dazu, daß leider viele Menschen WWW und Internet gleichsetzen.

WWW ist aber auch der Versuch, die gesamte Information im Internet zusammenzufassen und über ein einziges Benutzerinterface zugänglich zu machen. Für den Benutzer existieren Programme verschiedener Hersteller, 'Browser' genannt, die das WWW verfügbar machen. Die ausgewählten Wörter sind durch Farbe oder Unterstreichung hervorgehoben und können per Mausklick expandiert werden. Damit beginnt die Reise durch das WWW. Auf dieser Reise begegnen Sie unter Umständen recht unterschiedlichen Quellen des Internet (beispielsweise FTP, News, Telnet, Gopher, E-Mail). WWW ist dabei aber höchst flexibel und kann Ihnen sowohl einen FTP-Server als auch einen Telnet-Zugang, einen News-Reader oder weiteres komfortabel präsentieren, so daß es in naher Zukunft für viele Nutzer nur noch ein einziges Werkzeug geben wird, um im Internet zu recherchieren. Die einzelnen Informationsquellen werden durch URLs (URL = Unified Resource Locator) bezeichnet, die den gewählten Dienst und die Datenquelle (Rechner und Datei) angeben (siehe unten).

'Netscape Navigator', 'Internet Explorer', 'Opera', 'Hot Java' sind Programme zum Zugriff auf das WWW mit grafischer Benutzeroberfläche. Es gibt aber auch für einige Systeme textorientierte Browser, z. B. 'LYNX'. Wenn Sie das Programm starten, gelangen Sie automatisch in die 'Homepage' Ihres Systems (bzw. des Systems ihres Providers). Mit 'Homepage' wird normalerweise die Einstiegsseite eines WWW-Servers - oder auch eines Benutzers - bezeichnet. Von dort aus können Sie einfach durch Auswahl eines Querverweises mit der Maus oder den Cursortasten auf weitere Informationsseiten eines beliebigen Internetrechners wechseln, wobei der Verbindungsaufbau automatisch erfolgt. Woher die Information kommt, kann im Browser angezeigt werden. Aber nicht nur durch Unterstreichung und Farbe hervorgehobene Texte können als Link (so nennt man bei WWW die Querverweise) dienen, sondern auch Bilder, beispielsweise kleine Icons. Eine weitere Möglichkeit wird durch sogenannte 'Imagemaps' geboten. Hier kann der Benutzer beliebige Stellen auf einem Bild anklicken. Die Mauskoordinaten werden an den Informations-Server übertragen, und der kann entsprechend reagieren. Bei LEO (http: // www.leo.org/) gibt es beispielsweise eine Deutschlandkarte, auf der man den gewünschten Zielort anklicken kann.

Wie Gopher basiert auch WWW auf dem Client-Server-Prinzip. Die Kommunikation erfolgt zwischen einem WWW-Server, der Informationen bereitstellt, und einem Client, der die Informationen anzeigt. Das Protokoll dafür heißt HTTP (HyperText Transfer Protocol). Mitttels dieses Protokolls fordert der Client bei einem Server eine ganz bestimmte Datei mit einem Hypertext-Dokument an, die oft auch als 'WWW-Seite' bezeichnet wird. Diese Datei wird dann vom Server an den Client übertragen und danach die Verbindung wieder geschlossen. Enthält das Dokument Bilder oder andere Multimedia-Teile, werden auch diese Datei für Datei übertragen. Weder Server noch Client 'merken' sich die Tatsache der Kommunikation (es gibt höchstens einen Eintrag in eine Protokolldatei auf dem Server). So ist jede Informationsanforderung ein abgeschlossener Vorgang. Etliche Browser können für ein Dokument, das aus mehreren Dateien besteht, auch mehrere Übertragungen parallel öffnen. Bilder bauen sich dann z. B. simultan auf. Dadurch wird aber auch die Belastung des Netzes erhöht. Damit Seiten, die öfter aufgerufen werden, nicht immer über das Netz transportiert werden müssen, können die meisten Browser WWW-Seiten lokal zwischenspeichern (Cache-Speicherung). Es erfolgt dann nur eine kurze Anfrage an den Server, ob sich die entsprechende Information seit dem letzten Zugriff geändert hat. Ist dies nicht der Fall, werden die Daten lokal von der Platte geholt. Die größeren Provider und Uni-Rechenzentren unterhalten ebenfalls ein Cache-System. Wenn ein Benutzer eine WWW-Seite anfordert, wird die Info auf der Platte des Providers zwischengespeichert. Bei der Anfrage eines weiteren Benutzers nach derselben Seite innerhalb eines bestimmten Zeitraums wird die lokale Kopie zur Verfügung gestellt ('Proxy-Cache', 'Proxy-Server'). Die Proxy-Software überprüft regelmäßig, ob sich die lokal gespeicherten Infos eventuell geändert haben und aktualisiert sie gegebenenfalls. Nicht mehr gefragte Seiten werden nach einiger Zeit gelöscht.

Die Browser selbst brauchen natürlich die Fähigkeit, nicht nur Text schön darzustellen, sondern auch Bilder anzuzeigen oder Töne abzuspielen. Für die gebräuchlichsten Dateiformate im WWW sind die entsprechenden Darstellungsprogramme im Browser integriert (z. B. für die Bildformate GIF und JPEG oder die Audioformate AU und WAV). Für andere Bildformate kann man dem Browser in einer Konfigurationsdatei mitteilen, welche externen Programme für bestimmte Dateiformate aufzurufen sind. Auf diese Weise kann man den Browser für beliebige Datenformate fit machen. Teilweise liefern auch schon die Browser-Hersteller solche Programme mit. Besinders komfortabel sind Programmen, die sich automatisch in den Browser einklinken (sogenannte 'Plug-In'-Programme) Die Angabe des Anzeigeprogramms kann sogar interaktiv erfolgen. Stößt der Browser auf ein unbekanntes Dateiformat, wird der Benutzer gefragt, ob er ein Anzeigeprogramm angeben möchte oder ob die Datei für später auf der Platte gespeichert werden soll. In diesem Zusammenhang noch ein Hinweis: Alles was man beim Surfen im WWW auf dem Bildschirm sieht, ist in den lokalen Rechner übertragen worden und kann natürlich auch dauerhaft abgespeichert werden (File-Menü des Browsers, Menüpunkt 'Save as...'). Ebenso lassen sich die Bilder abspeichern (beim Netscape-Browser Mauszeiger auf das Bild ziehen, rechte Maustaste drücken).

Eigentlich ist das, was der Browser auf dem Bildschirm zeigt, die Wiedergabe einer Textdatei, die bestimmte Strukturierungsmerkmale enthält (probieren Sie mal den Menüpunkt 'view source' Ihres Browsers aus). Die Definitionssprache für solche Hypertext-Dokumente ist recht einfach, sie heißt HTML (HyperText Markup Language). HTML besteht aus normalem Text, bei dem Steueranweisungen, sogenannte HTML-'Tags', in den Text eingefügt werden. Diese Tags beeinflussen das Schriftbild, das später im Betrachtungsprogramm angezeigt wird; so gibt es zum Beispiel Tags, die einen Text als Überschrift kennzeichnen, oder Tags, die das Schriftbild verändern können. die Tags werden immer in '<' und '>' eingeschlossen. Mit nur wenigen Tags lassen sich schon sehr ansprechende Dokumente erstellen (siehe Kapitel 4).

Damit sind wir bei einem sehr wichtigen Punkt angelangt. HTML beschreibt die Struktur eines Dokuments, nicht dessen Aussehen! Denn der Informationsanbieter kann ja nicht wissen, ob der Leser seine Infos mit einem grafischen oder textorientierten Browser liest. Auch Bildschirmauflösung des Client-Computers, aktuelle Größe des Browser-Fensters, Farb- und Schriftwahl des Benutzers spielen eine Rolle. Manchen Benutzer schalten die Darstellung der Bilder ab, um Übertragungszeit zu sparen. All das sollte der Anbieter berücksichtigen (manche tun es, manche nicht). HTML ist eben kein Desktop-Publishing, sondern eine Struktursprache.

Wie kommt man zu interessanten Informationen? Es gibt drei Möglichkeiten:

1. Durch Empfehlung von Bekannten (Es können auch Informationen aus den News sein). Jemand sagt also zu Ihnen: "Probiere mal: http: // www.fh-muenchen.de/". Das tippen Sie dann ins Adreßfenster des Browsers, und schon landen Sie auf dem entsprechenden Computer, der Ihnen die gewünschte Information serviert.

2. Durch Netsurfen. Sie starten einfach irgendwo. Klicken Sie auf eines der Links, und Sie werden auf einem Server irgendwo in der großen weiten Welt landen. Die Chance ist groß, daß diese Web-Seite weitere Links enthält und so werden Sie von von Australien bis Japan springen und dabei ein paar interessante Dinge entdecken (und, falls Sie Ihr Datenvolumen bezahlen müssen, den nächsten Monat nicht mehr Netsurfen).

3. Durch Suchen. Ähnlich wie bei Gopher gibt es etliche Server, die mit Suchmaschinen einen Index vieler, vieler WWW-Server anlegen. In diesem Index kann man dann nach Stichworten suchen. Im Anhang sind einige Suchsysteme aufgelistet.

Oft hat man schon eine recht große Anzahl an Bildschirmen und WWW-Schritten hinter sich, bis man an der gewünschten Stelle oder interessanter Information angekommen ist. Um sich einen relativ langen oder umständlichen Weg bis zu dieser Stelle ein zweites Mal zu ersparen, kann man solche Stellen im WWW in der persönlichen 'Hotlist' eintragen.

Ein weiteres Merkmal des WWW ist die Schreiboption. Damit ist es möglich, Formulare, z. B. Bestellscheine von Bibliotheken oder Anmeldungen für Konferenzen, auszufüllen und abzuschicken. Diese Formulare werden dann von Programmen auf dem Server-Rechner bearbeitet. Diese schicken dann die Antwort wieder als WWW-Dokument zurück.

Was ist ein URL?

URL ist die Abkürzung für 'Uniform Resource Locator' und wird im Netz verwendet, um Informationen vollständig zu bezeichnen. Mit einem URL wird nicht nur eine Datei und das zugehörige Verzeichnis, sondern auch der Rechner festgehalten, auf dem sie zu finden ist. Nachdem es im Internet verschiedene Dienste (z. B. FTP, Gopher, WWW) und somit verschiedene Protokolle gibt, wird schließlich noch die Zugriffsmethode festgehalten. Die allgemeine Syntax eines URL lautet also:

Protokoll://Rechneradresse:Port/Dateipfad/Dateiname

Ein URL besteht also aus vier Teilen, wobei nicht immer alle Teile aufgeführt werden müssen (meist ist z. B. keine Portangabe nötig). Beim Gopher-Protokoll wird statt Pfad- und Dateiname der Menütyp (01 fürs Startmenü) und ein Pfad angegeben. Das Protokoll gibt an, welcher Dienst genutzt werden soll, hier sind gebräuchlich:

  • ftp - Dateitransfer mittels (anonymen) FTP
    z. B. ftp://ftp.microsoft.com/pub/drivers/mouse/mouse.sys

  • gopher - Informationsrecherche auf einen Gopher-Server
    z. B. gopher://gopher.dingsda.com

  • news - Lesen und Schreiben von News
    z. B. news://news.lrz-muenchen.de/lrz.misc

  • http - Lesen von WWW-Seiten (http HyperText Transport Protocol)
    z. B. http: // lx-lbs.e-technik.fh-muenchen.de/index.html

  • mailto - Adresse für E-Mail
    z. B. mailto:plate@e-technik.fh-muenchen.de

Die Portangabe hat einen sehr technischen Hintergrund. Um die einzelnen Dienste zu unterscheiden, wird beim TCP/IP-Protokoll (vereinfacht gesagt) jedem Dienst eine Nummer zugewiesen, eben die Port-Nummer. Es gibt allgemein festgelegte Ports, z. B. 80 für das http-Protokoll. Solche Standard-Ports müssen nicht angegeben werden. Man kann aber auch unbelegte Portnummern verwenden, beispielsweise um einen modifizierten WWW-Dienst anzubieten. In diesem Fall muß dann die Portnummer angegeben werden.

Sie sehen, ein URL ist ein nützliches Instrument, um Informationsquellen im Netz eindeutig zu bezeichnen. Inzwischen wird die Form der URL-Schreibweise nicht nur in WWW-Dokumenten, sonder auch ganz allgemein verwendet, um auf eine Ressource hinzuweisen, z. B. in einer E-Mail.

2.11 Ping

Dieses Programm ist ein kleines Tool, mit dem man feststellen kann, ob ein ferner Rechner überhaupt erreichbar ist. Ping variiert bei den verschiedenen Systemen, aber mit dem einfachen Aufruf
    ping Rechnername
kann man den fernen Rechner 'anklingeln'. Je nach Programmversion erhält man nur die Meldung
    Rechnername is alive
wenn alles in Ordnung ist - oder eine der Fehlermeldungen 'no answer', 'unknown host' oder 'network unreachable'.

Bei anderen Versionen (oder durch Angabe des Parameters -s) erhält man für jedes Datenpaket eine Meldung. Das Kommando kann dann mit Ctrl-C abgebrochen werden, worauf eine Statistik ausgegeben und das Kommando beendet wird. Bei grafischen Benutzerschnittstellen erfolgt die Parameterangabe über Dialogfelder und nicht in der Kommandozeile.

2.12 Traceroute

Um festzustellen, welchen Weg die Datenpakete zu einem fernen Rechner nehmen und wie "gut" die Verbindung dorthin ist, kann man 'traceroute' einsetzen. Das Programm schickt UDP-Pakete mit unterschiedlicher "Lebensdauer" an einen unbenutzten Port und wertet so die Fehlermeldungen der einzelnen Router und Gateways aus. Dem Kommando wird wie bei Ping nur der Rechnername oder eine IP-Nummer als Parameter übergeben. Für jeden Gateway wird dann auf dem Bildschirm eine Zeile ausgegeben:
Zähler Gateway-Name Gateway-IP-Nummer "round-trip"-Zeit (3 Werte)
Traceroute sendet jeweils drei Datenpakete. Wenn auf ein Paket keine Antwort erfolgt, wird ein Sternchen (*) ausgegeben. Ist ein Gateway nicht erreichbar, wird statt einer Zeitangabe '!N' (network unreachable) oder '!H' (host unreachable) ausgegeben. Man kann so feststellen, wo eine Verbindung unterbrochen ist, und auch, welchen Weg die Daten nehmen - wo also der Zielrechner in etwa steht. Bei grafischen Benutzerschnittstellen erfolgt die Parameterangabe über Dialogfelder und nicht in der Kommandozeile.

2.13 Whois

Dieser Dienst liefert Informationen über Netzteilnehmer, sofern sich diese bei einem Whois-Server haben registrieren lassen. Das kann man über ein Formular, netinfo/user-template.txt auf nic.ddn.mil, machen, das dann an registar@nic.ddn.mil geschickt wird). Das Kommando lautet:
    whois Namensangabe
wenn der voreingestellte Server verwendet wird. Mit Serverangabe lautet das Kommando:
    whois -h Serverrechner Namensangabe
Man erhält dann alle Angaben aus der Datenbank, die zur Namensangabe passen. Als Namensangabe kann entweder ein Userpseudonym (Login-Name) oder der "echte" Name, eventuell als 'Nachname, Vorname', angegeben werden. Bei grafischen Benutzerschnittstellen erfolgt die Parameterangabe über Dialogfelder und nicht in der Kommandozeile.
Als Whois-Server können Sie 'whois.nic.de' oder 'whois.internic.net' angeben.
Durch die Namensangabe 'do Rechnerdomain' können Infos über die entsprechende Domain eingeholt werden. Ebenso kann man sich mit 'host Rechnername' über einzelne Computer oder mit 'net Netzwerknummer' über Netze informieren.
Fehlt das Whois-Kommando, eröffnet man eine Telnet-Verbindung zu nic.ddn.mil und gibt 'whois' nach dem @-Prompt ein. Auf den Prompt 'Whois:' hin kann man interaktive Anfragen absetzen (z. B. das 'help'-Kommando).

2.14 Java, Javascript, VRML, Flash etc.

Die Entwicklung der WWW-Browser schritt in den letzten Jahren rasant voran. Was mit der einfachen Darstellung von Texten mit der Einbindung von Multimedia-Elementen begann, entwickelt sich heute in Richtung 'virtuelle Realität' mit dreidimensionalen Darstellungen, Animationen und mehr.

2.14.1 Java

Mit Java hat SUN Microsystems etwas Neues geschaffen. Es können nun mit einer WWW-Seite nicht nur Text, Bilder, Sounds oder Animationen an den eigenen Rechner geliefert werden, sondern Programme, die lokal ablaufen. Statt beispielsweise ein Diagramm als Grafik zu senden, wird nun ein Diagramm-Zeichenprogramm mit den Daten geschickt. Um dann die Änderung der Daten kontinuierlich zu zeigen, müssen nun nur noch wenige Daten gesendet werden. Java ist eine richtige Programmiersprache, die an die Sprache C++ angelehnt ist. Wenn man im Browser eine Seite mit einem Java-Programm wählt, wird dieses Programm übertragen und dann von lokalen Browser ausgeführt.
Der Ansatz für Java entstand noch unter der Prämisse, Java auf intelligenten Peripheriegeräten, z. B. beim interaktiven Fernsehen, einzusetzen. Eine logische Konsequenz daraus war der Wunsch nach Vereinfachung gegenüber existierenden Technologien und nach geringem Ressourcenverbrauch. C++ wurde daher schon recht früh als Programmiersprache verworfen. Um aber den Aufwand des Umstiegs für C-, Smalltalk- und Eiffel-Programmierer gering zu halten, entlehnt Java zum Teil deren Konzepte und legt die C++-Syntax zugrunde. Wichtige Unterschiede zwischen Java und C++ sind die Eliminierung der 'herkömmlichen' Zeiger, der zusammengesetzten und der vorzeichenlosen Datentypen. Neu (zumindest gegenüber C++) sind 'sichere' Arrays und vor allem ein Garbage Collector, der Speicherbereiche, die nicht mehr referenziert werden, automatisch freigibt. Die Java-Programme werden in ein kompaktes Format übersetzt, den Bytecode. Das ist an sich nichts neues, prinzipiell gab es das schon seit ca. 20 Jahren bei den BASIC-Interpretern der Heimcomputer. Im Java-fähigen Browser ist dann ein Interpreter für diesen Bytecode enthalten.
Der Interpreter überprüft den Bytecode vor der Ausführung auf unerlaube Zugriffe auf Ressourcen. Auf diese Weise sind zwei Ausführungsmodi möglich: Einem lokal gestarteten Java-Applet (so nennt man die Java-Programme) kann der Benutzer den Zugriff auf den Rechner erlauben. Aus dem Netz geladene Applets behandelt Java dagegen äußerst mißtrauisch. Sie sind quasi in den Interpreter eingesperrt und verwenden genau definierte und vom Benutzer kontrollierte Möglichkeiten, beispielsweise auf die Festplatte zu schreiben. Zusätzlich wird jedes Applet vor und während der Ausführung auf korrekte Benutzung der Methoden und Instanzvariablen, mißbräuchliche Benutzung von Objektreferenzen, Stack-Überläufe und Zugriffsbeschränkungen getestet. Auch das Überschreiben von als sicher akzeptierten Klassen aus der lokalen Klassenbibliothek durch potentiell gefährliche Klassen aus dem Netz ist nicht ohne Erlaubnis des Benutzers möglich. Dies kann soweit gehen, daß der Benutzer jedes Laden einer externen Klasse bestätigen muß.
Für grafische Oberflächen, Ein-/Ausgabe, mathematische Operationen und Netzwerkfunktionen existieren vordefinierte Klassen. Ein Java-Programmierer muß nicht gleich alles wissen, die Einarbeitungszeit ist unter Java viel kürzer als unter C++. Ein Beschränkung der Programmiersprache auf spezielle Anwendungsgebiete ist (theoretisch) nicht vorgegeben. Was die Entwicklung vollwertiger Stand-alone-Programme angeht, gilt für Java jedoch das gleiche wie für andere plattformübergreifende Bibliotheken: es ist nur der 'kleinste gemeinsame Nenner' implementiert.

Für Java-Code, der in einem Web-Browser ablaufen soll, dient die Klasse 'Applet' als Ausgangspunkt. Im HTML-Code werden die Java-Klassen durch das <applet>-Tag eingebettet. 'Applet' definiert als Superklasse für alle Applikationen, die in Browser eingebettet werden sollen, auch einen Eventhandler für Benutzereingaben. Die wichtigsten Methoden für ein Applets sind die Initialisierung, Aktivierung der Anzeige, Deaktivierung der Anzeige und das Terminieren. Der Programmierer definiert in diesen Methoden das Verhalten des Applets auf der Seite. Gemäß dem 'Java-Knigge' sind Applets so zu programmieren, daß sie nur dann Rechenzeit beanspruchen, wenn die umgebende HTML-Seite angezeigt wird. Mit Java lassen sich auch komplette Bedienoberflächen programmieren. Die Möglichkeit, mit einem Mausklick ein Applet zu stoppen und wieder anzustarten, runden die Vorschriften ab. Um nicht den Browser mit der Interpretation des Applets zu blockieren und auch mehrere Applets simultan in einer HTML-Seite animieren zu können, sind Threads bereits Grundausstattung der Java-Laufzeitumgebung.
Wer sich für Java interessiert, findet Java-Seiten mit vielen Demos, den HotJava-Browser (für SUNs) und Java-Entwicklersoftware auf dem Server von SUN Microsystems unter http: // java.sun.com/. Die Entwicklertools für Java-Applikationen stecken noch in den Kinderschuhen und sind zwar mächtig in der Leistung, aber noch recht unkomfortabel in der Bedienung.

2.14.2 JavaScript

JavaScript ist eine Script-Sprache mit begrenzten Fähigkeiten. Sie hat im Grunde mit Java nur einen Namensteil gemeinsam. JavaScript ist eine von Netscape entwickelte Programmiersprache. Die Sprache lehnt sich in der Syntax an die von Sun Microsystems entwickelte Programmiersprache Java an. JavaScript ist jedoch anspruchsloser im Aufbau als Java, eingeschränkter in den Möglichkeiten und für andere Zwecke gedacht. JavaScript ist im Gegensatz zu Java eine unmittel-bare Ergänzung und Erweiterung zu HTML. JavaScript bietet sich für folgende Zwecke an:
  • Animation (z. B. Marquees = Lauftexte programmieren) und in WWW-Seiten einbinden. Dabei steht Ihnen nicht nur das Anzeigefenster zur Verfügung, sondern auch Dialogbereiche des WWW-Browsers, etwa die Statuszeile.
  • Projektsteuerung: Mit Hilfe von JavaScript lassen sich einige Lücken in HTML umgehen. So ist es mit Hilfe von Ja-vaScript beispielsweise möglich, innerhalb eines Frame-Sets die Inhalte mehrerer Frame-Fenster gleichzeitig zu aktualisieren.
  • Formularüberprüfung: ?erprüfen der Anwendereingaben in einem HTML-Formular während der Eingabe
  • Dynamische WWW-Seiten: Mit Hilfe von JavaScript läßt sich erreichen, daß sich WWW-Seiten während der Anzeige dynamisch verhalten. Beispielsweise Wechsel eines Bildmotivs, wenn sich die Maus über das Bild bewegt.
  • Text generieren: Zur Laufzeit HTML-formatierten Text generieren, z.B. das aktuelle Datum und die aktuelle Uhrzeit anzuzeigen.
  • Anwendungen: Mit Hilfe von JavaScript lassen sich einfache Anwendungen programmieren. Das können z.B. wissenschaftliche oder kaufmännische Taschenrechner sein. Auch einfache Spiele sind denkbar.
JavaScript-Programme werden im Gegensatz zu Java-Programmen direkt in der HTML-Datei notiert. Sie werden auch nicht - wie Java-Programme - compiliert, sondern als Quelltext zur Laufzeit interpretiert, also ähnlich wie Batchdateien bzw. Shellscripts.
Dadurch bleibt JavaScript unkompliziert für den Programmierer, doch kritisch für den Anwender. Das Interpretieren von Quellcode ist ungleich langsamer als das Interpretieren von compiliertem Code. Deshalb ist JavaScript nur für kleine und einfache Programmabläufe sinnvoll. Da kein Compilierungslauf und somit keine Fehlerprüfung stattfindet, gibt es bei JavaScript auch keinen Schutz vor schweren Programmfehlern.
Kleine Effekte, wie das bekannte Ändern des Erscheinungsbildes eines grafischen Elements, wenn die Maus darüber bewegt wird, lassen sich jedoch schnell realisieren.

2.14.3 VRML

Zur Beschreibung der WWW-Hypertext-Dokumente dient, wie erwähnt, eine Sprache namens HTML (HyperText Markup Language). Eine faszinierende Erweiterung für 3D-Grafiken ist die Beschreibungssprache VRML (Virtual Reality Modeling Language). Statt riesiger Animationsdateien werden auch hier nur Anweisungen geschickt, wie eine dreidimensionale Animation aussehen soll. Die so definierten Animationen werden dann auf dem lokalen Rechner erzeugt. Im Grunde ist dies keine grundlegende Neuerung, denn jedes Raytracing-Programm arbeitet mit einer solchen 3D-Sprache. Die Software berechnet anhand der Beschreibung die jeweilige Szenerie und stellt sie grafisch auf dem Bildschirm dar. VRML wird derzeit speziell auf die Bedürfnisse von WWW und Internet zugeschneidert, verfügt daher über spezifische Fähigkeiten, etwa die Einhindung von HTML-Dokumenten in 3D-Szenen. Die Entwicklung von VRML begann im Frühjahr 1994. Der Name VRML wurde damals geboren, allerdings noch als 'Virtual Reality Markup Language'.

Um nicht bei Null zu beginnen und statt dessen eine geeignete, bereits vorhandene 3D-Technologie zu nutzen, fiel die Wahl der Entwickler auf 'Open Inventor' von Silicon Graphics (SGI). Open Inventor unterstützt 3D-Szenarien mit Polygonobjekten, verschiedenen Belichtungsmöglichkeiten, Materialien oder Texturen. Zudem stellte SGI noch eine erste VRML-Parser-Library zur Verfügung, die als Grundlage für die Implementierung von 3D-Viewern diente.

2.14.4 Flash

Derzeit letzter Endpunkt der Technik auf Webseiten ist Flash. Web-Entwickler verwenden Flash zum Erstellen von attraktiven, auf Browsergröße anpassbaren, extrem kleinen und kompakten Navigations-Oberflächen, technischen Illustrationen, Langform-Animationen und sonstigen faszinierenden Effekte für Websites und andere Web-aktivierte Geräte (wie WebTV). Flash-Grafiken und -Animationen werden mit Hilfe der Zeichenwerkzeuge in Flash oder durch Importieren von Vektor-Grafiken erstellt. Flash unterstützt nicht nur Vektorgrafiken, die im Gegensatz zu Pixelgrafiken (GIF, JPEG, PNG, BMP, usw.) bei einer Skalierung (Vergrößerung oder Verkleinerung) ihr exaktes Aussehen behalten. Alle in Flash 4 erstellen Grafiken erscheinen auf dem Bildschirm nahtlos und glatt. Dank dieser Anti-Aliasing-Technik wirken die Designs immer ganz genau so, wie von ihrem Entwickler beabsichtigt. Zusätzlich unterstützt Flash Streaming-Verfahren. Damit lassen sich Animationen aller Art in WWW-Seiten einbinden - und nicht nur Zeichentrick-Filmchen, oder Textanimation, sondern auch Navigationselemente wie Schaltflächen und Menüs. Zur Bildanimation können dann noch die passenden Sounds hinzugefügt werden. Vektorbasierte Flash-Sites werden bereits beim Herunterladen abgespielt und machen so ein unmittelbares Feedback möglich. Flash eignet sich auch für Produktpräsentationen und ähnliche Aufgaben. Die Animationen lassen sich auch in gängige Videoformate (AVI, MPEG) umsetzen.


Copyright © Prof. Jürgen Plate, Fachhochschule München