Google und Suchmaschinen

Du hast deine erste Webseite gebaut – aber wie findet Google sie überhaupt? Und warum taucht manche Seite ganz oben in den Suchergebnissen auf, während eine andere gar nicht gefunden wird? Dahinter steckt kein Zufall, sondern ein System. In diesem Abschnitt schauen wir uns an, wie Suchmaschinen arbeiten, welche Rolle dein HTML dabei spielt und was du konkret tun kannst, damit deine Seite sichtbar wird.

Wie Suchmaschinen eine Seite entdecken

Suchmaschinen wie Google schicken automatische Programme durchs Internet – sogenannte „Crawler" oder „Spider". Diese Programme folgen Links von Seite zu Seite und lesen dabei den Inhalt jeder Seite. Was sie lesen, wird in einem riesigen Index gespeichert. Wenn jemand dann bei Google etwas sucht, durchsucht Google nicht das gesamte Internet in diesem Moment – sondern greift auf diesen vorbereiteten Index zurück.

Damit deine Seite überhaupt gecrawlt werden kann, muss sie erreichbar sein: Sie braucht eine öffentliche URL, sie darf den Crawler nicht per robots.txt aussperren, und sie sollte von irgendwo verlinkt sein – denn Crawler folgen Links. Eine Seite, die im Netz völlig allein steht und keine eingehenden Links hat, wird möglicherweise nie entdeckt.

Was im <head> wirklich zählt

Der <head>-Bereich deiner HTML-Seite ist für Besucher unsichtbar – aber für Suchmaschinen besonders wichtig. Hier liest Google unter anderem den Seitentitel und die Beschreibung. Beides erscheint direkt in den Suchergebnissen.

<head>
  <meta charset="UTF-8">
  <title>HTML Grundlagen – Rainlearn</title>

  <meta name="description" content="HTML Grundlagen einfach erklärt:
  Lerne die Struktur von Webseiten mit praktischen Beispielen.">

  <meta name="robots" content="index, follow">

  <link rel="canonical" href="https://rainlearn.de/lernen/html-grundlagen.php">
</head>

Das <title>-Tag ist der Titel, der im Browser-Tab und in den Google-Suchergebnissen erscheint. Er sollte präzise beschreiben, worum es auf der Seite geht – am besten mit dem wichtigsten Begriff am Anfang. Die meta name="description" ist der kurze Beschreibungstext, der unter dem Titel in den Suchergebnissen angezeigt wird. Google nutzt ihn zwar nicht direkt als Ranking-Faktor, aber ein guter Text erhöht die Wahrscheinlichkeit, dass jemand auf dein Ergebnis klickt.

Mit meta name="robots" content="index, follow" sagst du Google ausdrücklich: „Diese Seite darf in den Index aufgenommen werden, und du darfst Links auf ihr folgen." Das ist in den meisten Fällen das, was du willst. Das Gegenteil wäre noindex, nofollow – damit schließt du eine Seite gezielt aus dem Index aus, zum Beispiel bei Testseiten oder internen Bereichen.

Der canonical-Link gibt Google an, welche URL als die „offizielle" Version dieser Seite gilt. Das ist wichtig, wenn dieselbe Seite unter mehreren Adressen erreichbar wäre – zum Beispiel mit und ohne www. Ohne Canonical könnte Google denken, es handele sich um doppelten Inhalt.

Struktur und Inhalt: Was Google liest

Neben dem <head> liest Google auch den sichtbaren Inhalt deiner Seite. Dabei achtet es auf Struktur: Gibt es eine klare <h1>-Überschrift? Sind Unterüberschriften mit <h2> und <h3> sinnvoll eingesetzt? Ist der Text verständlich und thematisch kohärent? Eine Seite, die sauber strukturiert ist und echten, hilfreichen Inhalt bietet, hat deutlich bessere Chancen, gut gefunden zu werden, als eine, die nur aus unstrukturiertem Text besteht.

Auch semantische HTML-Elemente spielen eine Rolle: <article>, <nav>, <header> und <footer> helfen Google dabei zu verstehen, welcher Teil der Seite der eigentliche Inhalt ist und was Navigationselemente sind. Das haben wir auf dieser Seite – und auf allen anderen Rainlearn-Seiten – bereits so umgesetzt.

Ladezeit und Technik

Google bewertet nicht nur den Inhalt einer Seite, sondern auch ihre technische Qualität. Eine Seite, die langsam lädt, wird schlechter eingestuft – besonders auf mobilen Geräten. Dazu gehören Faktoren wie die Größe von Bildern, die Menge an eingebundenem Code und ob die Seite auf kleinen Bildschirmen gut darstellbar ist. Das Meta-Tag <meta name="viewport">, das wir bereits in unserer Grundstruktur haben, ist ein erster Schritt in diese Richtung: Es teilt dem Browser mit, dass die Seite für mobile Geräte optimiert ist.

Die robots.txt

Neben den Meta-Tags im <head> gibt es noch eine weitere Möglichkeit, Suchmaschinen Anweisungen zu geben: die robots.txt. Das ist eine einfache Textdatei, die im Stammverzeichnis deiner Webseite liegt – also direkt unter deiner Domain erreichbar, zum Beispiel unter https://rainlearn.de/robots.txt.

In dieser Datei kannst du festlegen, welche Bereiche deiner Seite Crawler besuchen dürfen und welche nicht. Das ist zum Beispiel sinnvoll, wenn du einen internen Testbereich hast, der nicht in Google auftauchen soll. Eine einfache robots.txt sieht so aus:

User-agent: *
Disallow: /intern/
Disallow: /test/

Sitemap: https://rainlearn.de/sitemap.xml

User-agent: * bedeutet: Diese Regel gilt für alle Crawler. Disallow sperrt einen bestimmten Pfad. Alles, was nicht explizit gesperrt ist, darf der Crawler besuchen. Die optionale Angabe der Sitemap am Ende hilft Suchmaschinen, alle Seiten deiner Website systematisch zu finden.

Wichtig zu wissen: Die robots.txt ist eine Empfehlung, keine technische Sperre. Seriöse Suchmaschinen halten sich daran – aber jemand, der deine Seite gezielt aufruft, kommt trotzdem ran. Für echten Zugriffsschutz braucht es andere Mittel.

Google Search Console

Wenn deine Seite online ist, lohnt sich ein Blick in die Google Search Console. Das ist ein kostenloses Werkzeug von Google, das dir zeigt, wie Google deine Seite sieht. Du erfährst dort, welche Seiten bereits im Index sind, über welche Suchbegriffe deine Seite gefunden wird und ob es technische Probleme gibt – zum Beispiel Seiten, die nicht gecrawlt werden konnten.

Außerdem kannst du Google dort direkt mitteilen, dass deine Seite existiert: Über die Funktion „URL-Überprüfung" kannst du eine neue Seite zur Indexierung einreichen, anstatt einfach zu warten, bis der Crawler sie irgendwann von selbst findet. Gerade am Anfang, wenn deine Seite noch wenige eingehende Links hat, kann das den Unterschied machen.

Du musst das alles jetzt noch nicht perfekt beherrschen. Aber es ist gut, es frühzeitig zu wissen: Die Entscheidungen, die du beim Aufbau einer Seite triffst – Titel, Struktur, Ladezeit – haben direkten Einfluss darauf, ob und wie gut sie gefunden wird. Gutes HTML ist also nicht nur für den Browser gedacht, sondern auch für Google.