Blogs

Geschichte der Web-Suche

Internet Search Engines: History & List of Search Engines..

Open Source Such-Lösungen im Vergleich

Published in

Vik Singh hat einen möglichst objektiven Vergleich von verschiedenen Open Source Information Retrieval Lösungen im Bezug auf Performance und Relevanz durchgeführt. Untersucht werden unter anderem Lucene, zettair, sphinx, Indri und Xapian. Die einzige IR-Lösung, die meiner Ansicht fehlt, ist Terrier. Zusammenfassend kann gesagt werden, dass Lucene abgesehen vom maximalen Arbeitsspeichergebrauch am besten abschneidet. Der Autor hat sämtlichen Quellcode für weiterführende Analysen auf github zur Verfügung gestellt. Einige kritische Anregungspunkte zur Durchführung solcher "unoptimierten" Vergleiche, hat Otis Gospodnetići verfasst.

Wechseln Google-Benutzer zu Bing?

Published in

Entgegen der Meinung in meinem Umfeld, wird Bing zumindest in den Staaten immer populärer. Der Marktanteil von Bing steigt kontinuierlich an. Komplexere Informationsbedürfnisse wie z.B. im Bereich Gesundheit, werden gemäss einem interessanten New York Times-Artikel besser gefunden. Ich bin gespannt wie sich der Markt entwickelt. Immerhin hat Bing immer noch Beta-Status.

TKB Treffer-Snippet von Google

Published in

Die Resultatpräsentation ist von enormer Wichtigkeit für die erste Relevanz-Bewertung eines Treffers. Dazu gehört auch das Treffer-Snippet. Erstaunt war ich über folgendes Snippet, wo der Snippet-Text von Google nirgends in der Web-Page selbst vorkommt:

Wie bestimmt Google den Snippet-Text in diesem Falle? Leider war für diesen Treffer der Google-Cache nicht vorhanden. Dies würde helfen um zu sehen ob sich die Web-Page entsprechend verändert hat. Als Phrase wurde der Snippet Text auch nicht gefunden.

Information Retrieval Video Vorträge

Dass es neben Youtube noch andere Video-Portale gibt, geht oftmals vergessen. Die Website videolectures.net bietet eine Vielzahl von Videos an. Unter anderem auch 66 Videos über Information Retrieval. Nun muss man nur noch die Zeit finden, die Vorträge anzuschauen.

How Google works - Wie google arbeitet

Published in

Auf die Forderungen nach mehr Transparenz, hat Google die Webseite How Google works aufgeschaltet. Herausgekommen ist meiner Ansicht nach ein gelungenes Video, dass dem Normalbürger die Suche von Google näher bringt. Als Information Retrieval Interessierter wird nichts wirklich Neues dargelegt, aber mir gefällt die Video-Machart, ganz nach dem Still von Twitter Search in Plain English.
Wer mehr über die Hintergründe wissen möchte, dem ist der Wired-Artikel zu empfehlen.

Relevanz von Google Adsense Werbung

Published in

Als Blogger, der Google Adsense nutzt, beobachtet man natürlich die Werbungen, die auf der Webpage platziert werden.
Über die Relevanz der Werbungen lässt sich allerdings streiten. In vielen Fällen bin ich positiv überrascht worden. Erst durch Google Adsense gelangt man auf Websiten, die bis anhin unbekannt waren.

Allerdings gibt es auch negative Beispiele. Was der Inhalt dieses Blog-Posts mit Schwangerschaft oder Scheidenpilz zu tun hat, bleibt mir rätselhalft:

Site Search Tipps - White Paper

Published in

Für 80 allgemeine Suchtipps was eine gute Site-Suche ausmacht, dem kann ich das gegen Anmeldung erhältliche White Paper von SLI Systems empfehlen. Einige Tipps sind recht banal, doch gerade die kleinen Dinge sind kumuliert entscheidend für die Benutzerzufriedenheit.

Session-Länge bei Nicht-Navigationsanfragen

Published in

In einem Bing-Blogeintrag bin ich über folgende Aussage gestossen:

In fact, 44% of non-navigational search sessions last longer than 1 week!

Dieser Wert ist für mich sehr hoch und hat mich entsprechend überrascht. Interessant wäre zu wissen, wie die Verteilung dieser 44% von Nicht-Navigationsanfragen genau aussieht. Offensichtlich bestehen viele komplexe Informationsbedürfnisse, die nicht mit einem Top-Resultat beantwortet werden können. Wer mehr über die Anfragetypen Bescheid wissen möchte, dem ist das Paper von Broder A taxonomy of web search zu empfehlen.

Suchalgorithmus bei Google

Published in

Ein sehr lesenswerter Wired Artikel wie Google's Algorithmen funktionieren respektive sich weiterentwickelt haben.
Der Trend geht klar weg von der reinen Stichwortsuche hin zur semantischen Suche, wie folgendes Beispiel zeigt:

“Today, if you type ‘Gandhi bio,’ we know that bio means biography,” Singhal says. “And if you type ‘bio warfare,’ it means biological.”

Syndicate content

Theme port sponsored by Duplika Web Hosting.
Home Back To Top