Rainers Horen
Sonnabend, den 17.02.2007 [08:20]
Wieder ist nach arbeitsreicher Woche so ein herrliches Wochenende abgebrochen. Der Bau der ¬S?hl??v?igt.COM-Seite hat doch einen ganzen Tag gedauert. Nun gibt es ein Standardwiki mit kleinen Extensions, die schon beim Eisbergwiki für Greenpeace ihren Dienst verrichtet haben.

Das ist prima für rein redaktionelle Seiten, wie sie bei Wikipedia üblich sind. Eine S?hl??v?igt-Plattform lebt aber gerade von genealogischen Beziehungen. Es muss also irgendwie zu jeder Person Mutter und Vater zugeordnet werden. So kann man dann im Stammbaum surfen. Man braucht also eine Spezialseite, die ähnlich Bild hochladen Sonderfunktionen bietet, wie das Ausfüllen des Datensatzes und die Auswahl der Eltern.

Nach einer gewissen Zeit des Stöberns in einem fertigen System kommt dann die Frage, ob es nicht einfacher wäre…
Beitrag kommentieren

Mittwoch, den 14.02.2007 [08:20]
Seit mehreren Jahren ist nebige ¬Webseite verwaist. Schade Könnte sie doch der Treffpunkt aller „leidgeprüfter“ Namensträger sein.

Also frisch Gesellen ans Werk! Das ganze Projekt schreit nach der Wikitechnik. So können dann alle Schl??vögter in gewohnter Manier etwas beitragen und das Ganze wächst und wächst. Einfach nur das Paket installieren und mit den Stylesheets rumspielen, das ist keine Herausforderung, sondern eine kleine Fingerübung, die trotzdem Greenpeace und die Zuckerhunde sehr erfreut hat. Unter ¬mediawiki.org findet sich das Paket, das mit dem üblichen tar -zxvf mediawiki* ausgepackt wird.

Doch halt! S?hl??v?igt.com läuft aus historischen Gründen noch als Webhostingpaket bei 1&1. Nachdem das Paket lokal ausgepackt und dann per FTP hochgeladen wurde – das dauert – zeigt es sich, dass so ein Massenhoster nicht die rechte Garage ist. Da läuft noch eine uralte PHP-Version und die Umschaltung via AddHandler x-httpd-php5 .php funzt nicht. Da der safe-Mode eingeschaltet ist, würde der Bildupload nicht klappen, noch weitere, festeingeschaltete Schalter verhindern das Vorankommen. Man kann es so zusammenfassen: in der Gummizelle eines Webhostings laufen wirklich nur ganz anspruchslose Dinge. Deswegen ist's ja auch so billig… (Das zum Thema „Kundenerziehung“)

Nachdem nun das ¬Basispaket läuft, arbeiten wir doch mal das ¬Skin-Kochrezept ab. Das ist des Umfangs überschaubar. Fallstrick ist dann noch der Fall, wenn der Besucher eingeloggt ist. Dann kann er nämlich den Skin ändern und das muss abgeschalotet werden. Sehr hinderlich bei der Entwicklung ist das eingebaute Caching. Änderungen am Template sind nicht sichtbar und bisher ist noch keine Einflußnahme daruf sichtbar. Auch ein watch "touch -r */*" bringt leider nichts.
Beitrag kommentieren

Dienstag, den 13.02.2007 [12:37]
Wie heißt es so schön: Quäle einen Rechner nie zum Scherz, denn er fühlt wie du den Schmerz. Aber heute siegte die Neugier und es war spannend rauszukriegen, wie schnell Linux auf einem Pentium läuft. Grundlage des Spiels ist eine Datensammlung aller Orte dieser schönen Welt. Das sind knapp drei Millionen Datensätze. Die Volltextsuche geht recht flott und die Suche nach benachbarten Orten ist noch überschaubar:

Geht doch! Doch halt – da tauchen verhunzte Zeichen auf. Eine bittige Analyse ergibt, dass in der benutzten GeoIP-Datenbank von Maxmind ein bunter Mix von Zeichencodierungen verwendet wird. Endlich mal eine kleine Aufgabe. Städtenamen, die sich mit europäischen Schriftzeichen darstellen lassen, sind in Latin-1 abgespeichert, alles andere in UTF-8. Der Import muss leider wiederholt werden.

Diesmal wird jeder Text mittels seems_utf8() abgetestet und gegebenenfalls umkodiert. Natürlich dauert jetzt der Import sehr viel länger,weil jeder Text (3MB) auf Bitebene untersucht wird. Aber was soll es…
Beitrag kommentieren

Montag, den 12.02.2007 [23:58]
Auch der Sonntagabend, der in vielen Familien, in denen die Frau die Hose anhat, dem Tatort vorbehalten ist(„Kleine Mädchen mögen Pferde, größere Krimis.“), war nicht unproduktiv. Der vor längerer Zeit entwickelte Unicodeanalysator ist mal so als Fingerübung und als therapeutisches Programmieren verajaxt worden und zeigt nun auch an, was passiert, wenn was mit der Kodierung schiefgelaufen ist.

Gebrauchsanweisung:
Der zu analysierende Text ist in das linke, Eingabefeld zu tippen oder einzukopieren. Rechts erscheint sofort die Auswertung. Jede Zeile entspricht einem erkannten Zeichen. Das entspricht bis auf wenige Ausnahmen (beispielsweise dem ?? im Jiddischen, bei dem das Qamats kein Diakritikum darstellt) einem Zeichen.

Die Spalten beïnhalten bemerkenswerte Infos: ganz links nochmals für Kontrollzwecke das Zeichen. Geht man mit der Maus darüber, wird es vergrößert und verschieblich dargestellt. Daneben erscheint die fortlaufende Unicodenummer, dann kommt die binäre Darstellung in UTF-8-Kodierung. Als Nächstes kommt als Schmankerl der Text, der angezeigt wird, wenn das Ausgabeprogramm fälschlicherweise auf falscher (Windows-)Kodierung steht. Der häufigste Falschfall ist CP1252, der unseelige Windowszeichensatz für Westeuropa. Rechts kommt noch eine kurze textliche Beschreibung des Zeichens.

Da die Unicode-Tabelle über 50000 Zeichen umfasst, ist sie hier als gdbm-Datenbank abgelegt. Das stellt eine kurze Analysezeit sicher. Eine testweise Volltextsuche hat mehrere Sekunden gedauert…

Spannend wäre auch die Rücktransformation „verhunzter“ Texte, in denen kryptische Texte wie äöü vorkommen. Das wäre sicher ein großer Dienst an der Menschheit. Oft wird eine kleine, siebensätzige Übersetzungstabelle verwendet. Sie löst das Problem aber nicht allgemein. Naja, der Winter hat uns noch eine ganze Weile im Griff.

Hier nun der Knotenentwirrer:

Noch besser wäre ein automatische Erkennung. Und voilà! Da ist sie.

Es gibt sie noch trotz aller Unkenrufe: die klassischen Ladengeschäfte mit Bedienung. Heute auf der Suche nach neuen zuën Schuhen (die alten waren kurz vor dem Zerfall) tauchte plötzlich in St. Georg an einer Ecke in der Adenauer Allee Straßburg, Schuhe von Größe 38 bis 50 auf. Drei Kunden – zwei weibliche Entscheidungshilfen: das zeugt doch von hoher Verkaufskultur. Der Trittraum ist minimiert, der Umsatz für Mutter und Tochter wird auf ca. 12 qm generiert. Alle Schuhe, Herrenhemden, Krawatten und Fliegen liegen nur als Muster im sichtbaren Bereich. Jede Interessenbekundung seitens der Kunden (bis zum Zeitpunkt des Abschlusses noch Schmarotzer) löst einen Gang einer der beiden Damen in einen Keller aus. Kurzgefasst hat es über dreißig Minuten gedauert bis Schuh und Hemd „im Sack&ldquo, waren.

Der Beleg wird tatsächlich noch mit einem Durchschreibeblock gebastelt. Das hat so etwas archaisches, wenn dann nach erfolgtem Ausfüllen das Blaupapier weitergeschaufelt wird. Immerhin ist der Beleg schon in Euro gedruckt. Das es so etwas noch gibt!
Beitrag kommentieren  |  2 Kommentare lesen