Semantic search

Jump to navigation Jump to search

ISWC 2008 coming to Karlsruhe

Yeah! ISWC2006 is just starting, and I am really looking forward to it. The schedule looks more than promising, and Semantic MediaWiki is among the finalists for the Semantic Web Challenge! I will write more about this year's ISWC the next few days.

But, now the news: yesterday it was decided that ISWC2008 will be hosted by the AIFB in Karlsruhe! It's a pleasure and a honor -- and I am certainly looking forward to it. Yeah!


Comments are still missing on this post.

Semantic Web and Web 2.0

I usually don't just point to other blog entries (thus being a bad blogger regarding netiquette), but this time Benjamin Nowack nailed it in his post on the Semantic Web and Web 2.0. I read the iX article (a popular German computer technology magazine), and I lost quite some respect for the magazine as there were so many unfounded claims, off-the-hand remarks, and so much bad attitude in the article (and in further articles scuttered around the issue) towards the Semantic Web that I thought the publisher was personally set on a crusade. I could go through the article and write a commentory on it, and list the errors, but honestly, I don't see the point. At least it made me appreciate peer review and scientific method a lot more. The implementation of peer review is flawed as well, but I realize it could be so much worse (and it could be better as well - maybe PLoS is a better implementation of peer review).

So, go to Benji's post and convince yourself: there is no "vs" in Semantic Web and Web 2.0.

Java developers f*** the least

Andrew Newman conducted a brilliant and significant study on how often programmers use f***, and he splitted it on programming languages. Java developers f*** the least, whereas LISP programmers use it on every fourth opportunity. In absolute term, there are still more Java f***s, but less than C++ f***s.

Just to add a further number to the study -- because Andrew unexplicably omitted Python -- here's the data: about 196,000 files / 200 occurences -> 980. That's the second highest result, placing it between Java and Perl (note that the higher the number, the less f***s -- I would have normalized that by taking it 1/n, but, fuck, there's always something to complain).

Note that Google Code Search actually is totally inconsisten with regards to their results. A search for f*** alone returns 600 results, but if you look for f*** in C++ it returns 2000. So, take the numbers with more than a grain of salt. The bad thing is that Google counts are taken as a basis for a growing number of algorithms in NLP and machine learning (I co-authored a paper that does that too). Did anyone compare the results with Yahoo counts or MSN counts or Ask counts or whatever? This is not the best scientific practice, I am afraid. And I comitted it too. Darn.


Comments are still missing on this post.

Meeting opportunities

I read in an interview in Focus (German) with Andreas Weigend, he says that publishing his travel arrangements in his blog helped him meet interesting people and allow for unexpected opportunities. I actually noticed the same thing when I wrote about coming to Wikimania this summer. And those were great meetings!

So, now, here are the places I will be in the next weeks.

  • Oct 18-Oct 20, Madrid: SEKT meeting
  • Oct 22-Oct 26, Milton Keynes (passing through London): Talk at KMi Podium, Open University, on Semantic MediaWiki. There's a webcast! Subscribe, if you like.
  • Oct 30-Nov 3, Montpellier: ODBASE, and especially OntoContent. Having a talk there on Unit testing for ontologies.
  • Nov 5-Nov 13, Athens, Georgia: ISWC and OWLED
  • Nov 15-Nov 17, Ipswich: SEKT meeting
  • Nov 27-Dec 1, Vienna: Keynote at Semantics on Semantic Wikipedia
  • Dec 13-17, Ljubljana: SEKT meeting
  • Dec 30-Jan 10, Mumbai and Pune: the travel is private, but this doesn't mean at all we may not meet for work if you're around that part of the world

Just mail me if you'd like to meet.

RDF in Mozilla 2

I read last week Brendan Eich's post on Mozilla 2, where he said that with Moz2 they hope that they can "get rid of RDF, which seems to be the main source of "Mozilla ugliness"". Danny Ayers commented on this, saying that RDF "should be nurtured not ditched."

Well, RDF in Mozilla always was crappy, and it was based on a pre-1999-standard RDF. No one ever took up the task -- remind you, it's open source -- to dive into the RDF inside Mozilla and repair and polish it, make it a) compatible to the 2004 RDF standard, (why didn't RDF get version numbers, by the way?) and b) clean up the code and make it faster.

My very first encounter with RDF was through Mozilla. I was diving into Mozilla as a platform for application development, which seemed like a very cool idea back then (maybe it still is, but Mozilla isn't really moving into this direction). RDF was prominent there: as an internal data structure for the developed applications. Let's repeat that: RDF, which was developed to allow the exchange of data on the web, was used within Mozilla as an internal data structure.

Surprisingly, they had performance issues. And the code was cluttered with URIs.

I still think it is an interesting idea. In last year's Scripting for the Semantic Web workshop I presented an idea on integrating semantic technologies tightly into your programming. Marian Babik and Ladislav Hluchy picked that idea up and expanded and implemented the work much better than I ever could.

It would be very interesting how this combination could really be put to work. An internal knowledge base for your app that is queried via SPARQL. Doesn't sound like the most performant idea. But then -- imagine not having one tool accessing that knowledge base. But rather a system architecture with a number of tools accessing that knowledge base. Adding data to existing data. Imagine just firing up a newly installed Adressbook, and -- shazam! -- all your data is available. You don't like it anymore? Switch back. No changes lost. Everything is just views.

But then again, didn't the DB guys try to do the same? Yes, maybe. But with semantic web technology, shouldn't it be easier to do it, because it is meant to integrate?

Just thinking. Would love to see a set of tools based on a plugabble knowledge base. I'm afraid, performance would suck. I hope we will see.


Comments are still missing on this post.

Das Stöckchen behalte ich

So. Ich fange das nächste Stöckchen auf, von Buddy. Also los.

Fünf Dinge, die ich nicht habe, aber gerne hätte

  1. Weltfrieden.
  2. Das Semantic Web.
  3. Einen Roman. Selbstgeschrieben, fertig, und mit Verleger. Und richtig gut.
  4. Ein Direktes Neuronales Interface zur Matrix. Ich meine zum Web.
  5. Die Eine Richtige.
  6. Sechs Richtige.
  7. Die Fähigkeit bis Fünf zu zählen.

Die Reihenfolge enspricht nicht der Relevanz.

Fünf Dinge, die ich habe, aber lieber nicht hätte

  1. Keine Ahnung.
  2. Eine schlecht gewartete Website.
  3. Zu wenig Zeit.
  4. Mir wird schlecht, wenn ich Gurken esse.
  5. Ein paar Kilogramm.

Fünf Dinge, die ich nicht habe, aber auch nicht haben möchte

  1. Allzuviel gesunder Menschenverstand.
  2. Verzweiflung.
  3. Langeweile.
  4. Geldsorgen.
  5. Die Falsche.

Fünf Dinge, die ich habe und aus keinem Grund der Welt missen möchte

  1. Schwesterchen.
  2. Freunde.
  3. Meine Doktorandenstelle am AIFB.
  4. Optimismus. Eine Menge.
  5. Musik.

Fünf Menschen, die dies noch nicht beantwortet haben, von denen ich mir das aber wünsche

  1. Der Papst.
  2. Die Bundeskanzlerin. In ihrem nächsten Podcast.
  3. John Lennon.
  4. Lisa Simpson.
  5. Der unbekannte Soldat.

Enjoying dogfood

I guess the blog's title is a metaphor gone awry... well, whatever. About two years ago at Semantic Karlsruhe (that is people into semantic technologies at AIFB, FZI, and ontoprise) we installed a wiki to support the internal knowledge management of our group. It was well received and used. We also have an annual survey about a lot of stuff within our group, to see where we can improve. So last year we found out, that the wiki was received OK. Some were happy, some were not, nothing special.

We switched to a Semantic MediaWiki since last year, which was a labourous step. But it seems to have payed off: recently we had our new survey. The scale goes from very satisfied (56%) over satisfied (32%) and neutral (12%) to unsatisfied (0%) and very unsatisfied (0%).

You can tell I was very happy with these results -- and quite surprised. I am not sure, how much the semantics made the difference, or maybe we did more "gardening" on the wiki since we felt more connected to it, and gardening cannot be underestimated, both in importance and resources. In this vein, very special thanks to our gardeners!

One problem a very active gardener pointed out not long ago was that gardening gets hardly appreciated. How do other small-scale or intranet wiki tackle this problem? Well, in Wikipedia we have the barnstars, and related cool stuff -- but that is basically working because we have an online community and online gratification is OK for that (or do I misunderstand the situation here? I am not a social scientist). But how to translate that to an actually offline community that has some online extensions like in our case?

Berlin, Berlin, ich war jetzt in Berlin...

... und nicht in Olpe. Da fahre ich wohl in ein paar Wochen hin. Aber aus einem ganz anderen Grund. Dafür fliegt Schwesterchen nach Berlin. Aber auch aus einem ganz anderen Grund.

Und Berlin ist sehr wow. Der Reichstag, das Bundeskanzleramt, riesige, beeindruckende Gebäude; die gewaltigen Parks; atemberaubend: das Pergamonmuseum. Einfach unglaublich. Ich habe immer gedacht, der Pergamonaltar wäre halt ein Altar, also ein Steinblock. Niemand hat mir gesagt, dass sie den ganzen Tempel auseinandergeschnitten haben und nach Berlin gebracht haben! Unglaublich. Und dann geht man weiter, tritt durch einen Eingang, und denkt sich, hmm, irgendwie habe ich Blau im Nacken. Und da dreht man sich um, und ist gerade durch das Ischtartor getreten. Und es sieht noch viel beeindruckender aus, als in den Büchern. Ist halt auch etwas größer als in den Büchern.

Und Nofretete ist auch hübsch. Nicht ganz so hübsch wie Ginevra, also bleibt letztere mein Desktop-Hintergrund.

Und das Mauermusuem hat mich mehrfach auf meine Tränendrüse gedrückt. Wahnsinnsgeschichten. Und auf dem Weg zu einem allgemeinem Menschenrechtsmuseum. Mit Info zu Gandhi, zu dem Aufstand in Ungarn, zu den Religionen und ihren Gemeinsamkeiten, und vieles mehr. Aber halt auch: wie ist die Mauer gebaut? Die Helden, die Tunnel bauten. Die Helden, die trotz Befehl nicht auf die Flüchtlinge schossen. Die Helden, die den Stacheldraht hochheben, damit das Kind durchkommt. Die Helden, die stark genug waren, keine Gewalt anzuwenden. Ich weiß nicht, ob ich die selbe Stärke hätte.

Habe auch ein Stück Mauer gekauft. Und weggeschickt. Weil die Mauer muss weg.

Genau.

Ach ja, und die Arbeit war auch cool. Wahrscheinlich eine der coolsten Locations überhaupt: Unter den Linden 1. Direkt an der Museumsinsel.

Apricot ist keine Farbe

Zumindest nicht für Männer. Es gibt aber einen kleinen Anteil Frauen, die vier statt drei verschiedene Zapfen im Auge haben. Dadurch können sie tatsächlich mehr verschiedene Farben sehen (bis zu 100 Millionen verschiedene Farben -- statt nur eine Million bei uns Männern, und den meisten Frauen, nur etwa 2-3% der Frauen sind sogenannte Tetrachromanten). Es sei unvorstellbar, wie das aussehe (ja, das kann ich mir vorstellen, ich meine, nicht vorstellen).

Blöd. Ich fühle mich jetzt voll benachteiligt. Gott ist doch Sexist, verflixtnochmal.

Wetten, dass...

„Hast Du die Titelseite gesehen? Schon wieder eine Story über den 11. September…“
„Weißt Du, solange es noch um 2001 geht, ist doch alles in Ordnung.“
„Das ist doch nur für die Medien. Meinst Du, die schlagen wieder zu?“
„Zum Jahrestag?“
„Ja. Wäre doch der Hammer.“
„Ich weiß nicht. Das ist sicher zu vorhersagbar. Alle werden vorbereitet sein.“
„Eben! Stell Dir vor, das gelingt ihnen! Damit zeigen sie, wie fett sie sind.“
„Ja, schon, aber ich glaube, es klappt nicht.“
„Ich würde wetten…“
„Was?!“
„50 Euro. Am 11. September kommt es zu einem weiteren Anschlag.“
„Diesen Jahres?“
„Ja.“
„Ich weiß nicht…“
„Na gut, ich gewinne nur, wenn es mehr als 200 Tote gibt, sonst zählt es nicht.“
„Hmm… abgemacht.“

* * *

… die Polizei war abgelenkt durch einen Bombenalarm im Hauptbahnhof … wegen einem vergessenen Koffer… ein terroristischer Hintergrund … eine Reihe von Explosionen erschütterte das Brandenburger Tor, bevor es schließlich in sich zusammenstürzte … die ersten Schätzungen gehen von mehr als 100 Toten aus … die wollen doch Krieg! Dann geben wir ihnen Krieg! … niemand hätte erwartet, dass ausgerechnet Deutschland … die Bundesregierung wurde in Sicherheit gebracht … die ganze Nation konnte zusehen, wie das Brandenburger Tor … vermutet Al-Quaida … wurde eine Moschee angegriffen … Live Schaltung nach Washington … uneingeschränkte Solidarität mit unseren deutschen Brüdern und Schwestern … tiefe Bestürzung … einziges Ziel der sukzessiven Explosionen war, den Fernsehteams genug Zeit … bestätigt, dass es bislang 200 Todesopfer gab, und eine weitere Frau noch um ihr Leben kämpft …

* * *

Er zündete sich eine Zigarette an. Seine Finger zitterten. Er stand im Treppenhaus des Hospitals. Hier durfte er rauchen. Und die Ruhe genießen. Das dauernde piep, piep, piep zehrte an seinen Nerven. Seine Mutter. Seine Mutter kämpfte um das Leben.
Die Tür ging auf. Sein bester Freund stand da, schaute etwas blass. Er holte seinen Geldbeutel raus, und drückte ihm zwei Zwanziger in die Hand.
„Fehlen noch Zehn. Kriegst Du morgen im Club.“

Er stieg die Treppe runter. Die Tür unten schloss mit einem lauten, tiefen Schlag.

Noch ein Stöckchen

Diesmal von Schwesterchen.

Wann stehst Du zur Arbeit auf?

Sehr unterschiedlich. Manchmal erst zu Mittag, manchmal um 5:45.

Stehst Du rechtzeitig auf oder bleibst Du bis zur letzten Minute liegen?

Ich bleibe so lange liegen wie möglich.

Wie viele Wecker hast Du?

Einen. Seit meiner Grundschulzeit der selbe. So eine grüner, würfelförmiger Plastikradiowecker mit roter LED-Digitalanzeige.

Machst Du Frühsport?

Sollte ich mal anfangen.

Frühstückst Du? Wenn ja, was?

Meistens. Habe gehört, dass es gesund sein soll.

Wie fährst Du zur Arbeit?

Zunächst mit der U-Bahn zum Hauptbahnhof, dann von dort aus mit dem IC nach Karlsruhe, dort mit der Bahn zur Uni. Und das heute seit genau 2 Jahren. Habe Jubiläum :)

So, das Stöckchen gebe ich jetzt, nachdem es erledigt ist, Pflichtgemäß an Ralf und Cindy weiter. Ich gehe davon aus, dass wir Arbeit durch Uni ersetzen können. Außerdem sollte Cindy mal wieder was schreiben.

Hmm, eigentlich würde ich bei Ralf ja gerne den Blogeintrag verlinken, in dem er antwortet. Da dieser aber noch nicht geschrieben ist, geht das nicht. Blödes Web. Sollte man mal was erfinden. Ich kann ja raten, wo die Antwort auf dieses Stöckchen sein wird.

Das Lied vom Herrn Baron

Das Diadem von Elfenhand ist ein DSA Abenteuer von mir, welches in der Abenteuersammlung Leicht verdientes Gold erschienen ist. In dem Abenteuer spielt ein Lied eine wichtige Rolle, und so wurde es das erste (und bisher einzige) DSA Abenteuer mit Noten (Apropos Noten: wer es gespielt hat, kann auf dem Wiki Aventurica seine Meinung dazu abgeben - auch als Spielleiter)

So, hier ein besonderer Autorenservice (nachdem ich heute wieder mal nach der Melodie gefragt wurde), das Midi file zu Der Baron.

Viel Spaß bei dem Abenteuer! Ganz klar mein bestes DSA Abenteuer (bisher... ;)

Geht doch

Kroatien besiegt den Fußballweltmeister Italien 2:0. Gestern abend. Im Fußball.

Semantic MediaWiki officially Beta

Semantic MediaWiki has gone officially Beta. Markus Krötzsch released Version 0.5 yesterday -- download it at Sourceforge and update your installation!

Markus and I are both busy today updating existing installations (and creating new ones -- greetings towards California!). The new version has several new features:

  • One can reuse existing Semantic Web vocabulary, like FOAF. This feature is used so strongly, it led to Swoogle actually believing, FOAF was defined at ontoworld!
  • The unit code was improved a lot -- one can define linear units now from inside the wiki. Africa has a list of all African countries, and you can see their size neatly listed.
  • New datatypes for URLs and Emails.
  • Better code (why we dare to call us Beta)

Check out the new features on ontoworld. Thanks for Markus and S for the coding marathon this weekend, that allowed to make this new release! We are fetching bugs now, and planning 0.6, and our first big stress tests, with lots and lots of data...


Comments are still missing on this post.

Volver

Pedro Almodóvar macht mal wieder einen Film, und natürlich wird er schön. Wo La mala educación auf schöne Männer setzte, spielen diesmal Frauen die Hauptrolle. Und Nebenrollen. Eigentlich, alle Rollen. In Volver, wie schon in La mala educación, sind Männer nur diejenigen, die Unheil über die Welt bringen. Frauen sind diejenigen, die danach alles verkomplizieren. Äußerst scharfsinnige Beobachtung.

Die Geschichte ist so schön kompliziert und verkorkst, dass sie schon fast wahr sein muss. Der Vergangenheit kann man nicht entfliehen, sie holt dich immer wieder ein -- vielleicht ist das die Hauptaussage des Films. Paul Valéry sagte mal, dass wir der Zukunft mit dem Rücken voran entgegengehen, dass wirnicht sehen, was uns erwartet, sondern nur das, was in der Vergangenheit geschehen ist. Und genau so handeln die Helden hier. Wann auch immer es um die Zukunft geht, verschieben sie das Gespräch auf morgen. Sie möchten die Gegenwart meistern. Die Vergangenheit überwinden. Und erst dann sehen wir weiter.

Passend dazu stellt der Film auch die morbide Faszination der Spanier mit dem Tod dar, vor allem in den kleinen Orten. Aber warum das Bild mit den Windmühlen? Teilweise wurde es in der Mancha aufgenommen, wo auch ein anderer Held, der mit Windmühlen zu tun hatte, herstammt. Doch scheint mir, rennt in diesem Film keiner gegen Windmühlen an. Bei solchen Szenen habe ich immer das Gefühl, etwas verpasst zu haben. Na was soll's, der Film war auch so schön genug.

Drama. Komplizierte Familienkiste, bei der der nächste Schritt ein wenig zu leicht zu durchschauen ist (aber das ist ja bei jeder realistischen Familienkiste so), dafür aber der übernächste Schritt meist noch eine Überraschung bereithält. Sehenswert.

ACM Review II

Thanks to Mary-Lynn Bragg for answering my complaint about non-accessible reviews so quickly. She sent me the review to read, and I was quite happy with it. Michael Lesk, one of the guys who built Unix, wrote the review, and recommended it to "designers of volunteer or collaborative systems and [...] those studying cooperative work." Thanks, Michael, thanks Mary-Lynn.

Sooo -- read our straightforward and easy to read paper! :)

By the way -- I still think ACM Computing Reviews should offer their reviews for free to the public. This would increase the impact of their reviews dramatically, and also the impact of the reviewed papers.

Schlagzeuger sind ersetzlich

Durch Maschinen. Diese Studie zeigt eine solche Möglichkeit.

Im ernst, wer Percussion mag, wird sicher dieses Video sehr cool finden. Und wer Musik mag auch. Oder Computerzeichentrick. Ich habe gelesen, dass das Programm, welches das Video erzeugt hat, ein beliebiges Midi reinladen konnte. Man musste dann nur noch die Kameraschwenks und Perspektiven bestimmen. Wow.

Weitere solche Videos bei Google. Die Animusic DVD gibt es auch, in deutlich besserer Qualität, zu kaufen.

Besser spät als nie

Auch ich fang das Stöckchen. Wenn auch spät.

Warum bloggst du?

Weil ich manchmal glaube, etwas sagen zu können, das unterhält, nachdenken lässt, erinnert, berührt, zum lachen bringt, informiert, oder auch einfach nur die Zeit etwas angenehmer vorbeigehen lässt.

Seit wann bloggst du?

Nodix gibt es seit dem 15. Januar 2001. Das erste Mal, dass ich das ganze einen Blog nannte, und auch das Aussehen der Seite den üblichen Blogstandards anpasste, war erst am 21. August 2002, als die ersten 10000 Besucher zusammengekommen waren.

Selfportrait?

Eingebildet (glaubt, gut zu sein), verrückt (Arbeitet auch am Wochenende, und hat Spaß dabei), sich in Details verlierend (und dadurch nicht das tun, was er tun sollte), großspurig (die Menschheit retten wollen, und auch zu glauben, es zu können), dickköpfig (lässt sich schwer umüberzeugen), alles machen wollen (und auch von anderen das selbe verlangen), zu selten das Partizip benutzen (es sollte benutzend heißen), und Wikipedianer (behauptet zumindest die Wikipedia).

Ansonsten findet sich unter Denny eine bessere Beschreibung.

Warum lesen Deine Leser Deinen Blog?

Weil ich hin und wieder das schaffe, was ich in Punkt 1 schreibe. Außerdem schreibe ich so selten, dass die meisten Leser dafür nicht sonderlich viel Zeit brauchen.

Welche war die letzte Suchanfrage, über die jemand auf Deine Seite kam?

gutes karma

Das finde ich aber sehr erfreulich: sucht man bei Google.de nach gutem Karma, kommt man zu mir (Platz 3!)

Welcher Deiner Blogeinträge bekam zu Unrecht zu wenig Aufmerksamkeit?

Oh, ich dachte nicht dass Blogeinträge ein Recht auf Aufmerksamkeit haben. Aber wenn man mich so fragt... dass Männer schlauer als Frauen sind, wurde in diesem Blog schon behauptet, mit eben so viel Recht. Ansonsten schlägt auch das Risiko Alter in eine ähnliche Kerbe. Und dann bleibt noch mein liebster Blogeintrag, über das Pendeln.

Dein aktuelles Lieblings-Blog?

nakit-arts. Oh, ich meine be croative!. Da bleibe ich auf dem Laufenden, was daheim passiert, auch wenn ich nicht daheim bin.

An welche vier Blogs wirfst du das Stöckchen weiter und warum?

Uh, ich glaube, Blogger, die ich kenne, haben das Stöckchen schon gefangen. Ich werfe die jetzt einfach mal in die Luft, mal sehen, wer fängt! Linkt hierher, wenn ihr das Stöckchen gefangen habt!

Wikimania 2006 is over

And it sure was one of the hottest conferences ever! I don't mean just because of the 40°C/100°F that we had to endure in Boston, but also because of the further speakers there.

Brewster Kahle, the man behind the Internet Archive, and who started Alexa and WAIS Inc., told us about his plans to digitalize every book (just a few Petabytes), every movie (just a few Petabytes), every record (just a... well, you get the drill), and to make a snapshot of the web every few months, and archive this. Wow.

Yochai Benkler spoke about the Wealth of Networks. You can download his book from his site, or go to a bookstore and get it there. The talk was really inviting to read it: why does a network thingy like Wikipedia work and not suck? How does this change basically everything?

Next day, there was Mitch Kapor, president of the Open Source Application Foundation -- and I am really sorry I had to miss his talk, because at the same time we were giving our workshop on how to reuse the knowledge within a Semantic MediaWiki in your own applications and websites. Markus Krötzsch, travel companion and fellow AIFB PhD student, and basically the wizard who programmed most of the Semantic MediaWiki extension, totally surprised me by being surprised about what you can do with this Semantic Web stuff. Yes, indeed, the idea is to be able to ask another website to put stuff up on yours. And to mush data.

There was David Weinberger, whose talk made me laugh more than I had for a while (and I am quite merry, usually!). I still have to rethink what he actually said, contentwise, but it made a lot of sense, and I took some notes, it was on the structure of knowledge, and how it changes in the new world we are living in.

Ben Shneiderman, the pope on visualization and User Interfaces had an interesting talk on visualizing the Wikipedia. The two talks before his, by Fernanda Viegas and Martin Wattenberg, were really great, because they have visualized real Wikipedia data -- and showed us a lot of interesting data. I hope their tools will become available soon. (Ben's own talk was rather a bit disappointing, as he didn't seem to have the time to take some real data, but only used fake data to show some general possible visualizations. As i had the chance to see him in Darmstadt last year anyway, I didn't see much new stuff).

The party at the MIT Museum was great! Even though I wasn't allow to drink, because I forgot my ID. I'd never think anyone would consider me looking younger than 21. So I take this as the most sincere compliment. Don't bother explaining they had to check my ID even if I looked 110, I really don't want to hear :) I saw Kismet! Pitily, he was switched off.

Trust me. I was kinda tired after this week. It was lots of fun, it was enormously interesting. Thanks to all the Wikipedians, who made Wikipedia and Wikimania possible. Thanks to all these people for organizing this event and helping out! I am looking forward to Wikimania 2007, wherever it will be. The bidding for hosting Wikimania 2007 are open!

Angeblich kritisch

Die Geschichte von Epic. Der Film ist schon etwas älter (äh, 2005?), jetzt aber endlich in einer hervorragenden deutschen Übersetzung zu haben.

Es geht darum, wie sich das Internet weiterentwickeln könnte. Eine recht spannende Version.

ACM Review

ACM Computing Reviews reviewed our paper on the Semantic Wikipedia. Yay! Pitily, I can't read the review because I need a login.

Would love to see what they're saying, but I guess it's not meant to be open to the public. Or to the authors.


Comments are still missing on this post.

Maybe the hottest conference ever

The Wikipedia Hacking Days are over. We have been visiting Siggraph, we had a tour through the MIT Media Lab, some of the people around were Brion Vibber (Wikimedia's CTO), Ward Cunningham (the guy who invented wikis), Dan Bricklin (the guy who invented spreadsheets), Aaron Swartz (a web wunderkind, he wrote the RSS specs at 14), Jimbo Wales (the guy who made Wikipedia happen), and many other people. We have been working at the One Laptop per Child offices, the office to easily the coolest project of the world.

During our stay at the Hacking Days, we had the chance to meet up with the local IBM Semantic Web dev staff and Elias Torres, who showed us the fabulous work they are doing right now on the Semantic Web technology stack (never before rapid application deployment was so rapid). And we also met up with the Simile project people, where we talked about connecting their stuff like Longwell and Timeline to the Semantic MediaWiki. We actually tried Timeline out on the ISWC2006 conference page, and the RDF worked out of the box, giving us a timeline of the workshop deadlines. Yay!

Today started Wikimania2006 at the Harvard Law School. was not only a keynote by Lawrence Lessig, as great as expected, but also our panel on the Semantic Wikipedia. We had an unexpected guest (who didn't get introduced, so most people didn't even realize he was there), Tim Berners-Lee, probably still jetlagged from a trip to Malaysia. The session was received well, and Brion said, that he sees us on the way of getting the extension into Wikipedia proper. Way cool. And we got bug reports from Sir Timbl again.

And there are still two days to go. If you're around and like to meet, drop a note.

Trust me — it all sounds like a dream to me.


Comments are still missing on this post.

At Wikimania 2006

I am here in Boston now, walking the sacred grounds of Harvard and MIT, and listening and talking with the great people who created the MediaWiki software that runs Wikipedia. At Thursday, Markus and I will host the Semantic Wikipedia panel, where we present the state of our implementation, and talk about how to make it real. We also have a tutorial on Sunday, about how to reuse knowledge from a Semantic MediaWiki.

If you're around Boston, MIT, Harvard, or if you even attend Wikimania and the Hacking Days, and want to meet -- contact me!


Comments are still missing on this post.

An wen...

...erinnert mich nur dieser Chatbot?

ESWC2006 is over

I have been the week in Budva, Montenegro, at the ESWC2006. It was lovely. The keynotes were inspiring, the talks had a good quality, and the SemWiki workshop was plain great. Oh, and the Semantic Wikipedia won the best poster award!

But what is much more interesting is the magic that Tom Heath, the Semantic Web Technologies Co-ordinator, managed: the ESWC website is a showcase of Semantic Web technologies! A wiki, a photo annotation tool, a chat, a search, a bibliography server, a rich semantic client, an ontology, the award winning flink... try it out!

Now I am in Croatia, and taking my first real break since I started on the Semantic Web. Offline for three weeks.

Yay.

Daheim

Nach einer Woche in Montenegro bin ich jetzt in Kroatien angekommen. Und genieße.

Offline.

OWL luna, nicer latex, OWL/XML to Abstract Syntax, and more

After a long hiatus, due to some technical problems, finally I could create a new version of the owl tools. So, version 0.27 of the owl tools is now released. It works with the new version of KAON2, and includes six months of bug fixing, but also a number of new features that have introduced a whole new world of new, exciting bugs as well.

The owl latex support was improved greatly. Translation of an owl ontology is done now more careful, and the user can specify much more of the result than before.

A new tool is owl luna - luna like local unique name assumption. It adds an axiom to your ontology that states that all individuals are different from each other. Due to most ontology editors not allowing to do this automatically, here you find a nice maintenance tool to make your ontology much less ambiguous.

The translations of OWL/RDF to OWL/XML and back have been joined in one new tool, called owl syntax, that allows you to translate owl ontologies also to OWL Abstract Syntax, a much nicer syntax for owl ontologies.

owl dlpconvert has been extended as it now also serialzes it results as RuleML if you like. So you can just pipe your ontologies to RuleML.

So, the tools have both become sharper and more numerous, making your toolbelt to work with owl in daily life more usable. Get the new owl tools now. And if you peek into the source code, the code has underwent a major clean up, and you will also see the new features I am working on, that have to do with ontology evaluation and more.

Have fun with the tools! And send me your comments, wishes, critiques!

Weltuntergang

Gestern war der 6.6.6.

Und die Welt ist doch nicht untergegangen. Da muss für so manchen Zahlenmystiker die Welt untergegangen sein.

(Übrigens war schon zum zweiten Mal der 6.6.6. Vor 1000 Jahren hat das mit dem Weltuntergang auch nicht geklappt.)

WWW2006 social wiki

18 May 2006

The WWW2006 conference next week has a social wiki. So people can talk about evening activities, about planning BOF-Sessions, about their drinking habits. If you're coming to the conference, go there, make a page for yourself. I think it would be fun to capture the information, and to see how much data we can get together... data? Oh, yes, forgot to tell you: the WWW2006 wiki is running on Semantic MediaWiki.

Yay!

Let's show how cool this thing can get!

Semantic Mediawiki 0.4 - Knowledge Inside!

15 May 2006

Until now, Semantic MediaWiki was kind of a nerds project. Yes, you could get a lot of information out in RDF, and actually, I used it as an RDF editor more than once -- but heck, what normal person needs that?

Now, with the freshly implemented feature, the advantages of a Semantic MediaWiki over a normal MediaWiki should become obvious: you can simply ask the wiki for stuff! Wiki, what are the 10 biggest city in the US? Put a list here. Or, wiki, what is the height of the current German chancellor? Put the info here. I have made a writeup on those inline queries on our demo wiki. Go there, read it.

But a lot of other things made it into the 0.4 release. Here's Markus' list:

  • Improved output for Special:Relations and Special:Attributes: usage of
  • relations and attributes is now counted
  • Improved ontology import feature, allowing to import ontologies and to update existing pages with new ontological information
  • Experimental suport for date/time datatype
  • More datypes with units: mass and time duration
  • Support for EXP-notation with numbers, as e.g. 2.345e13. Improved number formating in infobox.
  • Configurable infobox: infobox can be hidden if empty, or switched off completely. This also works around a bug with MediaWiki galeries.
  • Prototype version of Special:Types, showing all available datatypes with their names in the current language setting.
  • "[[:located in::Paris]]" will now be rendered as "located in [[Paris]]"
  • More efficient storage: changed database layout, indexes for fast search
  • Code cleaned up, new style guidelines
  • Bugfixes, a lot of Bugixes

Thanks to everyone who contributed and still contributes to the project! And, connected to this, thanks to the answers to my last blog entry -- I will write more on this tomorrow.

Need help with SQL

11 May 2006

But I have no time to write it down... I will sketch my problem, and hopefully get an answer (I've started this blog in the morning, and now I need to close it, cause I have to leave).

Imagine I have following table (a triple store):

Subject Predicate Object
Adam yahoo im adam@net
Adam skye adam
Berta skype berta

How do I make a query that returns me the following table:

Subject o1 o2
Adam adam@net adam
Berta - berta

The problems are the default value in the middle lower cell. The rest works (as maybe seen in the Semantic Mediawiki code, file includes/SMW_InlineQueries.php -- note that the CVS is not up to date for now, because SourceForge's CVS is down for days!)

It should work in general, with as many columns as I like on the answer table (based on the predicates in the first one).

Oh, and if you solved this -- or have an idea -- it would be nice if it worked with MySQL 4.0, i.e. without Subqueries.

Any ideas?


Comments are still missing on this post.

Rom mit vielen Gesichtern

10 May 2006

Man läuft durch Rom, und man sieht, es ist die Stadt der Päpste. Überall finden sich gigantische Marmorplatten, auf denen erklärt wird, dass diese(r/s) Platz / Kirche / Gebäude / Monument / Brunnen / Brücke von Seiner Heiligkeit, P.M. (nicht etwa Prime Minister, sondern Pontifex Maxmimus) Soundso dem Sounsovielten gemacht wurde, im Jahre 12. Das heißt natürlich nicht etwa, dass das Ding knapp 2000 Jahre alt ist, sondern bezeichnet das 12. Jahr seines Papstseins. Es gibt sogar eine riesige Platte auf dem McDonalds gegenüber vom Pantheon, die auf -- Erinnerung ist schwach -- glaube Leo XII. verweist. Das Mc-Symbol ist da deutlich dezenter. Wieviele Fastfoodketten haben das noch?

Dann läuft man weiter, und entdeckt auch, dass Rom die Stadt eines antiken Imperiums ist. Das Kollosseum (gigantisch!), das Forum Romanum, das Pantheon natürlich, das Mausoleum von Kaiser Hadrian, heute Castel St Angelo, die Statuen überall. Atemberaubend.

Dann läuft man weiter, und entdeckt dass es auch die Stadt Berninis, der die Stadt in der Renaissance wieder wachküsste, und sie in eine Stadt der Brunnen verwandelte. Überall fließt Wasser, wohlgemerkt, allesamt Trinkwasser, was vor allem an den heißeren Tagen sehr beliebt ist, das Plätschern, die wunderschönen Parkanlagen (wirklich atemberaubend mit ihren künstlichen Seen und natürlichen Hügeln, und darauf die jahrhundertealten Bäume).

Und dann läuft man weiter, und man sieht, dass es auch die Stadt der Regierung eines modernen Italiens ist. Der Palast des Präsidenten, mit den wohl coolsten Wächteruniformen überhaupt (vergesst die Uniformen der Schweizer Garde, die von einem gewissen Michelangelo designt wurden). Lange, wehende Mäntel, große blitzende Knöpfe, und ein Ritter, der im Eingang steht, weit hinten, im Dunkeln, und sich nie bewegt, auf sein Schwert gestützt, mit einem großen Helm. Denke nicht, dass er gegen einen Bewaffneten mit 'ner Schusswaffe auch nur den Hauch einer Chance hätte, aber er sieht so morsmäßig cool aus!

Und schließlich, nach dem vielen Gelaufe, wird es dunkel, und dann merkt man, dass Rom auch eine Stadt der jungen Leute ist, mit unzähligen Kleinen und manchen Großen Bars, und viel Leben auf der Straße. Rom hat unglaublich viele Gesichter, aber ich nehme an, in einer Stadt mit 2800 Jahren Geschichte sammelt sich halt mit der Zei was an...

Semantic Web Summer School 2006

The Summer School for the Semantic Web and Ontological Engineering is an annual event that brings together PhD students from all over the world and some of the brightest heads in the Semantic Web, to teach, to socialize, to learn, and to have fun. This year's invited speakers are Jim Hendler himself, and Enrico Motta, Stephan Baumann, Guus Schreiber, and the tutors are John Domingue, Asun Gomez-Perez, Jerome Euzenat, Sean Bechhofer, Fabio Ciravegna, Aldo Gangemi. You will learn a lot. You will have lots of fun. The place is really beautiful, the girls, well at least last year, were really beautiful, the stuff we learned was interesting, and inspired quite some cooperation further on. And it's really great for getting to know a lot of people: at the next conference you're guaranteed to meet someone again, and thus it is also a perfect possibility ot get into the community.

The deadline is May 1st, so be sure to go over to the SSSW2006 website and sign up.

If this didn't convince you, take a look at my series of posts about last year's summer school.


Comments are still missing on this post.

Research visit

So, I have arrived for my very first longer research visit. I am staying at the Laboratory of Applied Ontologies in Rome. I have never been to Rome before, and all my type of non-work experience I'll chat about in my regular blog, in German. Here I'll stick to Semantic Stuff and such.

So, if you are nearby and would like to meet -- give me a note! I am staying in Rome up to the WWW, i.e. up to May 20th. The plan is to work on my dissertation topic, Ontology Evaluation, especially in the wake of the EON2006 workshop, but that's not all it seems. People are interested in and knowledge about Semantic Wikis as well. So there will be quite a lot stuff happening in the next few weeks -- I'm excited about it all.

Who knows what will happen? If my plan works out, at the end of the stay we will have a common framework for Ontology Evaluation. And I am not talking about this paper frameworks -- you know, that are presented in papers with titles starting "Towards a..." or "A framework for...". No, but real software, stuff you can download, and play with.

Preisschock

Innerlich beschwerte ich mich über das teure Zimmer. Gestern erfuhr ich, wieviel es eigentlich kostet -- schlappe 165 Euro pro Nacht. Das Ding ist winzig! Nein, versteht mich nicht falsch -- die Leute sind echt nett, es ist gemütlich, es ist sauber, es ist hervorragend gelegen. Aber 165 Euro pro Nacht für nichtmal 8 Quadratmeter, inklusive Badezimmer und Wandschrank? Ich meine, 1 Euro pro Stunde und Quadratmeter?

Dann bin ich lieber ruhig und bedanke mich für den Preis, den mein Gastgeber am Institut mir organisiert hat.

Ankunft

Ich hoffe, der Steuerzahler weiß zu schätzen, dass ich mich gestern für ihn richtig aufgeopfert habe. Wie gesagt, das Hotel hatte mir angeboten, mich mit einer Limo vom Flughafen abzuholen, mit Schildchen, wo mein Name draufsteht usw., das ganze Programm.

Das kostete mir zuviel, also fuhr ich mit der Bahn zum Römischen Hauptbahnhof Termini. Von dort hätte ich ja auch ein Taxi nehmen können - doch, woran erkennt man in Rom die legalen Taxis? Und um Termini herum, so heißt es, sei das schlechte Viertel von Rom.

Also ab in die Metro (übersichtlich, zwei Linien, ein Ost-West (blau) und eine Nord-Süd (rot), zwei Haltestellen) und dann zu Fuß weiter. Auf der Karte sah das nach etwa einem Kilometer aus, also solte es doch kein Problem sein. Mein Gedächtnis ließ mich nicht im Stich, den Weg fand ich.

Nur ein Kilometer ist mir 30 Kilo Gepäck doch deutlich weiter als gedacht... und das war auf der Karte nicht eingezeichnet. Ich brauchte für die Strecke tatsächlich eine Stunde, mein Rücken tat weh, meine Handflächen brannten, ich war durstig und kaputt. Ohne Handschuhe hätte ich mir die Hände wundgescheuert. Immerhin, das Wetter war angenehm kühl, schattig und windig.

Dafür schlief ich zunächst mal 12 Stunden durch. Wow. Mache ich sonst nie. Jetzt bin ich erholt und bei der Arbeit. Und es macht Spaß.

Abflug

Ich habe Schwesterchen versprochen, regelmäßig aus Rom zu berichten. Wobei ich noch keine Ahnung habe, wie ich in Rom überhaupt verbunden sein werde, mit dem Netz.

Aber von vorne -- warum verschlägt es mich überhaupt in die Ewige Stadt? Es geht dabei um das Thema meiner Doktorarbeit, herauszufinden, was eine gute Ontologie ist. Zugegeben, ich weiß erst seit kurzem, was eine Ontologie überhaupt ist -- und jetzt will ich wissen, wann eine gut ist und wann nicht? Soviel zu hohen Zielen. Jedenfalls gibt es weltweit nicht so wahnsinnig viele Experten auf diesem Gebiet, und einer davon -- der geneigte Leser wird es sicher bereits erahnen -- sitzt in Rom.

So jedenfalls kommt es, dass ich für ein paar Wochen nach Rom fahre, und wir zusammen an diesem Thema arbeiten werden. Die Arbeitsergebnisse werden sich auf Semantic Nodix finden, hier hingegen private Eindrücke und Erlebnisse.

Wie zum Beispiel, dass ich furchtbar nervös bin. Ich realisierte, dass ich noch nie so lange weg von daheim war (wobei ich großzügig daheim als sowohl Stuttgart als auch Brač zähle). Aber ich freue mich auch sehr darauf. Ich war noch nie in Rom. Und kann kein Italienisch. Aber ich habe mir auf Wikitravel schon zahlreiche Informationen über Rom eingeholt, also kann auch gar nichts schief gehen. Da habe ich etwa erfahren, dass der Bahnhof Termini, an dem ich ankomme, berühmt für seine hohe Kriminalität ist. Und dass der Flughafen Leonardo da Vinci zu weit weg ist, um ein Taxi zu nehmen. Das Hotel hat mir jedenfalls einen Limousinenservice angeboten, für läppische 55 €. Habe ich dann doch abgelehnt, mit dem Zug kostet es nur Neuneinhalb. Und es gibt auch, so wie in Sofia, betrügerische Taxen, die ohne Lizenz und zu horrenden Preisen fahren. Oder man wird von Horden von Kindern angefallen, die einem dann die Geldbörse entwenden. Bester Trick: nicht wie ein Tourist aussehen. Stelle ich mir schwierig vor, wenn ich gerade mit Rucksack und zwei Koffern ankomme.

So, wie gesagt, da ich nun informiert bin, kann ich ja ganz beruhigt hinfahren. Es wird sicher sehr schön.

Semantic Mediawiki 0.3

Yay! Markus "the Sorcerer" Krötzsch finished the new release of Semantic MediaWiki today. The demo website is already running version 0.3 for a while.

I'll let Markus speak:

I am glad to finally announce the official release of Semantic MediaWiki 0.3, available as usual at http://sourceforge.net/projects/semediawiki/. The final 0.3 is largely equivalent to the preview version that is still running on wiki.ontoworld.org -- the latest changes mainly concern localization.

Semantic MediaWiki 0.3 now runs on MediaWiki 1.6.1 that was released just yesterday. Older versions of MediaWiki should also work but upgrading is generally recommended.

The main new features of 0.3 are:

  • support for geographical coordinates (new datatype),
  • improved user interface: service links for JScript tooltips, CSS layout,
  • OWL/RDF export of all annotation data,
  • simplified installation process (including special page for setup/upgrade),
  • (almost) complete localization; translations available for English and German,
  • better MediaWiki integration: namespaces, user/content language, support for MediaWiki 1.6,
  • specials for displaying all relations/attributes,
  • experimental (OWL/RDF) ontology import feature,
  • and, last but not least, we also fixed quite some bugs.

The next steps towards 0.4 will probably be the inclusion of query results into existing pages, date/time support, and individual user settings for displaying certain datatypes. We also will have another look at ways of hiding the annotations from uninitiated users.

Have fun.

Markus

P.S.: I am not available during the weekend. Upgrading existing wikis should work (it's what we do all the time ;), but be aware that there is not going to be much support during the next three days.


Comments are still missing on this post.

CeBIT

Am Wochenende war ich auf der CeBIT arbeiten. Wir stellten am Stand des BMBF Ergebnisse des AIFB vor. Einige interessante Besucher dagehabt, aber auch am Sonntag die Chance genutzt, ein wenig über die Messe zu wandern. Ich war zum ersten Mal da.

Zunächst mal: riesig groß, mit viel, viel, richtig viel freie Fläche zwischen den Messehallen. Ich meine, schaut es euch selber an. Und von der Expo 2000 sind noch ein paar nette Gebäude übrig geblieben. Groß heißt aber auch weite Wege. Meine Füße...

Und, was gab es cooles? Nein, ich werde jetzt nicht über die ganzen Semantischen Technologien reden, die es auf der CeBIT gab (Semantic Talk, oder Gnowsis, oder, halt uns), sondern drei andere Impressionen.

Erstens: Demo von Windows Vista gesehen. Positiv überrascht. Nicht nur dass es fast so cool wie MacOS X aussieht, die Metadatenfähigkeit wirkt auch überraschend zugänglich. Aber dennoch, das neu Interface ist echt fesch.

Zweitens: einen 102" Flachbildschirm gesehen. Wow. Und darauf lief der Trailer für X-Men 3. Doppelwow. Ich weiß gar nicht was jetzt cooler war.

Drittens: neben uns saßen Forscher vom Fraunhofer, die das AMI Projekt vorstellten. Eines der Projektergebnisse war eine Kamera, die alle Teilnehmer eines Meetings aufnimmt. Sie findet dabei automatisch die Gesichter in einem Bild, und insbesondere ob sie gerade sprechen, ob sie lächeln, nicken, etc. Sie hatten zur Demonstration vier Plüschtiere zum Meeting hingesetzte, und an dreien wurde auch zuverlässig das Gesicht entdeckt. Am vierten nicht -- ein nachtschwarzer Maulwurf. Da fragte ich, ob es denn auch bei unterschiedlichen Hautfarben klappe, wie eben etwa bei schwarzer Haut. Ja, überhaupt kein Problem, es ist sogar einfacher mit Menschen als mit dem ganzen Plüschzeug, weil Menschen alle die selbe Hautfarbe haben. Nur die Intensität sei unterschiedlich. Aber die Farbe, die ist bei allen gleich.

Was man mit Computern alles lernen kann.

Good ontologies?

We have asked you for your thoughts and papers. And you have sent us those -- thank you! 19 submissions, quite a nice number, and the reviewing is still going on.

Now we ask you for your results. Apply your evaluation approaches! We give you four ontologies on the EON2006 website, and we want you to take them and evaluate them. Are these ontologies good? If they are, why? If not, what can be changed? We want practical results, and we want to discuss those results with you!. So we collected four ontologies, all talking about persons, all coming from very different background and with different properties. Enough talking -- let's get down and make our hands dirty by really evaluating these ontologies.

The set is quite nice. Four ontologies. One of them we found over rdfdata.org, a great resource for ontologies, some of them I would have never found myself. We took a list of Elvis impersonators. One person edited the ontology, it is about a clear set of information, basically RDF. The second ontology is the ROVE ontology about the Semantic Web Summer School in Cercedilla last year. It was created by a small team, and is richly axiomatized. Then there is the AIFB ontology, based on the SWRC. It is created out of our Semantic Portal in the AIFB , and edited by all the members of the AIFB -- not all of them experts in the SemWeb. Finally, there's a nice collection of FOAF-files, taken from all over the web, and to be meshed up together and evaluated as one ontology, created with a plethora of different tools, by more than a hundred persons. So there should be an ontology fitting to each of the evaluation approaches.

We had a tough decision to make when choosing the ontologies. In literally the last moment we got the tempting offer to take three or four legal ontologies and to offer those for evaluation. It was hard, and we would have loved to put both ontology sets up to evaluation, but finally decided for the set mentioned previously. The legal ontologies were all of similar types, and certainly would need a domain expert for proper evaluation, which many of the evaluators won't have at hand at the moment. I hope it is the right decision (in research, you usually never know).

The EON2006 workshop will be a great opportunity to bring together all people interested in evaluating ontologies. I read all the submissions, and I am absolutely positive that we will be able to present you with a strong and interesting programme soon. I was astonished how many people have interest in that field, and was intrigued to discover and follow the paths lead out by the authors. I am looking forward to May, and the WWW!


Comments are still missing on this post.

Visa haben ungleich Visa brauchen

Als ich vor ein paar Wochen in Dortmund war, um mein Visum für Großbritannien zu beantragen, hatte ich ja eines für 5 Jahre beantragt und eines für 2 bekommen. Da habe ich schon gehofft, dass es das letzte Visum für Großbritannien sei, dass ich beantrage, und dass bis zum Ablauf desselben Kroatien Teil der Europäischen Union sein werde.

Mit einem Punkt hatte ich schon mal Recht -- Großbritannien schafft mit Wirkung zum 22. März die Visumspflicht für Kroaten ab. Das mein schönes Visum bis 2008 Gültigkeit hat ist dadurch natürlich vollkommen irrelevant geworden.

Menno, das haben die doch absichtlich gemacht.

Die GUI - XUL, HTML und CSS

Das Herzstück von Mozilla ist die Renderingengine Gecko. Sie liest zum Beispiel (X)HTML ein und stellt dieses dann auf dem Monitor dar. Damit lassen sich bereits sehr interaktive und sich äußerst dynamisch anfühlende Webseiten erstellen, insbesondere wenn man JavaScript mit verwendet. An Beispielen wie GMail oder start.com kann man erkennen, wieviel heute schon mit HTML möglich ist. Dennoch: viele GUI-Elemente wie Listen, Menüs oder Knöpfe sind in HTML eher umständlich umgesetzt. Darum wurde XUL, die XML User Interface Language, eingeführt, eine XML-Sprache zur Beschreibung von graphischen Benutzerschnittstellen.

Mit XUL ist es dann möglich zu beschreiben, wo bestimmte Elemente auftauchen, welche wo auftauchen, etc. Dadurch wird es zum Beispiel leicht fallen, verschiedene Versionen der GUI zu erstellen, eine für Experten und eine für Anfänger. Insbesondere könnte man sich einen Schritt-für-Schritt-Wizard für die Heldenerschaffung vorstellen, wie sie in den meisten anderen Editoren wie Helden praktiziert wird. Meine persönliche Vorliebe bleibt dennoch beim "Immer alles veränderbar"-Modus. Aber die Codebasis wird sehr einfach beides hergeben.

Ein weiterer Vorteil von XUL ist, dass damit das User Interface interpretiert, nicht compiliert wird. Das hat den Vorteil, dass, wenn man das Aussehen des Programms verändern will, man nicht eine ganze Programmierumgebung mit Compiler etc. braucht, sondern einfach nur einen Texteditor und etwas XML- oder HTML-Kenntnisse. Hoffnung dabei: schöne neue Skins und bessere Bedienbarkeit können von wesentlich mehr Leuten beigesteuert werden als bisher.

Apropos Skins: ja, auch das wird möglich sein. Wie von Thunderbird und Firefox gewohnt, sind XUL-basierte Anwendung vollkommen mit CSS und ähnlichem skinbar. Das heißt Farben, Hintergründe, Aussehen der Elemente sind steuerbar. Ich stelle mir jetzt schon ein Horasreich-Skin, ein Myranor-Skin und ein G7-Skin vor. Mal sehen. Es wird letztlich von Eurer Kreativität abhängen.

Auch hier ist das wichtige: man muss dafür keine Programmierumgebung besitzen und keine Programmierkenntnisse haben (auch wenn sie natürlich nicht schaden). Der wichtigste Teil des neuen Designs ist es, die einzelnen Teile der Architektur orthogonal zu gestalten, so dass man an einem bestimmten Teil arbeiten kann, ohne das man ein Experte in allen sein muss. Etwas, was bei der ersten Version sträflichst vernachlässigt wurde.

Nächstes Mal: zum Datenmodell und der Datenhaltung.

EON2006 deadline extension

We gave the workshop on Evaluating Ontologies for the Semantic Web at the WWW2006 in Edinburgh an extension to the end of the week, due to a number of requests. I think it is more fair to give an extension to all the authors than to allow some of them on request and to deny this possibility to those too shy to ask. If you have something to say on the quality of ontologies and ontology assessment, go ahead and submit! You still have a week to go, and short papers are welcomed as well. The field is exciting and new, and considering the accepted ESWC paper the interest in the field seems to be growing.

A first glance of the submissions reveals an enormous heterogeneity of methods and approaches. Wow, very cool and interesting.

What surprised me was the reaction of some: "oh, an extension. You didn't get enough submissions, sorry". I know that this is a common reason for deadline extensions, and I was afraid of that, too. A day before the deadline there was exactly one submission and we were considering cancelling the workshop. It's my first workshop and thus such things make me a whole lot nervous. But now, two days after the deadline I am quite more relaxed. The number of submissions is fine, and we know about a few more to come. Still: we are looking for more submissions actively. For the sole purpose of gathering the community of people interested in ontology evaluation in Edinburgh! I expect this workshop to become quite a leap for ontology evaluation, and I want the whole community to be there.

I am really excited about the topic, as I consider it an important foundation for the Semantic Web. And as you know I want the Semantic Web to lift off, the sooner the better. So let's get these foundations right.

For more, take a peek at the ontology evaluation workshop website.


Comments are still missing on this post.

Zurück aus Sheffield

Was wirklich gemein ist: die ganze Zeit in Sheffield hat es geregnet und gewindet. War ja nichts anders zu erwarten in England, oder?

Aber heute, da ich zurück bin, ist es dort über 10 Grad wärmer als hier, und sie haben Nieselregen und Sonnenschein statt Schnee und Grauingrau.

Die gute Nachricht: der Vortrag ist phantastisch gelaufen, das ganze Review war ein großer Erfolg. Danke allen Daumendrückern. Und danke den nutkidz, die ebenfalls eine Rolle spielten. Mehr dazu bald.

My Erdös Number

After reading a post by Ora and one by Tim Finin, I tried to figure my own Erdös Number out. First, taking Ora's path, I came up with an Erdös of 7:

Paul Erdös - Stephan Hedeniemi - Robert Tarjan - David Karger - Lynn Stein - Jim Hendler - Steffen Staab - Denny Vrandečić

But then I looked more, and with Tim's path I could cut it down to 6:

Paul Erdös - Aviczir Fraenkl - Yaacov Yesha - Yelena Yesha - Tim Finin - Steffen Staab - Denny Vrandečić

The point that unnerved me most was that the data was actually there. Not only a subscription-only database for mathematical papers (why the heck is the metadata subscription only?), but there's DBLP, there's the list of Erdös 1 and 2 people on the Erdös Number project, there's Flink, and still, I couldn't mash up the data. This syntactic web sucks.

The only idea that brought me further - without spending even more time with that - was a Google search for "my erdös number" "semantic web", in the hope to find some collegues in my field that already have found and published their own Erdös number. And yep, this worked quite fine, and showed me two further, totally disjunctive paths to the one above:

Paul Erdös - Charles J. Coulborn - A. E. Brouwer - Peter van Emde Boas - Zhsisheng Huang - Peter Haase - Denny Vrandečić

and

Paul Erdös - Menachem Magidor - Karl Schlechta - Franz Baader - Ian Horrocks - Sean Bechhofer - Denny Vrandečić

So that's and Erdös of 6 on at least 3 totally different paths. Nice.

What surprises me - isn't this scenario obviously a great training project for the Semantic Web? Far easier than Flink, I suppose, and still interesting for a wider audience as well, like Mathematicians and Noble Laureates? (Oh, OK, not them, they get covered manually here).

Update

I wrote the post quite a time ago. A colleague of mine notified me in the meantime that I have a Erdös of only 4 by the following path:

Paul Erdös - E. Rodney Canfield - Guo-Quiang Zhang - Markus Krötzsch - Denny Vrandečić

Wow. It's the social web that gave the best answer.

2019 Update

Another update, after more than a dozen years: I was informed that I have now an Erdös number of 3 by the following path:

Paul Erdös - Anthony B. Evans - Pascal Hitzler - Denny Vrandečić

I would be very surprised if this post requires any further updates.


Comments are still missing on this post.

In Sheffield

Die Stadt aus Stahl. Sheffield ist eine überraschend große Stadt, knapp 520.000 Einwohner und damit die viertgrößte Stadt in Großbritannien. Steht aber weder auf den Wetterkarten, noch hat es einen Flughafen. Es hat nichtmal eine vernünftige Verbindung zum nächsten Flughafen. Wir fuhren über eine Stunde den Snake Pass entlang, eine Strecke mit einer angeblich wunderschönen Aussicht. Es war Nacht.

Ich mach selber ja keine Photos, darum hier die Photos bei Flickr zu der Stadt. Auch auf Google Maps konnte ich das Octogon gegenüber finden. Ist ziemlich cool.

Zur Zeit sitze ich im großen Review unseres Projektes zu Semantischen Technologien. Die EU entscheidet, ob ihr Geld gut ausgegeben war. Ich bin nervös, und habe heute Nachmittag meinen Vortrag. Mit den nutkidz auf den Folien.

Drückt mir die Daumen.

Ungeschick

Ich war's nicht!

Neid auf Freiheit

"Vielleicht klang auch etwas Neid auf euch durch, da die Form von Meinungsäußerung, die ich als Werbetexter seit über 30 Jahren betreibe, alles andere als frei ist: Jedes Wort wird vor der Veröffentlichung lange abgewogen, mit Auftraggebern verhandelt und dann noch repräsentativ auf seine Wirkung getestet." (Quelle)

Jean-Remy von Matt hatte in einer internen eMail, die an die Blogosphäre durchgesickert ist, sich über die Miesepetrigen beschwert, die alles schlecht machen. "Wer hat die denn gefragt?" -- eines der Argumente. Was hörst Du dann hin?, frage ich mich. Wie auch immer, es war eine impulsive Reaktion. Seine, und die Arbeit seiner Kollegen, wurde niedergemacht, und er ärgerte sich. Da soll sich die Blogosphre ruhig an die eigene Nase fassen, wir quasseln noch viel mehr Unsinn als Monsieur von Matt.

Interessant aber fand ich obiges Zitat: er neidet uns die Freiheit, die wir genießen, die er nicht genießen kann.

Jean-Remy, einen Blog zu schreiben ist kinderleicht. Das kannst auch Du. Denn: Du bist Blog!

Architektur

Die bisherige Version des DSA4 Werkzeugs ist in C++ programmiert. Für die Daten entschied ich mich damals für ein XML-Datenformat, was zu der Anbindung von Xerces führte. Die GUI wurde mit wxWindows gemacht (die ersten Versionen, falls sich noch jemand erinnert, beruhten auf MSXML und native Windows GUI Elementen). Der Wechsel auf Xerces und wxWindows wurde durchgeführt, um Plattformunabhängig zu sein. Und tatsächlich: der Code compilierte auch unter Linux (dank hier an die Portierer). Aber richtig laufen tat er nie, es waren immer irgendwelche Bugs in der Linuxversion, die ich nicht in der Windowsversion nachvollziehen konnte.

Außerdem war das verwendete C++ viel zu kompliziert. Ich benutzte massig Templates (vor allem für die Rassen, Kulturen und Professionen), was den Code sehr schwer lesbar und bearbeitbar machte. Auch ein schlichtes compilen war eine recht anspruchsvolle Prozedur. Ich gehe davon aus, dass deswegen nie im größeren Maße Entwicklungsarbeit von anderen als von mir geleistet wurde: mein Code war schlicht zu kompliziert. Aus de selben Grund habe ich selber ja in den letzten Monaten den Code nicht angefasst.

Dies ist die wichtigste Lektion für die neue Version: deutlich einfacherer Code. Änderungen müssen auch ohne sich extrem reinzuarbeiten möglich sein. Idealerweise sollte das ganze Werkzeug interpretiert sein. Kein compilen mehr. Ändern. Neustart. Fertig.

Wie ich das erreichen will verrate ich in den nächsten Blogeinträgen genauer (deswegen habe ich auch nicht so viel geschrieben die letzten Tage -- und weil ich auf Dienstreisen in Kaiserslautern und Düsseldorf war -- ich wollte zunächst ein halbwegs tragbares Konzept haben. Das kommt jetzt die nächsten paar Tage. Hier schonmal eine grobe Übersicht -- ich werde im Folgenden genauer auf die Begriffe und den Aufbau eingehen.

Mozilla, die Open Source Gruppe die uns nicht nur Firefox und Thunderbird beschert hat, hat, was die Basis ihrer Tools ist, ein umfangreiches, sogenanntes Mozilla Application Framework erstellt. Im Großen und Ganzen ist es ein supermächtiges Biest -- ich will es soweit zähmen, damit das DSA4 Werkzeug darauf läuft. Hierbei gibt es eine Hauptengine, die XULRunner heißt. XUL ist so etwas wie HTML, bloß für GUIs von Anwendungen (und man kann tatsächlich auch HTML und JavaScript in XUL mit benutzen). Das bedeutet, das User Interface des neuen DSA4 Werkzeugs zu ändern wird so leicht sein wie HTML-Seiten schreiben, ja, sogar mit CSS arbeitet das ganze zusammen. Interessant ist hierbei vor allem das Verwenden von JavaScript, das eine dynamische GUI erlaubt. Die Applikationslogik hingegen kann entweder in JavaScript implementiert werden, oder auch in C++ oder Java (oder Python), um dann über XPCOM (oder PyXPCOM) darauf zuzugreifen. Potenziell also kann man auch Teile des bisherigen Codes wiederverwenden! Schließlich, die Daten werden in RDF gespeichert, einer XML-basierten Sprache, die aber deutlich Vorteile zu XML (und ein paar Nachteile) aufweist.

All dies unterstützt das Mozilla Application Framework von Haus aus. Anhand von Thunderbird und Firefox sieht man ja, dass das durchaus zu brauchbaren Applikationen führen kann. Ich hoffe, dass es auch hier aufgeht.

WLAN im Zug

Heute fuhr ich nach Düsseldorf, um bei der Britischen Botschaft mein Visum für Großbritannien zu beantragen und, so es klappt, auch gleich zu holen. Ich hatte schon einiges erwartet -- manche Horrorgeschichte wurde erzählt über Beamtentum, Formaliakrieg, Großkotzigkeit und Willkürherrschaft. Doch nichts dergleichen trat ein (zumindest nicht beim Beantragen heute morgen). Äußerst höflich, zuvorkommend und hilfsbereit.

Allerdings muss ich jetzt einige Zeit totschlagen (um am Nachmittag das fertige Visum abzuholen). Da ich die Zeit zum Arbeiten nutzen wollte, und zudem in der Gegend war, dachte ich mir, probiere ich mal das neue Pilotprojekt der Bahn aus, WLAN im ICE. Also fuhr ich nach Dortmund um von dort Richtung München nach Köln im ICE zu fahren. Dummerweise habe ich doch den falschen Zug erwischt, keinen ICE3 scheinbar, und ich kann einfach nicht herausfinden, welche Züge jetzt tatsächlich WLAN haben.

Schade. Na gut, habe ich mich doch in Düsseldorf hingesetzt und hier ein wenig gearbeitet. Und dann geht es zurück zum Konsulat. Ich war ganz frech und habe gleich ein Visum für fünf Jahre beantragt (statt des üblichen halben Jahrs). Mal sehen, was rauskommt... ein unbekannter (Fast)Landsmann, den ich zufällig am Konsulat traf, erklärte mir, dass das nie klappen würde, und dass das ganze immer Willkür sei, er hätte schließlich Erfahrung damit, schließlich muss er schon zum wiederholten Mal verlängern. Na ja, mit der Einstellung, kein Wunder dass es dann Probleme gibt. Ich vermied es, ihn darauf hinzuweisen, dass seine beiden Aussagen ("Willkür" und "das wird nie klappen") sich gegenseitig widersprechen.

Na, schauen wir mal, was rauskommt. Bloß blöd, dass das mit dem WLAN nicht geklappt hat.

Ein neuer Anfang

Alles, was aufwändiger ist als ein Blog scheint zur Zeit nicht zu funktionieren.

Wie viele von Euch wissen, verfolge ich seit langem das Ziel, ein Programm zu erstellen, welches beim Spielen von DSA in der vierten Edition Spielern und Spielleitern zur Hand geht. Wie ebenfalls die meisten wissen, war das Projekt leider die letzten Monate tot. Dies hatte mehrere Gründe: einerseits habe ich schlichtweg viel weniger Zeit als früher, und schließlich habe ich mich mit den Aufgaben beim DSA4 Werkzeug übernommen. Ich wollte sowohl das Programm erstellen - in allen Aspekten, Datenhaltung, User Interface, Logos, als auch die dazugehörige Website betreuen, als auch die Dokumentation schreiben, als auch eine Softwarebibliothek in C++ erstellen, die für DSA4-Tools gedacht ist, als auch die Druckausgabe verfeinern, als auch das XML-Format definieren, als auch die entstehende Community verwalten. Das mag eine ganz kurze Zeit funktioniert haben -- aber es musste, als ich meinen Beruf angetreten habe, schief gehen. Dummerweise liebe ich auch noch meinen Beruf, was mich zwar persönlich erfreut, aber der Entwicklung des DSA4 Werkzeugs nicht gut tut.

Ich werde in diesem Blog anfangen, die weitere Entwicklung des DSA4 Werkzeugs nach außen zu präsentieren. Dies ist ein vorläufiger Ersatz für eine echte Website, die einen Community-Prozess erlaubt. Aber diese Website werde ich nicht aufstellen. Ebenso werde ich tatsächlich nur wenige Emails im Zusammenhang mit dem DSA4 Werkzeug ausführlich beantworten. Ich brauche jemanden, der sich bereit erklärt, eine dazugehörige Website zu pflegen, und jemanden, der mir bei der Community helfen will. Ich erinnere mich, dass ich früher teilweise mehr Zeit in die Website und die Beantwortung von Emails investiert habe, als in die eigentliche Entwicklung. Dies muss ich diesmal vermeiden. Die Community war großartig! Ich brauche bloß an Leute wie Twel oder Wolfgang denken, die unglaubliches geleistet haben. Wer sich berufen fühlt, zu helfen, melde sich bitte bei mir.

Damit klar ist: ich werde auch in Zukunft nicht auf magische Weise mehr Zeit haben. Aber meine Erfahrungen in Industrie und Forschung, sowie das Wissen und die Erfahrung, die ich inzwischen über Open Source Community Prozesse und Software Engineering angesammelt habe, erlauben mir -- so die Hoffnung -- einige Fehler der ersten zwei Versionen des DSA4 Werkzeugs zu vermeiden. Die Architektur des alten DSA4 Werkzeugs war sehr durchdacht, und extrem flexibel. Leider war sie auch sehr kompliziert: metatemplate-Programmierung in C++ ist megacool, aber es macht den Einstieg für andere nicht gerade einfach. Einer der Gründe, warum es in den Monaten der aktiven Entwicklung keine 100 Zeilen von anderen Entwicklern in den Quelltext geschafft haben, oder warum niemand das Projekt aufgegriffen hat, nachdem ich offensichtlich nicht mehr weiterarbeitete. Dies wird der Hauptpunkt, den ich angreifen werde.

In den nächsten Tagen - ja, wirklich, Tagen - werde ich hier anfangen, in Blogeinträgen die neue Architektur zu skizzieren, sowie diverse Punkte auflisten. Zu einem Zeitplan möchte ich mich nicht durchringen, wann das Programm fertig wird. Aber ich kann versprechen, dass ein neuer Anfang gemacht ist. Warum? Weil das nicht Absicht ist, sondern auf erstem Code beruht. Zugegeben, bisher nur auf meiner Platte. Aber sobald es vorzeigbar ist, auch wieder auf SourceForge im CVS.

Ein halbes Jahrzehnt Nodix

Vor genau fünf Jahren habe ich Nodix begründet. Wie jedes Jahr (2002, 2003, 2004, 2005) heißt das Rückblick und Ausblick und ein wenig Zahlenspielchen, sowie Versprechen, die ich nicht einlösen werde.

Laut dem Zähler auf dieser Website hatten die Nodix-Seiten im ersten Jahr 2.000, im zeiten 20.000, dann 44.000, und dann 115.000 Besuche. Und letztes Jahr? Laut dem Zähler ging die Zahl auf 92.000 neue Besuche zurück. Was bedeutet das? Sind es tatsächlich weniger Besucher als früher? Nun ja, überraschend wäre es nicht -- einen Großteil des Jahres waren die Seiten eher ruhig, manche einfach tot, und vor fast zwei Monaten gab es einen fiesen Angriff auf Nodix, der alle Daten löschte, und die Daten immer noch nicht wieder zurück sind.

Genauer in die Zugriffsstatistiken geschaut, können wir aber sehen, dass Nodix nicht unbedingt weniger Besucher anlockt: laut der 1&1-Statistik hatten wir schon 2004 nicht 115.000 Besucher sondern 198.000 -- und letztes Jahr nicht etwa 92.000, sondern sage und schreibe 416.454 Besucher! Nicht Seitenaufrufe.

Woher die Diskrepanz? Ich tippe auf die Feeds. Seit Ende 2004 setzen die Nodix-Seiten vermehrt auf Feeds, und ihr, werte Leser, nutzt diese Gelegenheit natürlich auch, und das ist auch gut so. Der Abruf eines Feeds jedoch erhöht nicht den Zählerstand auf der Seite. Auch weiß ich nicht, ob die Statistik von 1und1 Abrufe des Feeds, der sich nicht verändert hat, auch mitzählt -- sprich, wird jedesmal, wenn jemand, der einen RSS-Feed der Nodix-Seiten abonniert hat, online geht und Feeds checkt, der Zähler erhöht? Dann wäre die Zahl von 416.454 natürlich deutlich überhöht! Aber dann wiederum biete ich auf semantic.nodix.net auch einen Feed im RSS-Format, den Feedburner aus dem Atom-Feed erstellt, den ich nicht mitzählen kann. Und PlanetRDF smusht semantic.nodix-Einträge auch noch mit. Was cool ist. Aber über Reichweite kann man dann letztlich nur noch die Kristallkugel befragen. Sie ist genauso glaubwürdig wie der Zähler von 1und1 oder der auf dieser Seite und jetzt etwa 273.000 anzeigt.

Oder kurz: ich habe eigentlich keine Ahnung, wieviele Leser Nodix eigentlich hat. Nada.

Also kommen wir zu den Rück- und Ausblicken: nutkidz sind wieder da, bisher regelmäßig, und das soll auch so bleiben. Auch die englische Übersetzung läuft prima. Apropos Übersetzungen: nach einer langen Pause ist auch die deutsche Übersetzung von something*positive wieder angelaufen. Ihr kennt das nicht? Ist auch ein Webcomic - und ein sehr fieser dazu! Ich würde sagen, ab 16 und nichts für schwache Gemüter. nakit-arts läuft prima -- Schwesterchen, gratuliere! Dies ist bei weitem der erfolgreichste Blog auf den Nodix-Seiten und auch um längen die schönste Seite von Nodix. Nur weiter so! semantic.nodix läuft und läuft gut. Wer sich für meine Arbeit interessiert, sollte da mit-lesen. Das DSA4 Werkzeug - nun, die Seite ist tot, ich denke noch darüber nach, und wenn alles nach Plan läuft, wird es dieses Jahr einen neuen Start geben. Dazu mehr zu gegebenem Zeitpunkt. XML4Ada95 hat ein Interesse geweckt ähnlich wie die Sprache selbst ;) -- ich will die Seite bald noch ein letztes Mal ändern, und dann ist das Projekt beendet. Nodix ist groß, wie ihr seht. Und es wird dieses Jahr noch weiter wachsen.

Also, auf in die zweite Hälfte des Jahrzehnts! Eine drittelmillion soll der Zähler am Jahresende anzeigen!

GESTS journal invitation! - ideas for better spam

Yeah, isn't that great! Got an invitation to submit my paper to the GESTS Journal "Transactions on Communications and Signal Processing" (won't link to it). Well, not directly my field, and I never heard of the Journal, but hey, a journal paper, isn't that great...

Ehhm, not exactly. Actually it seems to be spam. Another collegue got the same invitation last week. And no one heard about the journal. And it really isn't my field. I don't have to do anything with Signal Processing. And why do they want money for printing my article?

What I was wondering: why didn't they do it some better? With the AIFB OWL Export they could have got the machine processable information about the interests of each person at the AIFB. With a bit of SPARQLing they could have gotten tons of information -- fully machine processable! They could have found out that I am not into Signal Processing, but into Semantic Web. Personalizing Spam would be sooo easy. Spam could become so much more time-consuming to filter out, and much more attractive, if those spammers would just harvest FOAF-data and semantic exports. I really am surprised they didn't do that yet.


Comments are still missing on this post.

Denny macht Milchreis

Heute wollte ich Milchreis kochen. Wie geht das?

Zuerst geht man zu Leo und findet heraus, dass Milchreis auf Englisch rice pudding heißt. Es gibt nämlich keine deutsche Wikipedia-Seite zu Milchreis! Wahrscheinlich den deutschen Wikipedianern nicht enzyklopädisch genug. Mit rice pudding jedenfalls können wir sowohl auf den englischen Wikipediaartikel zu rice pudding zugreifen, als auch in Google Base nach rice pudding suchen. Hmm, die ersten Hits sind nur Fertiggerichte. Heute ist Feiertag - wieso weiß das dämliche Ding nicht, dass ich nicht einkaufen kann?

Also klicke ich auf recipes, um die Suche einzuschränken. Mist, war falsch, ich kriege vor allem Rezeptbücher. Zurück. Auf recipe klicken. Wieder rice pudding eingeben (dass sich das Ding das nicht merken konnte!), und neues Glück. Ja, das Ergebnis sieht gut aus. 45 Milchreisrezepte. Verdammt, die Milch ist übergekocht.

Herdplatte wechseln. Die eine abkühlen lassen. Mit einem Klick kann ich die Suche auf die recipe of the day verkürzen, der Rest will anscheinend nur was verkaufen. Doch die sind nicht weiter kategorisierbar. Doof. Hätte gerne nach Zutaten oder Kalorien weiter verfeinert. Na ja, Google Base ist nicht das Semantic Web, sondern nur eine erste UI Studie dorthin, oder?

Kippe den Reis in die kochende Milch. Überlege mir, dass mir das Semantic Web hier nur hätte helfen können, wenn ich das Haus auch mit Ubiquitous Computing oder Ambient Intelligence ausgestattet hätte. Genug komische Begriffe in die Gegend geworfen.

Der Milchreis klumpt. Suche in Google nach milchreis verklumpt. Dritter Hit sagt (aus einem Gaming-Forum) : "Och Mist, jetzt ist mein Milchreis verklumpt, hätte ich doch schneller rühren müssen!" Rühren! Ich rühre. Sehe derweil einen weiteren Hit: Den Milchreis sollte man nach dem Kochen abspülen und mit Milch weiter kochen. Verflixt! Reis zuerst kochen. Das hat mir meine Mama auch schon gesagt, letztes Mal. Schon wieder vergessen. Aber in den amerikanischen Rezepten auf Google Base wurde das nicht erwähnt.

Der ertse Hit führt übrigens auf Frag Mutti - Das Nachschlagewerk (nicht nur) für Junggesellen. Sachen gibt's. Dort gibt es ein hünsches T-Shirt: Milchreis schmeckt hervorragend, wenn man es kurz vor dem Verzehr durch ein saftiges Steak ersetzt. Oh, bei Frag Mutti im Milchreisrezept heißt es auch, den Reis nicht vorher aufkochen. Anscheinend gibt es mehrere Varianten (und beide von Mama? Ich bin verwirrt). Außerdem soll man den Milchreis für ein bis zwei Stunden ins Bett mitnehmen. Spart Energie. Das hätte meine Mama nie gesagt! Wir sind ja schließlich katholisch.

Und jetzt wisst ihr, warum man mich üblicherweise nicht in die Nähe einer Küche lässt.

Ein neues Jahr steht an

2005 war ein gutes Jahr. Ich werde es vermissen. Und dennoch freue ich mich auch auf 2006. Auch das nächste Jahr wird sicher sehr spannend, und wenn es auch nur halb so gut ist zu mir wie 2005 es war, dann kann ich mich glücklich schätzen.

Vor zwei Jahren versuchte ich mich mit einer Prognose für 2004 für das kommende Jahr, und obwohl sie so unglaublich generisch gehalten war, ging sie in die Hose. Deswegen habe ich es 2004 unterlassen, was für 2005 wahrzusagen, und, wenn ich zurückblicke, war das eine gute Entscheidung. Es wäre wieder in die Hose gegangen. Oder sieht jemand das letzte Einhorn im Kino?

2006 wird sehr spannend. Auf der Arbeit wird das EU Projekt SEKT zu Ende gehen. Das heißt, die ganzen spannenden Case Studies werden die SEKT Technologien benutzen und wir werden furchtbar viele Erfahrungsberichte sammeln. Sehr spannende Zeiten! Auch dem BMBF Projekt SmartWeb, an dem ich eher am Rande beteiligt bin, stehen spannende Zeiten bevor: die Fußball WM ist eines ihrer Case Studies! Na, da hat man sich ja mal was vorgenommen. Die Semantische Erweiterung der Wikipedia steht an, ebenso der Workshop auf der WWW zum Thema Ontologieevaluierung -- dem Thema meiner Dissertation, die nebenher auch noch entstehen soll.

Soviel zur Arbeit. Privat? Das ist immer viel schwerer einzuschätzen. Ich würde gerne eine USA-Reise machen. Am liebsten dieses Jahr, wenn es die Zeit erlaubt, sonst halt 2007. Quer durch die Staaten. In Neuengland anfangen und rüber nach Kalifornien. Das wäre cool. Mal wieder auf den RatCon gehen. Neue Freunde kennenlernen, alte behalten, noch ältere neu entdecken (Michael, wenn Du das liest, meld Dich doch mal!)

Ich will dieses Jahr ebenso gesundbleiben wie die vorhergehenden. Na gut, ein wenig öfter zum Arzt gehen kann nicht schaden. Ich merke, dass ich nicht mehr 16 bin. Etwas abnehmen, das wäre cool! Mehr Bewegung und etwas gesünder essen. Gar nicht mal unbedingt weniger. Nur besser. Und halt Bewegung. Seufz.

Weiterhin so häufig ins Kino gehen. Aber mehr darüber Bloggen. Vernünftigere Kritiken schreiben. Ich merke in letzter Zeit bin ich etwas blahblah. Text ist da, aber kein Inhalt mehr. Will ich wieder ändern. Seht euch nur das gestrige Post an. Wen hätte ich dadurch überzeugt, zum Konzert mitzukommen, wenn man die Bands nicht schon kennt. Das haben weder Amber noch Saltatio verdient.

Die nutkidz sind da, haben gar eine neue Folge erhalten! 2006 werden viel mehr neue Folgen kommen.

Ach ja, die eigenen Projekte. Das DSA4 Werkzeug. Ich habe versprochen, zum Status etwas zu schreiben, noch vor Weihnachten. Wie üblich habe ich mein Versprechen bezüglich des DSA4 Werkzeugs gebrochen. Na ja, fast. Geschrieben habe ich es, aber nicht veröffentlicht. Ich muss das noch umarbeiten. Überhaupt, DSA: dieses Jahr habe ich da einiges getan: sowohl an der Sieben Gezeichneten Kampagne mitgearbeitet, wie auch am Jahr des Feuers. Soviel werde ich nächstes Jahr wohl kaum auf die Beine stellen. Obwohl - ein Abenteuervorschlag ist eingereicht. Ein sehr gewagter. Mal sehen, was rauskommt.

Kurz, 2006 wird ein interessantes Jahr. An guten Vorsätzen mangelt es mir nicht. An Möglichkeiten zum Glück auch nicht. An guten Freunden und Kollegen, mit denen ich meine Ziele erreichen kann, ebenfalls nicht. Was also soll schon schiefgehen? Jeder Tag, nicht nur jedes Jahr, ist ein neuer Anfang. Man darf nur nicht vergessen, sich mal auszuruhen. Hinsetzen. Nachdenken. Das fehlt mir ein wenig. Das wäre eigentlich ein guter Vorsatz.

Mehr Zeit zum Nachdenken.

Im Moment bin ich aber etwas in Eile, verzeiht. Jetzt zunächst zum Konzert, und dann womöglich gleich nach Erfurt, beziehungsweise, nach Lützensömmern, tief im Thüringischen. Dort Silvester feiern, und das nächste Jahr begrüßen. Aber ich werde mir diesen guten Vorsatz im Hinterkopf behalten. Mehr Zeit zum Nachdenken.

Einen guten Rutsch!

Amber in Stuttgart

Yeah! Morgen spielen Amber und Gefährten in Stuttgarter Landespavillon. Ich gehe davon aus, euch zahlreich bei dem Konzert zu sehen. Sie sind als Support für Saltatio Mortis dort. Auch die, sehr lohnenswert.

Amber promotet zur Zeit mit der Tour ihr zweites Album, Rabenflug. Hörproben gibt es auf Ambers Website. Hört rein, kommt zu dem abschließenden Konzert der laufenden Tour in Stuttgart, morgen, am 30.12, und habt eine Menge Spaß!

Komplette nutkidz

Yeah! Die nutkidz sind wieder vollständig online. Alle bisherigen 38 Folgen, in deutsch und in englisch.

Und das beste: Gerüchten zufolge soll bald sogar eine neue Folge kommen... ;)

Zum 500.

Herzlichen Glückwünsch an Schwesterchen für Ihren 500. Eintrag in nakit-arts. Wow, 500 Einträge! Sehr fleißig.

Spaßigerweise ist dieser Eintrag wiederum der 250. Eintrag auf Nodix. Koinzidenz.

FOAF browser

Thanks Josef, thanks Pascal! I have complained that Morten's Foaf explorer is still down, they, instead of complainig as well, pointed me to their own FOAF explorers: Josef has his Advanced FOAF Explorer, very minimalistic, but it works! And Pascal points to Martin Borho's FOAFer. FOAFer has a few nice properties.

Thank you guys, your sites are great!

Is your source code there? Because both of your tools lack a bit in looks, to be honest. And do you really think, users like to see SHA1 sums? Or error messages? (Well, actually, that was OK, that helped me discover a syntax error in the AIFB FOAF files). Please, don't misunderstand me: your site really are great. And I like to use them. But in order to reach a more general audience, we need something slicker, nicer.

Maybe a student in Karlsruhe would like to work on such a thing? Email me.

Nutkidz sind wieder da!

Auf nutkidz.de finden sich die ersten drei Folgen der nutkidz wieder online! Nach dem Angriff auf Nodix mussten die Sicherheitskopien von meinem alten Rechner im Keller geholt werden. Jetzt ist die Technik erneuert: es gibt einen nutkidz-feed, so dass man sich auch mit seinem RSS-Reader den Webcomic ins Haus holen kann! So einfach sollte jeder Webcomic zu lesen sein.

In den nächsten Tagen werden die weiteren Folgen relativ bald aufeinander kommen, ich plane auf mindestens zwei oder drei täglich.

Ach ja -- und auf nutkidz.net gibt es von jetzt an die nutkidz auch auf Englisch.

New tagline is my New Year's resolution

I just changed the tagline of this blog. The old one was rather, hmm, boring:

"Discovering the Semantic Web, Ontology Engineering and related technologies, and trying to understand these amazing ideas - and maybe sharing an idea or two... "

The new one is at the same time my new year's resolution for 2006.

"Kicking the Semantic Web's butt to reality"

'nuff said, got work to do.

Fellow bloggers

Just a few pointers to people with blogs I usually follow:

  • Max Völkel, a colleague from the AIFB, soon moving to the FZI and right now visiting DERI. He obviously likes groups with acronyms. And he's a fun read.
  • Valentin Zacharias, who has deeper thoughts on this whole Semantic Web stuff than most people I know, working at the FZI. He's often a thought-provoking read.
  • Planet RDF. The #1 blog on news for the (S/s)emantic (W/w)eb, both with major and minor initials. That's informative.
  • Nick Kings from BT exact. We are working together on the SEKT project, and he just started to blog. Welcome! A long first post. But the second leads to a great video!
  • Brendan Eich, one of the Mozilla gurus. I want to know where Mozilla is headed to - so I read his musings.
  • PhD. It's not a person, it's a webcomic, granted, but they offer a RSS feed for the comic. Cool. I always look forward for new episodes.

So, if you think I should read you, drop me a note. I especially like peers, meaning, people who like I do are working on the Semantic Web, maybe PhD students, and who don't know the answer to anything, but like to work on it, making the web come real.

Nacktschnecken - Soundtrack?

Heute in der Sneak gewesen im Stuttgarter Metropol - wie fast jeden Montag. In letzter Zeit kamen einige ziemlich coole Filme, die ich eigentlich kaum weiterempfehlen kann. Terkel in Trouble (Trailer auf kino-zeit.de, dänische Website zum Film), der vielleicht krasseste Film seit langem, mit soviel Menschenverachtung und Witz, dass einem South Park schon moralisch vorkommt. Oder Kiss Kiss Bang Bang - einer der besten Filme des Jahres, aber wiederum so überaus fies, dass ich mir schwertue jemanden weiterzuempfehlen. So auch heute.

Nacktschnecken ist ein österreichischer Film, und das hört man auch. Und es geht um einen Pornodreh, und was dabei alles schiefgehen kann. So, wen das nicht abgeschreckt hat, der kann reingehen.

Aber eines nervt mich echt. Weil der Film bislang ja nur in der Sneak lief (und auf einem tschechichsen Festival) finde ich im Netz keine Infos darüber, was im Soundtrack war. Ein paar Songs waren echt cool! Insbesondere der Song, den sie bei diesem Würfelspiel gespielt haben. Wie heißt der? Von wem ist der?

Letztlich: der Link von Mr Sneak ging zu kino-how.de. Hier kann man über die Sneakfilme abstimmen. Mit Gewinnspiel. Für weitere Sneakkarten.

More FOAF

Wow, I never can't get enough FOAF :) Besides my Nodix-FOAF file the AIFB Portal now also offers a FOAF export for all the people at the AIFB (using URIs for the people besides the mailbox SHA1-Sum as identifiers. Hah! FOAFers won't like that, but TimBL told us to do it this way in Galway a few weeks ago).

If you point your smushers at the FOAFs, I wonder if you can also compile the SWRC-output into it, as they use the same URI? And can you also, by adding my own FOAF from Nodix, that I am the same person? Anyone dare's to try? :)

It's a pity Morten's FOAF explorer is down, I'd really like to try it out and browse. Isn't there something similar out there?

A tidbit more on that is also posted on the AIFB blog, but from a different point of view.

Kroatiens nächsten drei WM Spiele 2006

Nachdem gestern die ziemlich sicheren Spiele aufgeschrieben wurde, hier der weitere Verlauf für Kroatien. Gewisse Diskrepanzen zur Realität können sich durch Tatsachen einstellen.

Kaiserslautern, Montag, 26. Juni, 16 Uhr, Zweite Runde: Italien gegen Kroatien

Haushoher Favorit des Spiels ist klar der mehrfache Weltmeister. Die Italien sind jedoch etwas zu leichtherzig, und Kroatien schafft es den alten Nachbar gegenüber der Adria zu besiegen. Das Spiel wird als SmartWeb Demonstrationsobjekt benutzt (erstes K.O.-Spiel in Kaiserslautern!), doch das geht unter weil es danach zu Schlägereien und Randalen kommt in verschiedenen deutschen Städten. Sehr traurig so was.

Hamburg, Freitag, 30. Juni, 20 Uhr, Viertelfinale: Kroatien gegen Frankreich

Mal wieder ein Weltmeister. Diesmal will Frankreich die Schlappe in 2002 wettmachen, doch Kroatien ist in Hochform nach den bisherigen Spielen. Doch es ist eine Wiederholung der WM 1998. Damals besiegte Kroatien im Viertelfinale den Favoriten Deutschland, und verlor dann im Halbfinale gegen den späteren Weltmeister Frankreich. So auch hier. Im Viertelfinale besiegen wir den Favoriten!

München, Mittwoch, 5. Juli, 20 Uhr, Halbfinale: Kroatien gegen Brasilien

Das wir die Brasilianer auch dummerweise jetzt schon wiedertreffen müssen! Im Finale wäre es doch viel spannender. Beide Mannschaften haben eine regelrechte Odyssee durch Deutschland hinter sich gebracht, um sich nach dem Eröffnungsspiel in Berlin hier in München wieder zu begegnen. Wer darf wieder nach Berlin? - nur, diesmal zum Finale. Am Tag zuvor konnte sich Deutschland als einer der beiden Finalteilnehmer qualifizieren - und wer wird nun den Gastgeber im Finale fordern? Alle tippen auf den Weltmeister.

Letztes Spiel wird dann entweder in Stuttgart gegen Holland um Platz Drei, oder in Berlin gegen Deutschland um den Titel. Egal wie es ausgeht: das Spiel wird am nächsten Tag Schlagzeilen machen!

Kroatiens erste drei WM Spiele 2006

Gestern wurde ich durch die Nachricht, dass die WM Gruppen ausgelost werden, eher überrascht (Dank an Rudi für den Hinweis), aber jetzt bin ich über die Ergebnisse erfreut - das werden sehr schöne Spiele!

Berlin, Dienstag, 13. Juni, 20 Uhr: Brasilien gegen Kroatien

Yeah! Das Megaspiel für Kroatien. Der amtierende Weltmeister. Der Favorit. Die Nummer 1 der Weltrangliste. Das erste Spiel auf der WM für beide Länder. Gab es schon mal ein Spiel zwischen den beiden? Nicht in einem offiziellen Turnier. Aber es gab ein Freundschaftsspiel letztes Jahr. Ergebnis? 1:1. Na, nichts ist unmöglich!

Nürnberg, Sonntag, 18. Juni, 14 Uhr: Japan gegen Kroatien

Die Japaner haben wir schon mal besiegt - nur ist das schon ein paar Jahre her, und es war knapp. Beim ersten Auftritt der Kroaten und der Japaner bei einer WM. Doch diesmal sind die Vorzeichen umgedreht. Japan ist Nummer 15 auf der Weltrangliste, Kroatien die 20. Es wird ein enges Spiel. Und - auch Japan konnte dieses Jahr beim Confederations Cup gegen Brasilien ein 2:2 rausholen, und hätte gar fast gewonnen...

Stuttgart, Donnerstag, 22. Juni, 20 Uhr: Kroatien gegen Australien

Ein Heimspiel für die Kroaten. Und in der kroatischen Mannschaft steckt nicht nur ein Australier kroatischer Herkunft. Die Australien waren ganz schön angekäst, als Australier wieder nach Kroatien zurückwanderten, weil sie dort in der Nationalmannschaft vorankommen konnten. Jetzt wird sich Australien rächen wollen. Aber in Stuttgart hat Kroatien eine große kroatische Gemeinde in der Hinterhand. Nur - wird schwerlich dieses Spiel entscheidend werden.

Eine starke Gruppe - aber es gibt ja auch keine leichten Gruppen mehr. Ein klarer Favorit. Aber es kommt auch der Zweite weiter. Noch sechs Monate, dann rollt der Ball!

Und ich interessiere mich gar nicht für Fußball.

Du nimmst meine Schnalle, ich nehm Deine...

Tja, manchmal denkt man, dass es eigentlich ganz einfach ist: ich bin mit Deiner Frau durchgebrannt, hier, nimm Du dafür meine, OK?

Zumindest dachte dass dieser Herr. Na, mal sehen, wie es ausgeht.

A blog for the AIFB

Although I blogged here about the AIFB as well - the great place I am working at - Jens Hartmann suggested to create an own, dedicated AIFB-Blog on ontoworld. It's in beta still, kind of. We hope that other AIFB-people will blog there as well, and so keep you up to date with AIFB-stuff, blog about our papers, workshops, conference attendances, break-through results, but also the great weather in Karlsruhe and stories that happened here.

So, while I will still continue to post on the Semantic Web here, the more workplace related stuff will be found there: at the new AIFB-Blog.

Der Papst ist tot, Hurra?

Die Umfrage Perspektive Deutschland, die ich ansonsten eigentlich nur empfehlen kann, weil die Fragen echt in die Tiefe gehen und die daraus generierten Reports durchaus inhaltlich bemerkenswert sind, hat mich bei der derzeit laufenden Umfrage doch irgendwie überrascht:

Frage: Wie haben die Ereignisse der letzten zwölf Monate, z.B. der Tod von Papst Johannes Paul II., ihre Meinung gegenüber der katholischen Kirche beeinflusst?

Antwortmöglichkeiten: Stark verbessert - verbessert - nicht verändert - verschlechtert - stark verschlechtert - weiß nicht

Sonst denken die von der Umfrage aber durchaus etwas nach.

Nodix schon wieder angegriffen

Nachdem die Nodix-Seiten schon vor ein paar Wochen Opfer eines Angriffs wurden, hat es uns diesmal fies erwischt. Gab es letztes Mal nur ein Defacement, wurden wir diesmal vollständig gelöscht (nur ein perl-Script wurde hochgeladen, mit spanischen Kommentaren, die, laut Übersetzung, recht fies waren. Aber unpersönlich).

Tja, das bedeutet dass, bis ich etwas Zeit finde, die Nodix-Seiten nur teilweise funktionstüchtig sind. Die DSA4 Werkzeug-Seiten sind ganz weg, ebenso Something*Positive. Nutkidz hat eine weiße Seite, nakit-arts ist halbwegs auf den Beinen, Semantic Nodix läuft großteils schon, Nodix selber ist eher schlecht als recht wieder da.

Grrr. Ich Pappnase. 1und1 hat mich noch gewarnt, und mögliche Fehlerquellen genannt, ich hatte das dummerweise ignoriert. Hat man nun davon.

Annotating axioms in OWL - Reloaded

Yesterday I sent a lengthy mail to the OWL-ED Mailinglist] about how to annotate axioms. Peter Patel-Schneider himself, first author of the OWL Semantics specification, told me in nice words that my solution sucked heavily, by pointing out that the semantics of annotations in OWL are a tiny bit different than I thought. Actually, they are not at all as I thought. So, in the evening hours, instead of packing my stuff for a trip, I tried to solve the problem anew. Let's see where the problem will be this time.

Peter, you were right, I was wrong. I took a thorough look at the Semantics, and I had to learn that my understanding of annotations was totally screwed. I thought they would be like comments in C++ or Prolog, but instead they are rather like a second ABox over (almost) the whole universe. This surprised me a lot.

But still, I am not that good at giving up, and I think my solution pretty much works syntactically. Now we need only a proper Semantics to get a few things right.

What would be the problem? Let's make an example. I need some kind of Syntax to give axioms name. I will just take Name":" Axiom. This is no proposal for the Abstract Syntax extension, this is just for now.

Axiom1: SubClassOf(Human Mortal)
Axiom2: Individual(Socrates type(Human))

Do they entail the following?

Axiom3: Individual(Scorates type(Mortal))

Well, pitily they don't. Because the Axiom3 has a name, Axiom3, that is not entailed by Axiom1 and Axiom2. Their contents would be entailed, but the name of the axiom would not.

I guess, this is the problem Peter saw. So, can we solve it?

Well, yes, we can. But it's a bit tricky.

First, we need the notion of Combined Inverse Functional Properties, CIFP. A CIFP has several dimensions. A CIFP with dimension 1 ist a normal Inverse Functional Property. A CIFP with dimension 2 over the properties R, S can be represented with the following rule: a R c, a S d, b R c, b S d -> a = b. This means, in a two dimensional space I can identify an individual with the help of two roles. More on this here: http://lists.w3.org/Archives/Public/semantic-web/2005Feb/0095.html

Second, we extend the semantics of OWL. Every axiom entails reifying annotations. This means:

SubClassOf(Human Mortal)

entails

Individual(Statement1 type(rdf:statement)
annotation(rdf:subject Human)
annotation(rdf:property owl:SubClassOf)
annotation(rdf:object Mortal))

or, in N3:

Human owl:subClassOf Mortal.

entails

Statement1 rdf:type rdf:statement.
Statement1 rdf:subject Human.
Statement1 rdf:property owl:subClassOf.
Statement1 rdf:object Mortal.
rdf:subject rdf:type owl:AnnotationProperty.
rdf:predicate rdf:type owl:AnnotationProperty.
rdf:object rdf:type owl:AnnotationProperty.

Third, we have to state that we have a 3D-CIFP for statements over rdf:subject, rdf:property and rdf:object*. This is to ensure that Statement1 always maps to the same element in the universe, even though an OWL API could give it a blank node, or a different URI everytime (mind you, I am not suggesting to extend the OWL language with CIFPs, I just say that it is used here in order to state that all triples with the same subject, object and predicate actually is the same triple).

Fourth, the above statement also entails

Individual(Axiom1 type(owl11:axiom)
annotation(owl11:consistsOf Statement1))

or, in N3:

Axiom1 rdf:type owl11:axiom.
Axiom1 owl11:consistsOf Statement1.
owl11:consistsOf rdf:type owl:AnnotationProperty.

Fifth, owl11:consistsOf needs to be an n-dimensional CIFP with n being the number of triples the original axiom got translated to (in this case, happy us!, n=1).

This assures that an axiom is always the same, whatever it's name is, as long as it expresses the same thing. Thus, in our example, Axiom3 would indeed be entailed by Axiom1 and Axiom2. So, even if two editors load an ontology an annotate an axiom, they could later interchange and find each others annotation attached to the correct axiom.

This is only a rough sketch of the way, and yes, I see that the Interpretation gets filled up with a lot of annotations, but I still think that this is quite easy to implement, actually. Both the OWL API by Bechhofer and Volz and the KAON2 API by Motik offer access to axioms on an ontology level, and also offer the possibility to check if they are the same anyway, if I remember correctly (which is basically a shortcut for the whole semantic entailment and CIFP-stuff proposed earlier). All they need is a further field containing the URI of the axiom.

As said, this looks far more nasty than it actually is, and for most practical reasons it won't do much harm. Now we finally can annotate axioms, yeeeha!

Merrily awaiting Peter to acknowledge that this is a brilliant solution :) Or else tell me I did it all wrong again, so that I have to think over the weekend how to solve this problem again.

Cheers, denny

 *What I mean with that is the following rule: a=b :- a rdf:subject s, a rdf:property p, a rdf:object o, b rdf:subject s, b rdf:property p, b rdf:object o

Annotating axioms in OWL

This was sent to the OWLED-List by me, that prepares to come up with an OWL 1.1 recommendation. The week before, Alan Rector suggested to add the possibility to annotate axioms in OWL, which is currently not possible. There is many a good use for that, like provenance, trust, and son on. But the discussion wasn't too fruitful, so I suggested the following solution.

After it came up in discussion last week, I hoped an elegant solution for annotating axioms would arise. Pitily, no one had a brilliant idea, so I went ahead and tackled the problem in my mediocre way.

First, what do I want to achieve with my solution:

  1. Don't crack the Semantic Web stack. The solution has to be compatible to XML, RDF and OWL. I don't want to separate OWL from RDF, but to offer a solution that is able to be handled by both.
  2. We want to annotate not just entities, but also axioms. Thus an axiom needs to be able to be a subject in a statement. Thus an axiom needs to have an URI.
  3. The solution must be easy to implement, or either people will get my FOAF-file and see whom I care about and hurt them.

Did I miss something? I found two solutions for this problem.

A) Define the relationship between an ontology (which does have an URI) and the axioms stated inside. Then we can talk about the ontologies, annotate those, add provenance information, etc. Problem: after importing axioms from one ontology into another, those information is lost. We would need a whole infrastructre for Networked Ontologies to achieve that, which is a major and worthy task. With this solution, you can annotate a single axiom by putting it alone into an ontology, and claim that when annotating the ontology you actually annotate the axiom as well. Not my favourite solution, because of several drawbacks which I won't dwell in deeper if not asked.

B) The other solution is using Reification (stop yelling and moaning right now!). I'm serious. And it's not that hard, really. First, the OWL specification offers a standard of how to translate the Axioms into triples. Second, thte RDF specification offers a standard way to reify a triple. With the RDF reification we can give a triple a name. Then we can introduce a new resource type owl11:axiom, where its instances contains the triples that were translated from a certain DL Axiom. This rdf resource of type owl11:axiom is then the name/URI of the original DL Axiom.

RDF-triples that have a subject of type rdf:statement or owl11:axiom don't have semantics with regards to OWL DLs Model Theoretic Semantics, they are just syntactic parts of the ontology in order to allow the naming of axioms in order to annotate them.

For example, we say that all Humans are Mortal. In Abstract Syntax this is

SubClassOf(Human Mortal)

In RDF triples (N3) this is:

:Human rdfs:subClassOf :Mortal.

Now reifiying this we add the triples:

:statement1 rdf:type rdf:statement.
:statement1 rdf:hasSubject :Human.
:statement1 rdf:hasPredicate owl:subClassOf.
:statement1 rdf:hasObject :Mortal.
:axiom1 owl11:consistsOf :statement1.

Now we can make annotations:

:axiom1 :bestBefore "24/12/2011"^xsd:date.
:axiom1 :utteredBy :Aristotle.

Naturally, :bestBefore and :utteredBy have to be Annotation Properties. When an axiom is broken up in more than one triple, the reasone of having an extra owl11:axiom instead of simply using rdf:statement should become clear.

Does this solution fulfill the given conditions?

  1. The Semantic Web stack is safe and whole. RDF Semantics is adhered to, and OWL semantics is fine, and all syntax regulations imposed by XML and RDF/XML are regarded. Everything is fine.
  2. Yep, we can annotate single axioms. Axioms have URIs. We can annotate our metadata! Yeah!
  3. Is it easy to implement? I think it is: for reading OWL ontologies, a tool may just ignore all those extra triples (it can easily filter them out), and still remain faithful to the standard semantics. Tools that allow to name axioms (or annotate them) and want to deal with those, have to simply check for the correct reification (RDF toolkits should provide these anyway), and get the axiom's URI.

Problems that I see: I identified two problems. First, what happens, if those triples get separated from the other actual axiom triples? What if they get ripped apart and mushed into another ontology? Well, that problem is somewhat open for OWL DL and Lite anyway, since not all axioms map to single triples. The answer probably is, that reification would fail in that case. Strict reading could be that the ontology leaves OWL DL then and moves to OWL full, but I wouldn't require that.

Second problem, and this is by far more serious, is that people can't stand reification in RDF, that they simply hate it and that alone for that they will ignore this solution. I can only answer that reification in practise is probably much easier than expected when done properly, due to some short-hand notations available in RDF/XML-serialization, and other syntaxes. No one holds us back from changing the Abstract Syntax and the OWL XML Presentation Syntax appropriately in order to name axioms far more easy than in the proposed RDF/XML-Syntax. Serializations in RDF/XML-Syntax may get yucky, and the RDF graph of an OWL ontology could become cluttered, but then, so what? RDF/XML isn't read by anyone anyway, is it? And one can remove all those extra triples (and then the annotations) automatically if wished, without changing the Semantics of the ontology.

So, any comments on why this is bad? (Actually, I honestly think this is a practicable solution, though not elegant. I already see the 2007 ISWC best paper award, "On the Properties of Higher Order Logics in OWL"...)

I hope you won't kill me too hard for this solution :) And I need to change my FOAF-file now, in order to protect my friends...

Job at the AIFB

Are you interested in the Semantic Web? (Well, probably yes or else you wouldn't read this). Do you want to work at the AIFB, the so called Semantic Web Machine? (It was Sean Bechhofer who gave us this name, at the ISWC 2005) Maybe this is your chance...

Well, if you ask me, this is the best place to work. The offices are nice, the colleagues are great, our impact is remarkable - oh well, it's loads of fun to work here, really.

We are looking for a person to work on KAON2 especially, which is a main building block of many a AIFB software, as for example my own OWL Tools, and some European Projects. Mind you, this is no easy job. But if you finished your Diploma, Master or your PhD, know a lot about efficient reasoning, and have quite some programming skills, peek at the official job offer (also available in German).

Do you dare?

Semantic Web Gender Issue

Well, at least they went quite a way. With Google Base one can create new types of entities, entities themselves, and search for them. I am not too sure about the User Interface yet, but it's surely one of the best actually running onbig amounts of data. Nice query refinement, really.

But heck, there's one thing that scares me off. I was looking today for all the people interested in the Semantic Web, and there are already some in. And you can filter them by gender. I was just gently surprised about the choices I was offered when I wanted to filter them by gender...

Hier fehlt noch ein Bild.

Oh come on, Google. I know there are not that many girls in computer science, but really, it's not that bad!

What is a good ontology?

You know? Go ahead, tell me!

I really want to know what you think a good ontology is. And I will make it the topic of my PhD: Ontology Evaluation. But I want you to tell me. And I am not the only one who wants to know. That's why Mari Carmen, Aldo, York and I have submitted a proposal for a workshop on Ontology Evaluation, and happily it got accepted. Now we can officially ask the whole world to write a paper on that issue and send it to us.

The EON2006 Workshop on Evaluation of Ontologies for the Web - 4th International EON Workshop (that's the official title) is co-located with the prestigous WWW2006 conference in Ediburgh, UK. We also were very happy that so many reknown experts accepted our invitation to the program committee, thus ensuring a high quality of reviews for the submissions. The deadline is almost two months away: January 10th, 2006. So you have plenty of time to write that mind-busting phantastic paper on Ontology Evaluation until then! Get all the details on the Workshop website http://km.aifb.uni-karlsruhe.de/ws/eon2006.

I really hope to see some of you in Edinburgh next May, and I am looking for lively discussions about what makes an ontology a good ontology (by the way, if you plan to submit something - I would love to get a short notification, that would really be great. But it is by no means requested. It's just so that we can plan a bit better).

Regenbogen

Ich bin gerade in Galway, und hier regnet es ständig. Wirklich. Zwar meist nur kurz, aber doch halt immer wieder neu.

Dafür wurde ich heute mit einem schier unglaublichen Regenbogen belohnt: er ging wirklich über den ganzen Horizont, ein vollständiger Bogen! So was habe ich noch nie gesehen. Das Bild ist untertrieben, deutlich, in Wirklichkeit schien er noch viel heller.

Besonders spannend war, dass er kaum zwei-, dreihundert Meter entfernt aus dem Wasser zu steigen schien. Nicht irgendwo weit weg, er war direkt da - man kann sogar die Häuser durch den Regenbogen hindurch auf dem Bild sehen, der Regenbogen war vor den Häusern. So etwas habe ich noch nie zuvor gesehen. Wahnsinnig beeindruckend.

Ich hoffe, dass ich bald noch ein paar bessere Bilder bekomme.

Hier fehlt noch ein Bild.

ISWC impressions

The ISWC 2005 is over, but I'm still in Galway, hanging around at the OWL Experiences and Direction Workshop. The ISWC was a great conference, really! Met so many people from the Summer School again, heard a surprisingly number of interesting talks (there are some conferences, where one boring talk follows the other, that's definitively different here) and got some great feedback on some work we're doing here in Karlsruhe.

Boris Motik won the Best Paper Award of the ISWC, for his work on the properties of meta-modeling. Great paper and great work! Congratulations to him, and also to Peter Mika, though I have still to read his paper to form my own opinion.

I will follow up on some of the topics from the ISWC and the OWLED workshop, but here's my quick, first wrap-up: great conference! Only the weather was pitily as bad as expected. Who decided on Ireland in November?

KAON2 and Protégé

KAON2 is the Karlsruhe Ontology infrastructure. It is an industry strength reasoner for OWL ontologies, pretty fast and comparable to reasoners like Fact and Racer, who gained from years of development. Since a few days KAON2 also implements the DIG Interface! Yeah, now you can use it with your tools! Go and grab KAON2 and get a feeling for how good it fulfills your needs.

Here's a step to step description of how you can use KAON2 with Protégé (other DIG based tools should be pretty the same). Get the KAON2 package, unpack it and then go to the folder with the kaon2.jar file in it. This is the Java library that does all the magic.

Be sure to have Java 5 installed and in your path. No, Java 1.4 won't do it, KAON2 builds heavily on some of the very nice Java 5 features.

You can start KAON2 now with the following command:

java -cp kaon2.jar org.semanticweb.kaon2.server.ServerMain -registry -rmi -ontologies server_root -dig -digport 8088

Quite lengthy, I know. You will probably want to stuff this into a shell-script or batch-file so you can start your KAON2 reasoner with a simple doubleclick.

The last argument - 8088 in our example - is the port of the DIG service. Fire up your Protege with the OWL plugin, and check in the OWL menu the preferences window. The reasoner URL will tell you where Protege looks for a reasoner - with the above DIG port it should be http://localhost:8088. If you chose another port, be sure to enter the correct address here.

Now you can use the consistency checks and automatic classification and all this as provided by Protege (or any other Ontology Engineering tool featuring the DIG interface). Protégé tells you also the time your reasoner took for its tasks - compare it with Racer and Fact, if you like. I'd be interested in your findings!

But don't forget - this is the very first release of the DIG interface. If you find any bugs, say so! They must be squeezed! And don't forget: KAON2 is quite different than your usual tableaux reasoner, and so some questions are simply not possible. But the restrictions shouldn't be too severe. If you want more information, go to the KAON2 web site and check the references.

Noch eine Blume: die Tulpe

Überraschend: auf n-tv lief gerade ein Bericht über die Geschichte der Tulpe. Tulpen! Das kann doch nicht interessant werden.

Oh doch! Ich will nicht alles aus der Sendung wiederholen, aber Tulpen führten vielen hunder Jahren zu einem ersten Zusammenbruch der holländischen Börse. Zwar waren auch die allgemein bekannten einfarbigen Blüten, mit ihren kräftigen Farben, beliebt, doch wirklich teuer waren die mehrfarbigen Blüten wie die hier dargestellte Semper Augusta. 10.000 Gulden wurde für sie bezahlt. 150 Gulden war der normale Verdienst einer Familie zu jener Zeit, im Jahr - umgerechnet bewegen wir uns also, für eine einzelne Blume wohlgemerkt!, im Millionen Euro Bereich!

Eine andere Blume wurde gegen eine Villa im niederländischen Harleem getauscht.

Die Tulpenmanie beschädigte die Niederlande schwer: die Preise waren deutlich zu hoch, teilweise wurde mit Tulpen gehandelt, die noch nicht mal gepflanzt waren. Innerhalb weniger Tage brach der Markt plötzlich zusammen, und viele Niederländer mussten in den Ruin.

Die Semper Augusta, die man hier sieht, gibt es heute leider nicht mehr. Schade. Eine wirklich schöne Blume...

Mehr nachzulesen zum Beispiel im Wikipedia-Artikel zur Tulpenmanie.

Hier fehlt noch ein Bild.

Flower of Carnage

Im Original

Übersetzung: Blume von Tod und Zerstörung

Shindeita
Asa ni
Tomorai no
Yuki ga furu

Schmerzvoller Schnee fällt im Morgengrauen,
Streunende Hunde heulen
und Getas Schritte durchdringen die Luft

Hagure inu no
Touboe
Geta no
Otokishimu

Das Gewicht der Milchstraße drückt auf meine Schultern
aber ein Schirm hält die Dunkelheit,
die alles ist, was ist.

Iin na naomosa
Mitsumete aruku
Yami wo dakishimeru
Janomeno kasa hitotsu

Ich bin eine Frau,
die an der Grenze zwischen Leben und Tod wandelt,
leerte meine Tränen, viele Monde her.

Inochi no michi wo
Yuku onna
Namida wa tooni
Sutemashita

All das Mitleid, Tränen, Träume,
Die verschneiten Nächte und das Morgen haben keine Bedeutung

Furimuita
Kawa ni
Toozakaru
Tabinohima

Ich tauchte meinen Körper in den Fluss des Zorns
und warf meine Weiblichkeit fort, viele Monde her.

Itteta tsuru wa
Ugokasu
Naita
Ame to kaze

Im Auftrag des Himmels,
sie sind unsere Soldaten,
loyal, unbesiegbar und mutig

Kieta mizu mo ni
Hotsure ga miutsushi
Namida sae misenai
Janomeno kasa hitotsu

Jetzt ist ihre Zeit gekommen,
das Land ihrer Eltern zu verlassen,
ihre Herzen aufgeputscht von ermutigenden Stimmen

Urami no michi wo
Yuku onna
Kokoro wa tooni
Sutemashita

Feierlich werden sie bestimmt
nicht lebendig zurückzukehren,
ohne Sieg.

Giri mo nasake mo
Namida mo yume no
Kinou mo ashita mo
Henno nai kotoba

Hier, daheim,
warten die Bürger auf Euch.
In fremden Ländern,
die mutigen Truppen.

Urami no kawa ni
Mi wo yudanete
Honma wa tooni
Sutemashita

Statt Freundlichkeit von Jemandem
der mir egal ist
möchte ich lieber Egoismus
von Dir

Mein Problem mit asiatischen Texten ist, dass ich sie häufig auch nicht verstehe, wenn man sie übersetzt. Aus dem Kill Bill Soundtrack.

Hommingberger Gepardenforelle

Ich kann mir zwar nicht vorstellen, dass es ernsthaft hilft, aber versuchen kann man es ja mal, ein paar Kollegen dabei zu helfen, im Suchmaschinenwettbewerb von Heise beim erfundenen Begriff Homminberger Gepardenforelle möglichst weit nach vorne zu kommen. Linkt noch jemand mit? Wäre cool, wenn die hübsch weit nach vorne kommen. Mehr Erklärung gibt es übrigens hier, auf der Seite der Uni Kassel dazu.

Ab sofort mit Backlinks

So, jetzt hat auch der Nodix Blog dieses coole, unverzichtbare Feature: Backlinks! Ihr verlinkt auf einen Nodix-Post, und die Backlinks merken das.

Na ja, zumindest in der Theorie.

Mit Dank an Blogger für's Implementieren.

KAON2 OWL Tools V0.23

A few days ago I packaged the new release of the KAON2 OWL tools. And they moved from their old URL (which was pretty obscure: http://www.aifb.uni-karlsruhe.de/WBS/dvr/owltools ) to their new home on OntoWare: owltools.ontoware.org. Much nicer.

The OWL tools are a growing number of little tools that help people working with OWL. Besides the already existing tools, like count, filter or merge, partly enhanced, some new entered the scene: populate, that just populates an ontology randomly with instances (which may be used for testing later on) and screech, that creates a split program out of an ontology (you can find more information on OWL Screech' own website).

A very special little thing is the first beta implementation of shell. This will become a nice OWL shell that will allow to explore and edit OWL files. No, this is not meant as a competitor to full-fledged integrated ontology development environments like OntoStudio, Protégé or SWOOP, it's rather an alternative approach. And it's just started. I hope to have autocompletion implemented pretty soon, and some more commands. If anyone wants to join, give me a mail.

Asterix in Gefahr

Dieser Tage erschien der 33. Band der Asterix-Reihe: Gallien in Gefahr. Nein, kein "Asterix rettet Gallien", oder "Asterix bringt Gallien in Gefahr", oder ähnlich, sondern schlicht der reißerische Titel "Gallien in Gefahr". Im französischen heißt der Band Le ciel lui tombe sur la tête, Der Himmel fällt ihnen auf den Kopf, aber bei Asterix waren die Übersetzungen schon immer sehr frei - und meistens dadurch auch herausragend gut! (Ich bin, mein lieber Freund, sehr glücklich, dich zu sehn!" - "Das ist ein Alexandriner." -Asterix und Kleopatra). Vor dem weiterlesen ist es vielleicht sinnvoll, den Band zuerst zu lesen, sonst wird einiges vorweggenommen. Ich verrate zwar nicht, wer stirbt, aber dennoch.

Aber kommen wir zum Inhalt. Überraschend wenig gelacht. Ich muss mal die alten Hefte rauskramen, ob man da auch so wenig gelacht hat, ob man nur die besten Stellen sich gemerkt hat (mein Liebling ist Asterix als Legionär, und da habe ich reichlich gelacht, da bin ich mir sicher). Asterix war immer dafür begann, mit seiner Zeit zu spielen. Das Jahr 50 v. Chr. Ganz Gallien ist von Römern besetzt... Das zeigte einen gewissen Rahmen auf, auch wenn er schon in Vergangenheit arg gestreckt wurde: Die große Überfahrt führte nach Amerika, Asterix im Morgenland nach Indien. Doch diesmal reist Asterix gar nicht, sondern vielmehr kommt die Fremde in das kleine gallische Dorf. Und zwar heftig.

Aliens besuchen das kleine gallische Dorf. Ihr Kampf gegen die Römer hat Gerüchte um ihre letale Geheimwaffe ins ganze Universum verbreitet. Die guten Aliens kommen zuerst, um Asterix zu warnen, und dann kommen die bösen nach, und es kommt zu einer Schlacht zwischen den Außerirdischen. Gewaltig große Bilder, oft eine halbe Seite, ein Panel gar die ganze Seite bedeckend - ungewöhnlich für Asterix.

Man mag den Band befremdlich finden. Aber so schlecht ist er nicht. Es ist zudem nicht schwer durch die oberflächliche Geschichte zu stoßen, zu sehen, was dahinter steckt: das gute Alien ist offensichtlich Micky Maus ohne Ohren, ja, selbst der Name des Planeten von dem sie stammen ist ein Angram auf Walt Disney. Sogar die Details - Tuuns Knöpfe, die Handschuhe, die Gesichtsmimik - stimmen. Und er isst Heißen Hund - deutliche Anspielung auf Amerika. Sein Begleiter, im Stile Schwarzeneggers, eine Mischung aus Terminator und Superman, hingegen ist ein Klon, ein Superheld, austauschbar durch den anderen. Dies sind die Ikonen des Amerikanischen Comics. Ich frage mich nur, was der Name Tuun und seines weisen Mannes Hubs bedeutet?

Die bösen Aliens hingegen stammen vom Planeten Nagma, ebenfalls ein nichts verhehlendes Anagram auf japanische Comics. Auch sind sie so insektenhaft gezeichnet und bewegen und kämpfen, wie man es von machem Manga gewohnt ist. Ihr deutsch, oder vielmehr gallo-römisch, ist schlecht, und die Amerikaner, entschuldigung, die guten Aliens behaupten, dass sie nur alle ihre Erfolgsrezepte kopieren. Das erste, was der Abgesandte der Nagmas macht, als er Asterix entgegentritt, ist es, ihm einen Friedensabkommen anzubieten, doch Asterix begrüßt den Außerirdischen mit Dresche. Und so kommt es zur Schlacht.

Amerikanische Superheldencomics, Walt Disneys Massenproduktion und Mangas überfluten den europäischen Markt, bedrängen die französisch-belgischen Künstler, wollen sich das Geheimnis ihres Zaubertranks aneignen wollen, das Geheimnis ihres Erfolgs. Das hätte man für die Nachricht dieses Bandes halten können. Uderzos Postscriptum zu seiner und Goscinnys Asterix-Reihe, der wahrscheinlich letzte Band des nunmehr 78-jährigen Uderzo. Sein Kommentar zur Geschichte des europäischen und globalen Comics.

Doch nach zwei Dritteln des Bandes fragt man sich, was will er nun sagen? Es wird kreuz und quer Frieden geschlossen und aufeinander geprügelt, die Römer und Piraten kriegen einen Gastauftritt, der wirkt, als ob man die Todo-Sachen der Liste "Was alles in einen Asterix-Comic auftauchen muss" noch abhandeln müsste, und am Ende wird allen das Gedächtnis gelöscht, so dass die Geschichte vollkommen folgenlos bleibt. Uderzo hätte viel sagen können, und man hätte zugehört. So aber deutete er einen Kommentar an, um dann doch nur irgendwie die Geschichte zum Ende zu bringen, bevor Seite 48 erreicht wird. Schade. Und warum sieht der römische Offizier diesmal wie Signore Berlusconi aus?

Sicher nicht der schlechteste Asterix. Wahrscheinlich der ungewöhnlichste.

Why some are disenchanted

In a comment to my last blog entry, Christopher St John wrote:

"I suffered through the 80's Knowledge Representation fad, both academically in the AI program at Edinburgh and as a practitioner at the only company ever to produce a commercial system written in Prolog (that wasn't a Prolog development system.) So I'm familiar with the problems that the Semantic Web effort is attempting to address. Having slogged through real-life efforts to encode substantial amounts of knowledge, I find some of the misty-eyed musings that surround the Semantic Web effort depressing. That "most information on the Web is designed for human consumption" is seen as an obstacle surmountable via tools like RDF is especially sad. On the other hand, I'm always happy to make use of the cool tools that these sorts of things seem to throw off. There's probably a certain Proverbs 26:11 aspect to it as well."

Thanks for your insightful comment, and being new to the field I certainly appreciate some report based on real life experience - and I have to admit to probably be faulty of being misty-eyed myself more than once about the Semantic Web (and probably will be in the future as well).

'"Most information on the Web is designed for human consumption" is seen as an obstacle'. Yes, you are right, this is probably the worst phrased sentence in the Semantic Web vision. Although I think it's somehow true: if you want the computer to help you dealing with today's information overflow, it must understand as much of the information as possible. The sentence should be at least rephrased as "most information on the Web is designed only for human consumption". I think it would be pretty easy to create both human-readable and machine-friendly information with only little overhead. Providing such systems should be fairly easy. But this is only about the phrasing of the sentence - I hope that every Semwebber agrees that the Semantic Web's ultimate goal is to help humans, not machines. But we must help the machines in order to enable them to help us.

The much more important point that Christopher addresses is his own disenchantment with the Knowledge Represenation research in the 80s, and probably by many people with the AI research a generation before. So the Semantic Web may just seem as the third generation of futile technologies to solve AI-complete problems.

There were some pretty impressive results from AI and KR, and the Semantic Web people build on that. Some more, some less - some too much even, forgetting the most important component of the Semantic Web underway: the Web. Yes, you can write whole 15-page papers and file them to Semantic Web conferences and journals and not even once mention anything web-specific. That's bad, and that's what Christopher, like some researchers, does not see as well, the main difference between this work two decades ago and today's line of investigation. The Web changes it all. I don't know if AI and KR had to fail - it probably must have failed, because they were so many intelligent people doing it and so there's no other explanation than that it had to fail due to the premises of its time. I have no idea if the Semantic Web is bound to fail as well today. I have no idea if we will be able to reach as much as AI and KR did in their time, or less, or maybe even more. I am a researcher. I have no idea if the things I do will work.

But I strongly believe it will and I will invest my time and part of my life towards this goal. And so do dozens of dozens other people. Let's hope that some nice thing will be created in the course of our work. Like RDF.

RDF is not just for dreamers

Sometimes I stumble upon posts that leave me wonder, what actually do people think about the whole Semantic Web idea, and about standards like RDF, OWL and the like. Do you think academia people went out and purposefully made them complicated? That they don't want them to get used?

Christopher St. John wrote down some nice experience with using RDF for logging. And he was pretty astonished that "RDF can actually be a pretty nifty tool if you don't let it go to your head. And it worked great."

And then: "Using RDF doesn't actually add anything I couldn't have done before, but it does mean I get to take advantage of tons of existing tools and expertise." Well, that's pretty much the point of standards. And the point of the whole Semantic Web idea. There won't be anything you will be able to do later, that you're not able to do today! You know, assembler was pretty turing-complete already. But having your data in standard formats helps you. "You can buy a book on RDF, but you're never going to buy a book on whatever internal debug format you come up with"

Stop being surprised that some things on the Semantic Web work. And don't expect miracles either.

Eine Viertelmillion

Heute Nacht überschritt die Zahl der Besucher der Nodix-Webseiten die Viertelmillion.

Vielen Dank für die vielen treuen Besucher auf nakit-arts, auf semantic.nodix, hier, und auch auf den zur Zeit deutlich vernachlässigten Seiten nutkidz, something*positive, DSA4 Werkzeug und XML4Ada95. Ihr seid großartig.

Semantic MediaWiki: The code is out there

Finally! 500 nice lines of code, including the AJAX-powered search, and that's it, version 0.1 of the SeMediaWiki project! Go to Sourceforge and grab the source! Test it! Tell us about the bugs you found, and start developing your own ideas. Create your own Semantic Wiki right now, today.

Well, yes, sure, there is a hell of a lot left to do. Like a proper triplestore connecting to the Wiki. Or a RDF-serialization. But hey, there's something you can play with.

Eklige Metzger

Ich will ja gar nicht wissen, was das für ein Zeug ist... bäh!

Hier fehlt noch ein Bild.

Semantic MediaWiki Demo

Yeah! Doccheck's Klaus Lassleben is implementing the Semantic MediaWiki, and there's a version of it running for quite some time already, but some bugs had to be killed. Now, go and take a look! It's great.

And the coolest thing is the search. Just start typing the relation, and it gives you an autoexpansion, just like Google Suggest does (well, a tiny bit better :) Sure, the autoexpansion is no scientific breakthrough, but it's a pretty darn cool feature.

The SourceForge project Semediawiki is already up and running, and I sure hope that Mr Lassleben will commit the code any day soon!

Even better, Sudarshan has already started implementing extensions to it - without having the code! That's some dedication. His demo is running here, and shows how the typed links may be hidden from the source text of the wiki, for those users who don't like it. Great.

Now, go and check the demo!

Auto hat 10000

Nachdem ich diesen Sommer 10.000 geworden bin (Tage), hat es mein Autole heute auch geschafft (Kilometer).

Hier fehlt noch ein Bild.

Angriff auf Nodix

Wow, gestern wurden die meisten Nodix-Seiten Opfer einer Defacement-Attacke, wie auch das Defacement-Archiv Zone-H festhält. Auch nakit-arts erging es so. Und so hat es ausgehen.

So albern es ist, aber ich fühle auch einen gewissen Stolz, Opfer *einer* ersten Defacement-Attacke geworden zu sein. Heißt ja schließlich, dass die Nodix-Seiten entsprechend aufgefallen sind. Und, ach ja, dass die Sicherheit hier nicht sonderlich ist :(

Frage mich bloß, wie das passiert ist und was man dagegen machen kann. Zum Glück haben die Angreifer keine Daten gelöscht, sonder nur die index-Seite ausgetauscht, aber die hätten ja auch viel unfreundlicher sein können.

Tipps?

Geht wählen!

Ist wichtig. Ich darf heute leider nicht mitwählen. Und Schwesterchen auch nicht. Ihr dürft. Also, geht wählen!

New people at Yahoo and Google

Vint Cerf starts working at Google, Dave Becket moves to Yahoo. Both like the Semantic Web (Vint said so in a German interview with c't, and I probably don't have to remind you about Daves accomplishments).

I'm sure, Yahoo got Dave because of his knowledge about the Semantic Web. And I wonder if Google got Vint out of the same reason? Somehow, I doubt it.

Another Semantic MediaWiki

I stumbled about another Semantic MediaWiki, an implementation created by Hideaki Takeda and Muljadi Hendry of the Japanese National Institute of Informatics in Tokyo. Their implementation looks very neat, although it is quite different in a few basic things (that we consider crucial in order to work), take a look at their full paper (it's in their wiki - oh, and it's in Japanese).

The basic difference between their approach and the one we suggest is that they add metadata management abilities to MediaWiki - which is cool. But they don't seem to aim at a full integration into the Wikipedia, i.e. embedding the metadata into the article text instead of appending it at some place. Actually, if we had software that is able to process natural languages, we wouldn't need our approach, but their would still be useful.

Nevertheless, they have a big huge advantage: a running system. Go there, take a look, it's cool! Actually, we have a system online too, but won't yet disclose the link due to a bug that's a kind of showstopper. But expect it to be online next week - including the source and all! It will be just a first version, but I sure hope to gather the people who want to work on it around the code.

Commited to the Big S

Not everyone likes our proposal for the Semantic Wikipedia. That's not a big surprise really. Boris Mann was talking about the advantages of tagging, and some ideas like blessed tags, that sounded very nice, when Jay Fienberg pointed him to the Semantic MediaWiki proposal. Boris answers: "I notice with a shudder however, that the Mediawiki stuff uses a large "S" Semantic, and includes RDF. I admit it, I'm afraid of RDF."

Yes, we do. And we're proud of it. Actually, it's the base for the better half of the possible applications we describe. Jay has some nice answers to it: "I think the MediaWiki folks are just recognizing the connection between their "tags" and the big "S" Semantic Web [you bet!, denny]. There are taxonomies and ontologies behind the popular tagging apps too--folks behind them just aren't recognizing / publicizing this (for a number of reasons, including that tags are often part of a practical application without big "S" Semantic Web goals). [...] I'm not a super huge fan of RDF myself, but I think it's useful to not be afraid of it, because some interesting things will come out of it at some point."

Our idea was to allow the user to use Semantic Web technologies even without really understanding them. No one needs to understand RDF fully, or OWL, to be able to use it. Sure, if she does, well, it surely will help her. Any by the way, RDF really is not complicated at all, it just has a syntax that sucks. So what?

Maybe it's a crude joke of history to start the Semantic Web with syntactic problems...

By the way, does anyone have a spare invitation to GMail for me? I'd really like to check out their service. Thanks, Peter, that was fast.

Semantic Wikipedia

Marrying Wikipedia and the Semantic Web in Six Easy Steps - that was the title of the WikiMania 2005 presentation we gave about a month ago. On the Meta-Wikipedia we - especially Markus Krötzsch - were quite active on the Semantic MediaWiki project, changing and expanding our plans. DocCheck is working right now on a basic implementation of the ideas - they have lots of Wiki-Experience already, with Flexicon, a MediaWiki-based medical lexicon. We surely hope the prototype will be up and running soon!

Wow, the project seems perceived pretty well.

Tim Finin, Professor in Maryland: "I think this is an exciting project with a lot of potential. Wikipedia, for example, is marvelously successful and has made us all smarter. I’d like my software agents to have a Wikipedia of their own, one they can use to get the knowledge they need and to which they can (eventually) contribute." - Wikipedia meets the Semantic Web, Ebiquity blog at UMBC

Mike Linksvayer, CTO of Creative Commons: "The Semantic MediaWiki proposal looks really promising. Anyone who knows how to edit Wikipedia articles should find the syntax simple and usable. All that fantastic data, unlocked. (I’ve been meaning to write on post on why explicit metadata is democratic.) Wikipedia database dump downloads will skyrocket." - Annotating Wikipedia, Mike Linksvayers Blog

Danny Ayers, one of the developers of Atom and Author of Atom and RSS Programming: "The plan looks very well thought out and quite a pile of related information has been gathered. I expect most folks that have looked at doing an RDF-backed Wiki would come to the same conclusion I did (cf. stiki) - it’s easy to do, but difficult to do well. But this effort looks like it should be the one." - Wikipedia Bits, Danny Ayers, Raw Blog

Lambert Heller of the University of Münster wrote a German blog entry on the netbib weblog, predicting world domination. Rita Nieland has a Dutch entry on her blog, calling us heroes - if we succeed. And on Blog posible Alejandro Gonzalo Bravo García has written a great Spanish entry, saying it all: the web is moving, and at great speed!

So, the idea seems catching like a cold in rainy weather, we really hope the implementation will soon be there. If you're interested in contributing - either ideas or implementation - join our effort! Write us!

Männer schlauer als Frauen

Ein Artikel von Paul Irwing und Richard Lynn im Journal of Psychology berichten, dass Männer schlauer als Frauen sind. Die beiden Autoren sind natürlich Männer, und Lynn hat sich schon einen Namen damit gemacht, Menschen unterschiedlicher Hautfarbe ebenfalls unterschiedliche Intelligenz zu attestieren. Diese Nachricht wird mit Sicherheit die nächsten Tage durch die Presse geistern.

Tony Halpin von der Times fragt schon, wie schlau das wohl war. Nicht überliefer ist bisher die Reaktion von Irwings und Lynns Angetrauten. Als WikiNews davon berichtete, war zunächst der Titel der Meldung falsch geschrieben: UK study claims men more intelligent then women. Da der Autor leider anonym war, ist dessen Geschlecht unbekannt.

Statt über die Ergebnisse zu lachen, blicken wir einfach etwas tiefer in die Studie, zumindest darüber, was die die oben erwähnten Artikel berichten (der Text der Studie selber war mir nicht zugänglich). 24.000 Studenten machten einen IQ-Test, wobei die Männer im Schnitt 5 Punkte mehr erreichten. Dabei wird ein IQ von 125 von doppelt so vielen Männern erreicht wie von Frauen, während bei einem IQ von 155, wo man üblicherweise von Genies spricht, das Verhältnis gar 5,5 : 1.

Diese Zusatzfakten führen zu zweu interessanten, mathematischen Konsequenzen, die mit Sicherheit in eben derselben Presse, durch die diese Nachricht verbreitet wird - Sommerloch, ihr wisst schon - vollkommen ignoriert werden:

Erstens: da Männer in den genialen Bereichen in der Studie offensichtlich stark überrepresäntiert sind, bewegt sich der Schnitt unverhältnismäßig weit nach oben für den nicht-genialen Mann. Anders gesagt: rechnet man die furchtbar wenigen übermäßig intelligenten Personen aus der Studie heraus, schrumpft der Vorsprung der Männer deutlich zusammen. Oder, ganz einfach gesagt: die Studie zeigt, dass Genies eher Männer sind. Genies muss man aber eh mit der Lupe suchen, und da die meisten Menschen keine Genies sind, ist dieses Ergebnis für sie kaum von Relevanz. Das wäre so, als ob ein Tausendseelendorf mit dem Erfolg angeben wollte, dass das Jahresdurschnittsgehalt im Ort um eine Million Euro gestiegen sei, nur weil halt Bill Gates zugezogen ist. Die anderen Dorfbewohner werden dadurch auch nicht reicher.

Zweitens: die Studie basiert auf Studenten. Dadurch wurde von vorneherein bereits Bevölkerungsgruppe mit ohnehin überdurschnittlichem IQ ausgewählt. Wenn jetzt der von mir sehr geschätzte Steven Pinker recht hat, der da sagt, dass es bei den männlichen Exemplaren einer Gattung schon allein aus evolutionären Gründen zu einer größeren Varianz in fast allen Bereichen kommt (siehe auch die sehr interessante Debatte mit Elizabeth Spelke), dann heißt dass auch, dass bedeutet die höhere Varianz bei männlichen IQ einfach, dass es zwar mehr männliche Genies gibt, aber halt auch unter den Dummen Männer die deutliche Mehrheit bilden. Und da wir, durch die Beschränkung der Studie auf Studenten, diese ausgeblendet haben, muss es - wenn Pinker recht hat - rein mathematisch zu einem höheren IQ-Schnitt für Männer kommen. Hätten wir die Studie mit Sonderschülern durchgeführt, ist ebenso notwendig ein höherer IQ-Durchschnitt für Frauen zu erwarten.

So, und jetzt nochmal einfach, so dass auch die Männer und Frauen es kapieren: aus der Studie zu schließen, dass man als Mann schlauer als eine Frau ist, ist so falsch wie dumm. Aus der Studie zu schließen, dass Männer im Allgemeinen oder im Schnitt schlauer als Frauen sind, ist ebenso falsch wie dumm. Die Studie ist ein Indiz dafür, dass wenn jemand total dämlich oder aber ein Genie ist, es eher ein Mann ist. Wer blind sichergehen möchte, nicht einen Idiot einzustellen, sollte sich für eine Frau entscheiden. Wer nur Genies haben möchte, wird es bei der Auswahl schwerer haben, aber letztlich ein Team aus überwiegend Männern haben.

Doch für den allgemeinen Fall haben die Aussagen keine Bedeutung.

Hmm, Statistik sollte dringend Pflichtfach an den Schulen werden. Siehe auch Der Hund, der Eier legt. Ein Muss für jeden, der Statistiken verstehen will.

Guter Preis

Ich kann mir nicht vorstellen, dass das der Microsoft-Preis ist. Oder werden da Hunde bevorzugt? Müssen Hunde auch der Lizenz vor Öffnen der Packung zustimmen?

Hier fehlt noch ein Bild.

Noch ein Test

So, ein weiterer Test, wie gut ich von meinem Handy aus bloggen kann. Schon spannend: als ich mit Nodix anfing, habe ich die Einträge per Hand in HTML geschrieben, dann kam ein selbst programmiertes Tool in Delphi, dann Python, welches ich in einer späteren Version auch von anderen PCs verwenden konnte. Schließlich übernahm Blogger den Blog, und dank der standardisierten Schnittstellen kann ich jetzt auch direkt von meinem Handy aus Einträge erstellen. Ob mit - wie gestern - oder ohne Photo.

Ich habe bloß noch keine Ahnung, wie das mit dem verlinken funktioniert. Vielleicht einfach so: <a href="http://notausgang.baumgarf.de">geht auf diesen tollen Blog!</a> Gleich mal ausprobieren.

Update:(Test doppelt misslungen. Der Post landete zunächst auf dem falschen Blog, Semantic Nodix, und das mit dem verlinken hat auch nicht funktioniert. Menno)