Legion of Honor Museum, San Francisco

Legion of Honor

Yahoo! Learning To Rank Challenge

Yahoo! is running a learning to rank challenge. So finally, we can see a fair comparison between all the different approaches to learning to rank.

Download the real world data set and submit your proposal at the Yahoo! Learning to Rank Challenge Site.

Snow in San Francisco!?!

San Francisco Pillow Fight 2010

San Francisco Pillow Fight 2010

Been learning the flashes

Please stop using my GMail address

In the aftermath of the buzz nightmare, I am about to delete my google account(s). So please delete my @gmail.com address from your address book and Jabber contact lists. Thanks.

MLOSS 2010 – ICML Workshop just accepted

We are glad to announce that our MLOSS 2010 workshop at this years ICML conference has been accepted! We are therefore happily accepting software submissions. The deadline for the submissions is April 10th, 2010. If accepted, you can present your software to the workshop audience, which is a great opportunity to make your piece of software more known to the machine learning community. Like last time, we will use mloss.org for managing the submissions. You basically just have to register your project with mloss.org and add the tag icml2010 to it. For more information, have a look at the workshop page.

Source: MLOSS.org blog

How to avoid “Killed by signal 15″ error when using Netbeans with Subversion

At least if you use Netbeans on the Mac with a reasonably current version of Subversion (e.g. installed through MacPorts), you may have faced the following situation: After each action that involves a ssh link, you get a Dialog box stating “Killed by signal 15″. Here is an easy way to solve this:

  • Open Preferences and navigate to the “Miscellaneous” tab.
  • Inside this tab, open the “Versioning” sub-tab
  • Lastly, click on “Subversion” in the list on the left side.
  • You should see the following on your screen now:

Screenshot of the preferences of Netbeans 6.8

  • Now, hit the “Manage Connection Settings” button. I’d have highlighted the button in the screenshot if I knew how to draw a simple circle in Photoshop ;-)
  • The following dialog box looks like this:

Netbeans 6.8 Subversion connection settings

  • As you can see, I inserted “ssh -q” in the field “Tunnel Command”. Do the same

The annoying dialog box should be gone for good now.

Informatik der TU Darmstadt vorne im CHE Hochschulranking. Was heisst das?

Die TU Darmstadt freut sich an verschiedenen Stellen, z.B hier auf der Homepage das Fachbereichs Informatik und zuletzt auch auf Facebook, demonstrativ über die gute Platzierung im “CHE Hochschulranking” im Fach Informatik. Man neigt dazu, an dieser Stelle wie gewohnt “Gratulation!” zu denken und die Sache zu den Akten zu legen. Ich habe mir mal die Mühe gemacht das allseits verlinkte PDF runterzuladen und zu lesen. Darin heisst es auf Seite J2:

In diesem Jahr ist erstmals auch das Fach Informatik Bestandteil des Forschungsrankings. Hier können werden zwar derzeit noch keine bibliometrischen Daten ausgewiesen werden, allerdings gibt es Bestrebungen seitens des Fakultätentages Informatik sich im Fach auf eine geeignete Datenbasis für eine bibliometrische Analyse zu verständigen.

Aus dem Deutschen übersetzt heisst das anscheinend: Wir Informatiker publizieren zwar viel, wir sind uns aber selbst nicht so sicher, was das Wert ist. Das nenne ich mal eine erfrischende (und ehrliche) Position. Wirklich interessant wird wird die Studie dann aber schon im nächsten Absatz:

Im Fach Informatik wurden 61 Universitäten in den Vergleich einbezogen. Als Forschungsindikatoren stehen in diesem Fach die verausgabten Drittmittel sowie die Anzahl der Promotionen zur Verfügung.

Beruflich beschäftige ich mich mit Missbrauch bzw. dessen Abwendung der Yahoo!-Dienste. Vielleicht suche ich deshalb unbewusst besonders nach Missbrauchsmöglichkeiten. Trotzdem:

Mir kommt bei dieser Beschreibung sofort in den Sinn, wie man ein solches Mass inflationär in die Höhe treiben könnte: Man stelle so viele Doktoranden ein, wie man bekommen kann (ja, sie sind selten). Damit treibt man, statistisch gesehen, auch die Anzahl der Promotionen in die Höhe. Im nächsten Schritt “vermietet” man diese Doktoranden dann gegen Geld (vulgo: Drittmittel) an Firmen, um auch den zweiten Indikator in die Höhe zu treiben.

Mir ist sehr bewusst, dass die Messung der Forschungsleistung einer Universität oder auch “nur” einer Fakultät eine immense Herausforderung darstellt. Allerdings erscheint es mir hier so, dass die falschen Anreize gesetzt werden, schliesslich hat herausragende Forschung häufig nur wenig mit Quantität zu tun. Folglich stellt sich mir die Frage, warum gerade die TU Darmstadt, die sich ja eigentlich nicht um ihren Ruf sorgen muss, sich mit gerade diesem Ergebnis so brüstet.

How to compile Apache Mahout on OS X

Compiling Apache Mahout should be straight forward on OS X, as the system comes with all the requirements needed. Turns out that is only partially true, as I hit two issues along the way:

Wrong Java Version

Problem: I got the error 'javac: invalid target release: 1.6' even though I set Java 6 to be the default in the Java Preferences. Even on the command line, 'java -version' showed 1.6 as the version number. However, this did not carry over to Maven, as 'mvn -v' confirmed.

Solution: Explicitly set the 'JAVA_HOME' environment variable. In my case, I set it via 'export JAVA_HOME=/System/Library/Frameworks/JavaVM.framework/Versions/1.6/Home/'

Out of Memory when compiling

Problem: I got an 'java.lang.OutOfMemoryError: Java heap space' when compiling the current svn checkout of Mahout (not the release)

Solution: Set the environment variable 'MAVEN_OPTS' to allow for more memory via 'export MAVEN_OPTS=-Xmx1024m'

Hope this helps when setting up your Apache Mahout development.