Wie lange können Sie sich das noch leisten?
Proprietäre Formate, unkompatible Systeme und Prozesse, teure Systeme; Übersetzerauswahl nach deren eingesetztem System, nicht nach Übersetzungsqualität - so sehen die heutigen Probleme der Übersetzungsprozesse aus.
Upgedatete Versionen von openTMS und der Araya Free Version sind hier verfügbar:
Araya Free Version: http://www.heartsome.de/de/freearaya.php (Fehler in der Installation behoben)
OpenTMS: http://www.heartsome.de/arayatest/opentmsserver.exe
Als zweiten Beitrag zum Thema "Eine SWT Anwendung um eine Menü mit openTMS Funktionen erweitern" werde ich nun zeigen, wie man eine Combo Box mit den vorhanden Datenquellen füllt. Zur Erinnerung: "Ich will das am Beispiel des Araya Bilingual Term Extracors zeigen (sh. dazu http://www.heartsome.de/de/termextraction.php). Das Werkzeug extrahiert aus einer TMX Datei mögliche bilinguale Terminologiekandidaten (also Übersetzungen). Die aktuelle Version ist auf TMX Dateien beschränkt.
Dieser Beitrag soll zeigen, wie einfach man in SWT basierte Anwendungen die Data Source Funktionen einbauen kann.
openTMS verwendet für die Implementierung die Programmiersprache Java. Ein Grund war und ist die Plattformunabhängigkeit von Java. openTMS läuft dzt. auf Windows, Mac und Linux. Java hat aber oft den Ruf "langsam" zu sein. Vor allem im Vergleich zu nativen Implementierungen in C oder C++. Ist dem aber so?
In Fortsetzung des Teils 2 will ich nun erläutern wie die unscharfe Suche - "Fuzzy Search" implementiert wird.
Ein paar Sätze allgemein zur unscharfen Suche in openTMS. Die unscharfe Suche findet in zwei Schritten (zwei Filter) statt. Zuerst wird in einem sogenannten KD-Tree eine Suche durchgeführt, die als Ergebnis ein Menge von potentiellen passenden Kandiaten liefert. Der KD-Tree wird im folgenden auch als Fuzzy-Baum (Index) bezeichnet.
In Fortsetzung des Teils 1 will ich hier die wichtigen Objekte MultiLingualObject (MUL) und MonoLingualObject (MOL) und ihre Methoden erläutern.
Im vorherigen Beitrag wurden diese Objekte mit
Vector targetmonos = new Vector();
MultiLingualObject multi = new MultiLingualObject();
MonoLingualObject sourceMono = new MonoLingualObject(); openTMS verwendet das Konzept der "Data Source" zum Übersetzen. Eine Data Source ist einfach ausgedrückt eine Klasse + Methoden, die Übersetzungsfunktionalität zur Verfügung stellt. Durch das Implementieren einer solchen Klasse kann openTMS sehr einfach um neue Übersetzungsmöglichkeiten erweitert werden.
In den folgenden Beiträgen zeige ich, wie verschiedene solche Data Sourcen - als erstes am Beispiel des Einsatzes des statistischen maschinellen Übersetzungssystems MOSES - implementiert werden kann.
openTMS ist Java basiert, dh. die Kernfunktionen sind alle in Java geschrieben und damit sollte openTMS auf allen Betriebssystem mit Java lauffähig sein. Java 6 sollte aber schon unterstüzt werden. Auf Windows und Linux kein Problem. Aber am Mac?
Die TEKOM 2009 ist vorbei und wir konnten OpenTMS vielen interessieren TEKOM Besuchern zeigen. Insbesondere der Prototype des neuen docliff XLIFF Editors fand großen Anklang. Er wird hier in Kürze als Prototyp zum Download bereitstehen. Wenn Sie eine oder einer der ersten sein wollen, die ihn testen und einsetzen wollen, schicken Sie mir eine E-Mail: klemens.waldhoer at opentms.de. Wir melden uns, wenn der Editor zum Download bereitsteht.
Nach der TEKOM sind nun neue Versionen von OpenTMS für Windows verfügbar: