
In „Per Anhalter durch die Galaxis“ beschreibt Autor Douglas Adams mit dem Babelfisch einen Übersetzungsfisch, den man sich ins Ohr setzen kann. Auf diesen fiktiven Universalübersetzer hat Meta bei der Präsentation seiner neuen Übersetzungs-KI SeamlessM4T jetzt Bezug genommen.
KI beherrscht fast 100 Sprachen
Dem Facebook-Mutterkonzern zufolge beherrscht die Software beinahe 100 Sprachen – und kann diese aus Texten oder Gesprochenem schriftlich übersetzen. Per Sprache können 36 verschiedene Sprachen (Text-to-Speech und Speech-to-Speech) als Übersetzung ausgegeben werden.
Laut Meta verrichtet das Tool auch dann seine Arbeit, wenn während der Aufnahme oder Eingabe der zu übersetzenden Inhalte die Sprache gewechselt wird.
Trainiert wurde die Übersetzungs-KI mit Audioaufnahmen im Umfang von vier Millionen Stunden, wie Spiegel Online schreibt. Das Material stammt laut dem entsprechenden Forschungspapier „aus einem öffentlich zugänglichen Speicher für Daten, die im Internet per Scraping gesammelt wurden“.
Woher hat Meta die Trainingsdaten?
Woher genau Meta die Daten hat, verriet der Konzern aber auch auf konkrete Nachfrage der Nachrichtenagentur Reuters nicht. Für die textbasierten Trainingsdaten griff Meta jedenfalls auf Wikipedia und andere Website zu.
Inwiefern Meta und andere Konzerne für das Training ihrer KI solche und andere Daten verwenden dürfen, ist hochumstritten. Darüber hinaus weist SeamlessM4T auch typische Bias-Probleme auf. So tendiere die KI-Software dazu, Begriffe in ihre männliche Form zu übersetzen.
KI-Tools für das Metaverse
Meta-Chef Mark Zuckerberg sieht die neue Übersetzungs-KI als Teil einer Tool-Sammlung, die Menschen bei der virtuellen Begegnung im Metaverse helfen soll.
Ähnlich wie Metas Sprachmodell Llama kann auch SeamlessM4T zu nichtkommerziellen Zwecken frei verwendet werden. Die Übersetzungs-KI kann hier in einer Demoversion ausprobiert werden.
Demo schlägt sich im Test gut
Dort kann man eine bis zu 15 Sekunden lange Audiodatei mit dem zu übersetzenden Inhalt auswählen. Anschließend kann man sich diesen Inhalt in bis zu drei Sprachen übersetzen lassen. Je nach Verfügbarkeit als Sprach- oder Textversion.
Im Kurztest hat das mit einfachen Sätzen – zumindest soweit sich das mit den Sprachkenntnissen des Verfassers dieses Textes überprüfen ließ – gut funktioniert. Die Spracherkennung war jedenfalls tadellos.
Bitte beachte unsere Community-Richtlinien
Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.
Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.
Dein t3n-Team