Mozilla 11.06.2018, 08:17 Uhr

Common Voice wird mehrsprachig

Mozilla erweitert sein freies Common-Voice-Projekt um weitere Sprachen. Die Datenbank nimmt ab sofort auch Sprachmuster in Deutsch, Französisch und Walisisch auf.
Neben Englisch sammelt Common-Voice jetzt auch Proben in französischer, deutscher und walisischer Sprache.
Seit Juli 2017 sammelt Mozilla englische Sprachsamples von freiwilligen Teilnehmern für sein Open-Source-Projekt Common Voice zum Aufbau einer frei verfügbaren Sprachdatenbank. Jetzt haben die Entwickler ihre Lösung um weitere Sprachen ausgebaut. So nimmt die Datenbank ab sofort auch Sprechproben auf Deutsch, Französisch und Walisisch auf. Über die Webseite des Projekts sowie über die dazugehörige iOS-App können Freiwillige jederzeit weitere Sprachmuster beisteuern, um den Umfang und damit das Potenzial von Common Voice zu erhöhen.
Eine erste Version des freien Datensatzes veröffentlichte Mozilla bereits Ende November vergangenen Jahres. Dieser umfasst schon 400.000 Aufnahmen von 200.000 unterschiedlichen Sprechern, die eine gemeinsame Sprechzeit von 500 Stunden ergeben. Laut Mozilla wurden die Daten seither tausendfach heruntergeladen und sowohl für kommerzielle als auch für freie Lösungen wie die Open-Source-Software Kaldi eingesetzt.
Ziel von Common Voice war es von Beginn an, die Technologie der Spracherkennung zu demokratisieren. Bislang wird dieses Gebiet von wenigen Großkonzernen wie Amazon, Apple, Google und Co. dominiert. Dies erschwere vielen Entwicklern aber das Arbeiten mit der Technologie, da schlichtweg die Datenbasis nicht erreichbar sei. Innovative Lösungen wie Echtzeit-Übersetzer oder alternative Sprachassistenten blieben dadurch auf der Strecke.

Zusätzlich zu den nun vier unterstützten Sprachen soll das Projekt in der Zukunft um über 40 weitere Sprachen und Dialekte ausgebaut werden. Darunter nicht nur naheliegende wie Spanisch, Chinesisch oder Russisch, sondern auch kleinere, wie etwa Friesisch, Norwegisch oder Tschuwaschisch. Speziell wenig verbreitete Sprachen werden von großen Anbietern oft nicht beachtet, wodurch dieser Nutzerschaft die Spracherkennungstechnologie verschlossen bleibt - Common Voice möchte das ändern. Über die Sprachenseite des Projekts können Freiwillige Anfragen zu derzeit noch nicht unterstützten Sprachen einreichen und damit die Aufnahme ihrer Muttersprache initiieren.


Das könnte Sie auch interessieren