Otevřená společnost, komunity a data

Otevřená společenství, soukromý sektor, státní sektor, licence, otevřená data, Big Data

Mozilla Common Voice: Naučme počítače mluvenou češtinu

Přednáška | TRACK 3 | Neděle 14:00 - 14:45

Google Assistant, Alexa, Cortana… Hlasových asistentů je dnes celá řada, málokterý z nich je však otevřený, a to obzvláště v méně významných světových jazycích, jakým je například i čeština. Důvod pro to je jednoduchý - vytrénování spolehlivého systému pro rozpoznávání hlasu vyžaduje desítky až stovky hodin hlasových záznamů s přepisy, a za takováto data se platí. Právě zde vstupuje do obrazu projekt Mozilly nazvaný Common Voice, sbírající od dobrovolníků právě takováto data a zveřejňující je pod licencí CC0, tedy v podstatě jako volné dílo.

Otevřená společnost, komunity a data Mozilla strojové učení hlasový asistent rozpoznání hlasu
JindrichDite

Jindřich Dítě