Lyra (kodek)
Lyra je zvukový kodek vyvinutý společností Google, který je určen ke kompresi řeči. Využívá algoritmus založený na strojovém učení (ML), který pracuje s nižším datovým tokem.[1]
Vlastnosti
editovatLyra využívá ke kompresi řeči přístup založený na neuronových sítích, který umožňuje získat vysoce kvalitní zvuk při nízkém datovém toku. Kodek je navržen tak, aby byl vysoce efektivní a umožňoval komunikaci v reálném čase s minimální latencí.
Lyra podporuje tři různé konstantní datové toky: 3,2 kb/s, 6 kb/s a 9,2 kb/s.
Výhodou tohoto kodeku je, že se jedná o projekt s otevřeným zdrojovým kódem, což znamená, že je volně dostupný a kdokoliv jej může upravovat. Kodek je k dispozici pod licencí Apache 2.0, která umožňuje komerční i nekomerční použití.[1]
Kodek Lyra je také navržen tak, aby byl vysoce přenosný, s optimalizovanou implementací pro architektury ARM i x86. Kromě toho lze kodek používat ve spojení s dalšími komunikačními protokoly založenými na WebRTC.[2]
Způsob fungování
editovatZ řeči se extrahují charakteristické rysy, které jsou následně komprimovány pro přenos. Na druhé straně generativní model používá tyto funkce k rekonstrukci řeči.[3]
Historie
editovatPoprvé byl kodek Lyra oznámen společností Google v únoru roku 2021 jako experimentální kodek pro kompresi řeči při nízkém datovém toku. Vývoj kodeku vedl tým umělé inteligence společnosti Google s cílem zlepšit kvalitu hlasové komunikace v sítích s nízkou šířkou pásma.[2]
V dubnu 2021 společnost Google zveřejnila první verzi kodeku Lyra jako open-source projekt na serveru GitHub. Počáteční verze obsahovala předem natrénovaný model pro kódování a dekódování řeči při rychlosti 3 kb/s, který byl optimalizován pro použití ve WebRTC, protokolu pro komunikaci v reálném čase.
Roku 2022 byla vydaná Lyra V2 s novou architekturou založenou na kodeku SoundStream. Podporuje více platforem, má nižší latenci a generuje kvalitnější zvuk.[4]
Využití
editovatLyra kodek je navržen pro použití v komunikačních aplikacích v reálném čase, jako jsou videokonference (například ve spojení s AV1), online hry a hlasoví asistenti. [2]
Lyra je podporována v systémech Android, Linux, Mac i Windows.[1]
Odkazy
editovatReference
editovat- ↑ a b c GitHub - google/lyra: A Very Low-Bitrate Codec for Speech Compression. GitHub: Let’s build from here · GitHub [online]. Copyright © 2023 GitHub, Inc. Dostupné z: https://github.com/google/lyra
- ↑ a b c Lyra: A New Very Low-Bitrate Codec for Speech Compression – Google AI Blog. Google AI Blog [online]. Dostupné z: https://ai.googleblog.com/2021/02/lyra-new-very-low-bitrate-codec-for.html
- ↑ XDA: Google Duo uses a new codec for better call quality over poor connections [online]. Dostupné z: https://www.xda-developers.com/google-duo-lyra-codec-better-call-quality/
- ↑ Lyra V2 - a better, faster, and more versatile speech codec | Google Open Source Blog. Google Open Source Blog [online]. Dostupné z: https://opensource.googleblog.com/2022/09/lyra-v2-a-better-faster-and-more-versatile-speech-codec.html