Распознание текста с помощью ИИ и воспроизведение его в виде караоке.
Распознавание текста
Сбор данных: Получаем аудиофайл, с которого нужно распознать текст (например, речь или песню)+ИИ находит текст на просторах интренета. Далее добовляеться временные метки и идёт синхронизация текста для караоке.
Как по мне, это лишняя морока. В любом случае фулл на нейронке этого не сделать, погрешность будет огромной. И так как нейронку сюда пихать просто бессмысленно, нет никакой нужды делать альтернативу Musixmatch, откуда Яндекс и берёт тексты.