Распознание текста с помощью ИИ и воспроизведение его в виде караоке.

Avatar
  • обновлен

Распознавание текста

Сбор данных: Получаем аудиофайл, с которого нужно распознать текст (например, речь или песню)+ИИ находит текст на просторах интренета. Далее добовляеться временные метки и идёт синхронизация текста для караоке.

Avatar
-1
drantop.

Как по мне, это лишняя морока. В любом случае фулл на нейронке этого не сделать, погрешность будет огромной. И так как нейронку сюда пихать просто бессмысленно, нет никакой нужды делать альтернативу Musixmatch, откуда Яндекс и берёт тексты.