
Создание простой системы распознавания речи с помощью DeepSpeech и Python
Шептание кода: как заставить машины слушать Распознавание речи кажется современным волшебством — вы говорите, а машины послушно транскрибируют ваши слова. Но вместо волшебных палочек у нас есть DeepSpeech — движок Mozilla с открытым исходным кодом для преобразования речи в текст, который превращает звуковые волны в читаемый текст. Давайте создадим систему, которая будет слушать внимательнее, чем моя собака, когда слышит, как открывают банку с лакомствами. Что внутри DeepSpeech DeepSpeech использует сквозное глубокое обучение для прямого преобразования аудио в текст, пропуская промежуточные представления, такие как фонемы....