Распознавание речи в Python с помощью библиотеки SpeechRecognition

Распознавание речи в Python с помощью библиотеки SpeechRecognition

Распознавание речи в Python с помощью библиотеки SpeechRecognition

Всех с наступившим 2025 годом! В сегодняшней статье мы рассмотрим библиотеку speech_recognition в Python, которая позволяет легко интегрировать распознавание речи в ваши проекты. Это отличный инструмент для создания голосовых помощников, систем голосового ввода или просто забавных экспериментов с голосом.

Что такое SpeechRecognition?

SpeechRecognition — это популярная библиотека Python для работы с распознаванием речи. Она поддерживает несколько API, включая Google Speech Recognition, Wit.ai, IBM Watson и другие. Её легко использовать, и она обладает мощными функциями для преобразования речи в текст.

Установка

Перед началом работы установите библиотеку с помощью команды:

pip install SpeechRecognition



Для захвата аудио с микрофона вам также понадобится библиотека PyAudio. Установить её можно так:

pip install pyaudio



Если возникнут проблемы с установкой PyAudio, посетите [официальный репозиторий PyAudio для загрузки подходящих файлов.

Базовый пример

Давайте рассмотрим пример, который записывает речь с микрофона и преобразует её в текст с помощью API Google Speech Recognition:

import speech_recognition as sr



# Создаем объект распознавателя

recognizer = sr.Recognizer()



# Используем микрофон для записи

with sr.Microphone() as source:

    print("Скажите что-нибудь:")

    recognizer.adjust_for_ambient_noise(source)  # Настройка на шум

    audio = recognizer.listen(source, timeout=5)  # Запись звука



try:

    # Распознавание речи через Google API

    text = recognizer.recognize_google(audio, language="ru-RU")

    print(f"Вы сказали: {text}")

except sr.UnknownValueError:

    print("Не удалось распознать речь.")

except sr.RequestError as e:

    print(f"Ошибка сервиса: {e}")

Как это работает?

  1. Инициализация: Мы создаём объект Recognizer для работы с аудио.

  2. Запись звука: С помощью контекстного менеджера with sr.Microphone() захватывается речь с микрофона.

  3. Обработка шума: Метод adjust_for_ambient_noise помогает минимизировать влияние фонового шума.

  4. Распознавание: Метод recognize_google преобразует аудиозапись в текст.

Заключение

Таким образом, библиотека speech_recognition — мощный и простой инструмент для интеграции голосового управления в ваши проекты на Python. Она предоставляет гибкость и широкие возможности для экспериментов и серьёзных разработок.

Если вы хотите глубже изучить Python и его библиотеки, рекомендуем курс Программирование на Python с Нуля до Гуру.

Источник

НЕТ КОММЕНТАРИЕВ

Оставить комментарий