Сравнение: Наша модель vs Yandex SpeechKit
Одинаковые аудиофайлы, две системы транскрибации
Методология
- Пунктуация и заглавные буквы
- Числа цифрами (цены, телефоны)
- Разделение реплик по смыслу
- Разметка шумов [noise], [silence], [звук кассы]
- Адаптирована под аптечную лексику
- Сплошной поток без пунктуации
- Числа прописью
- Нижний регистр
- Нет разметки шумов
- Склеивание слов, смысловые ошибки
file_2026-01-29T14-17-15
Анапа, Владимирская, 114 · 2026-01-29 14:17:15
Диалог с клиентом: продажа Физама + консультация по спрею для горла
Форматирование
Наша модель — заглавные буквы, знаки препинания, логические предложения. Yandex — сплошной поток без структуры.
Фармацевтическая лексика
Наша модель чётко распознала: Физам, Ангидак, Тантум Верде, Гексорал. Yandex: «тантум верде сорала» вместо Гексорала — склеивание слов, смысловые ошибки.
Числа
Наша модель: цены цифрами (399, 493, 786). Yandex: числа прописью («триста девяносто девять») — невозможен автопарсинг.
Резюме
Наша модель выдаёт коммерчески пригодный текст. Yandex требует ручной редактуры — не подходит для бизнес-аналитики.
file_2026-01-29T14-22-15
Анапа, Владимирская, 114 · 2026-01-29 14:22:15
Продажа Эплеренона + фоновый разговор сотрудников о работе
Фармацевтическая лексика
Наша модель чётко распознала: Эплеренон, Спиро, Иплерон. Yandex: пропустил название «Эплеренон», заменив на «а а дозировка»; «Иплерон» → «и плерон».
Фоновые разговоры
Наша модель сработала как «умный» фильтр — сосредоточилась на диалоге с клиентом, минимизировала фоновый шум. Yandex: распознал фоновую речь сотрудников, смешав её с рабочим диалогом в нечитаемую кашу.
Смысловая связность
Наша модель сохраняет логику даже при нечёткой речи. Yandex: фонетические галлюцинации — «сухуми», «нож новый водитель» вместо «наш новый водитель».
Резюме
Наша модель адаптирована под бизнес-задачи: чистый текст, точные названия препаратов, отделение релевантного диалога от шума.